Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
DiffSensei: Bridging Multi-Modal LLMs and Diffusion Models for Customized Manga Generation

Генератор манги (японских комиксов) на основе текстового описания и изображений персонажей.

Под капотом дообученный SDXL

- Создает мангу с несколькими персонажами, которые адаптируются к текстовому описанию
- Есть контроль расположения персонажей и диалогов на странице
- Сохраняет стиль и консистентность персонажей

Код

#text2image #comics
13
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Трумультимодальность.

До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini.

OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель.

Поглядите все видосики обязательно.
Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество.

А вот пример с газовой горелкой - просто отличный: "нарисуй то, что случится, когда горелка повернется".
Визуальная цепочка мыслей.
"Включи телевизор" - тоже неплохо.
Источник тут.
В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы.

И поднимите веки Midjourney кто-нибудь. Неприлично уже.

@cgevent
🔥14👍61
This media is not supported in your browser
VIEW IN TELEGRAM
В трекере точек на видео TAPTR реализовали потоковый режим, позволяющий обрабатывать видео любой длины на RTX 3090

Демо TAPTRv3

#tracking
🔥9👍21
This media is not supported in your browser
VIEW IN TELEGRAM
SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

Метод заставить видеогенераторы делать одно и то же видео с двух и более ракурсов.
Ждем во всех видеогенрилках планеты

Код

#text2image #multiview
🔥15🤔21
Leffa: Learning Flow Fields in Attention for Controllable Person Image Generation

Модель от запрещенной Meta умеет переодевать и менять позу на изображении по образцу.

На позировании развернул девушку спиной, лох))

Гитхаб
Демо

#tryon #image2image #pose2image
👍61🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Krea.ai Edit

Редактор изображений Krea.ai теперь доступен всем.

Инпейнтинг, аутпейнтинг, выделение/замена/удаление объектов. Все это удобно как в фотошопе и бесплатно (ограниченно)

#imageediting #inpainting #outpainting
👍51
StyleStudio: Text-Driven Style Transfer with Selective Control of Style Elements

Перенос стиля изображения. Насколько я понял, работает на базе SDXL, хотя можно прикрутить и к другим генераторам

Код
Демо

#styletransfer #text2image
7🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
Короткометражка созданная при помощи опенсорсных нейросеток.

Твиттер
Youtube - там подробная инструкция, в описании ссылки на бесплатный воркфлоу и более продвинутый платный

#video2video #tutorial
👍202
У Heygen генерилка подкастов, бета версия "для всех"

#text2poscast #speech2video
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну, за подкасты.
Не очень понятно зачем теперь нужны кожаные блогеры, влогеры, инфлюматьихенсеры.

Я тут смотрел, как народ упарывается в NotebokLM, создавая аудио-подкаст из текста, потом вырезает в аудасити звук для каждого голоса, потом огородит с хейгеном и звуком, и тд.

Все.

Одна кнопка.
Сделать красиво.
Тупо, но красиво.
А зачем еще это все?

Хейген, похоже, сами не понимают, как они троллят интернет.

@cgevent
🔥101👍1🤯1