NEW BOT Телеграм, страница - 357956878

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

10.6K subscribers

4.46K photos

3.73K videos

41 files

4.76K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111

Download Telegram

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

10.6K subscribers

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Gemini 2.0

Гугл объявил эру агентов.
Мультимодальный ассистент

- в риалтайме понимает одновременно и аудио и видео
- можно стримить ему свой экран
- может общаться голосом
- выполняет сложные задачи
- ищет в интернете

И все это бесплатно. Россиян традиционно не любят. Добро пожаловать с неевропейского IP

Попробовать

#news #agent

👍6💯3

1.89K viewsedited 07:25

Нейронавт | Нейросети в творчестве

DiffSensei: Bridging Multi-Modal LLMs and Diffusion Models for Customized Manga Generation

Генератор манги (японских комиксов) на основе текстового описания и изображений персонажей.

Под капотом дообученный SDXL

- Создает мангу с несколькими персонажами, которые адаптируются к текстовому описанию
- Есть контроль расположения персонажей и диалогов на странице
- Сохраняет стиль и консистентность персонажей

Код

#text2image #comics

❤13

1.68K views07:49

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis

Генератор звука по видео или текстовому описанию

Код
Демо
Колаб

#video2audio #video2sound #text2audio

👍10❤1🔥1

2.17K views08:11

Нейронавт | Нейросети в творчестве

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Трумультимодальность.

До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini.

OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель.

Поглядите все видосики обязательно.
Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество.

А вот пример с газовой горелкой - просто отличный: "нарисуй то, что случится, когда горелка повернется".
Визуальная цепочка мыслей.
"Включи телевизор" - тоже неплохо.
Источник тут.
В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы.

И поднимите веки Midjourney кто-нибудь. Неприлично уже.

@cgevent

🔥14👍6❤1

1.11K views11:42

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

StableAnimator: High-Quality Identity-Preserving Human Image Animation

Очередной аниматор персонажа по фото и образцу движения, сохраняющий идентичность персонажа. Под капотом SVD

Код

#humananimation #characteranimation #image2video #pose2video

👍6🔥5❤1

1.7K views07:03

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

В трекере точек на видео TAPTR реализовали потоковый режим, позволяющий обрабатывать видео любой длины на RTX 3090

Демо TAPTRv3

#tracking

🔥9👍2❤1

1.47K views07:41

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

Метод заставить видеогенераторы делать одно и то же видео с двух и более ракурсов.
Ждем во всех видеогенрилках планеты

Код

#text2image #multiview

🔥15🤔2❤1

1.57K views08:11

Нейронавт | Нейросети в творчестве

Leffa: Learning Flow Fields in Attention for Controllable Person Image Generation

Модель от запрещенной Meta умеет переодевать и менять позу на изображении по образцу.

На позировании развернул девушку спиной, лох))

Гитхаб
Демо

#tryon #image2image #pose2image

👍6❤1🔥1

1.91K views08:43

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

nlf: Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation

Реконструкция позы человека по видео с одного ракурса, с фигурой но без одежды

Код

#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction

🔥13

1.84K views09:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Krea.ai Edit

Редактор изображений Krea.ai теперь доступен всем.

Инпейнтинг, аутпейнтинг, выделение/замена/удаление объектов. Все это удобно как в фотошопе и бесплатно (ограниченно)

#imageediting #inpainting #outpainting

👍5❤1

10.3K views11:44

Нейронавт | Нейросети в творчестве

StyleStudio: Text-Driven Style Transfer with Selective Control of Style Elements

Перенос стиля изображения. Насколько я понял, работает на базе SDXL, хотя можно прикрутить и к другим генераторам

Код
Демо

#styletransfer #text2image

❤7🤯2

1.68K views14:05

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Короткометражка созданная при помощи опенсорсных нейросеток.

Твиттер
Youtube - там подробная инструкция, в описании ссылки на бесплатный воркфлоу и более продвинутый платный

#video2video #tutorial

👍20❤2

3.55K views14:40

Нейронавт | Нейросети в творчестве

У Heygen генерилка подкастов, бета версия "для всех"

#text2poscast #speech2video

1.61K views15:35