NEW BOT Телеграм, страница

MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis

Генератор звука по видео или текстовому описанию

Код
Демо
Колаб

#video2audio #video2sound #text2audio

👍10❤1🔥1

2.17K views08:11

Нейронавт | Нейросети в творчестве

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

Трумультимодальность.

До вечернего стрима от OpenAI у нас, похоже, идет день Google и Gemini.

OpenAI ТОЧНО пора показать обновленный DALL·E 3, ибо смотрите, что творит Gemini. Причем творит сама по себе, без вызова всяких Imagen-ов - это трумултимодальная модель.

Поглядите все видосики обязательно.
Путешествия по картинкам меня до сих пор восхищают, типа поверни вправо и, особенно, отъедь назад. Хотя такое мы видели в последний месяц регулярно, особенно у видеогенераторов. Но тут повторюсь монолитный чат и хорошее качество.

А вот пример с газовой горелкой - просто отличный: "нарисуй то, что случится, когда горелка повернется".
Визуальная цепочка мыслей.
"Включи телевизор" - тоже неплохо.
Источник тут.
В общем, я прям жду, что ответит OpenAI, прежде чем делать мучительные выборы.

И поднимите веки Midjourney кто-нибудь. Неприлично уже.

@cgevent

🔥14👍6❤1

1.11K views11:42

Нейронавт | Нейросети в творчестве

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

StableAnimator: High-Quality Identity-Preserving Human Image Animation

Очередной аниматор персонажа по фото и образцу движения, сохраняющий идентичность персонажа. Под капотом SVD

Код

#humananimation #characteranimation #image2video #pose2video

👍6🔥5❤1

1.7K views07:03

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

В трекере точек на видео TAPTR реализовали потоковый режим, позволяющий обрабатывать видео любой длины на RTX 3090

Демо TAPTRv3

#tracking

🔥9👍2❤1

1.47K views07:41

Нейронавт | Нейросети в творчестве

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

Метод заставить видеогенераторы делать одно и то же видео с двух и более ракурсов.
Ждем во всех видеогенрилках планеты

Код

#text2image #multiview

🔥15🤔2❤1

1.57K views08:11

Нейронавт | Нейросети в творчестве

Leffa: Learning Flow Fields in Attention for Controllable Person Image Generation

Модель от запрещенной Meta умеет переодевать и менять позу на изображении по образцу.

На позировании развернул девушку спиной, лох))

Гитхаб
Демо

#tryon #image2image #pose2image

👍6❤1🔥1

1.91K views08:43

Нейронавт | Нейросети в творчестве

0:46

Media is too big

VIEW IN TELEGRAM

nlf: Neural Localizer Fields for Continuous 3D Human Pose and Shape Estimation

Реконструкция позы человека по видео с одного ракурса, с фигурой но без одежды

Код

#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction

🔥13

1.84K views09:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Krea.ai Edit

Редактор изображений Krea.ai теперь доступен всем.

Инпейнтинг, аутпейнтинг, выделение/замена/удаление объектов. Все это удобно как в фотошопе и бесплатно (ограниченно)

#imageediting #inpainting #outpainting

👍5❤1

10.3K views11:44

Нейронавт | Нейросети в творчестве

StyleStudio: Text-Driven Style Transfer with Selective Control of Style Elements

Перенос стиля изображения. Насколько я понял, работает на базе SDXL, хотя можно прикрутить и к другим генераторам

Код
Демо

#styletransfer #text2image

❤7🤯2

1.68K views14:05

Нейронавт | Нейросети в творчестве

0:48

This media is not supported in your browser

VIEW IN TELEGRAM

Короткометражка созданная при помощи опенсорсных нейросеток.

Твиттер
Youtube - там подробная инструкция, в описании ссылки на бесплатный воркфлоу и более продвинутый платный

#video2video #tutorial

👍20❤2

3.55K views14:40

Нейронавт | Нейросети в творчестве

У Heygen генерилка подкастов, бета версия "для всех"

#text2poscast #speech2video

1.61K views15:35

Нейронавт | Нейросети в творчестве

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:50

This media is not supported in your browser

VIEW IN TELEGRAM

Ну, за подкасты.
Не очень понятно зачем теперь нужны кожаные блогеры, влогеры, инфлюматьихенсеры.

Я тут смотрел, как народ упарывается в NotebokLM, создавая аудио-подкаст из текста, потом вырезает в аудасити звук для каждого голоса, потом огородит с хейгеном и звуком, и тд.

Все.

Одна кнопка.
Сделать красиво.
Тупо, но красиво.
А зачем еще это все?

Хейген, похоже, сами не понимают, как они троллят интернет.

@cgevent

🔥10❤1👍1🤯1

1.2K views15:35

Нейронавт | Нейросети в творчестве

1:31

This media is not supported in your browser

VIEW IN TELEGRAM

GigaChat песни

Вы не поверите, но GigaChat теперь умеет создавать песни подобно Suno/Udio.
Правда, пока только в ВК. в телеграм завезут позже

Качество как всегда отстает от мировых лидеров. Но это вопрос времени.
Длина трека - полторы минуты, а текст пишет на целую песню

#text2music

😁9👍5😈2👎1🥴1

2.29K views19:04

About

Blog

Apps

Platform