Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Pyramidal Flow Matching for Efficient Video Generative Modeling

На днях вышел новый опенсорсный видеогенератор по тексту и по изображению.
Разрешение 1280x768
От идеала далеко. Но эй, в опенсорсе и конкурентов негусто.
А авторы еще и обещают скоро выложить код обучения и новые с нуля обученные чекпойнты

Код
Демо
Веса

#text2video #image2video
13😁1
Из прочих новостей

Suno теперь умеет делать музыку из ваших картинок и видео. Но пока только в iOS приложении которое есть только в американском аппсторе

Pika вчера добавила новые эффекты в дополнение к тем которые завирусились на прошлой неделе (мне о них некогда было писать). Сами по себе такие эффекты мне представляются бесполезными, сфера применения очень узкая. Но посмотрим насколько у юзеров хватит выдумки. Видимо, на это и ставка. Как бы то ни было, Pika таким ходом отнишевалась от конкурентов

#news #image2music #video2music #image2video #image2effect
👍42
This media is not supported in your browser
VIEW IN TELEGRAM
D-Edit

Редактор изображений - на основе изображений, текста, масок и удаление элементов. Примеры с сайта кину в комменты

Все это через автоматическую сегментацию - вот и первое неудобство. Если что-то не попало в отдельный сегмент то и редактировать это отдельно мы не сможем. Ну ладно, сегментатор наверно можно прикрутить любой.

В демо кажется реализовано только редактирование текстом. Но редактор в отличие от аналогов учитывает контекст картинки. По крайней мере так заявлено в препринте

Демо

#imageediting #inpainting #image2image
🔥4
Vision Arena

Лидерборд-арену визуально-языковых моделей не хотите ли?

#vlm #leaderboard #comparison #shootout
4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
В Krea.ai прикрутили все наши любимые видеогенераторы. При написании промпта можно выбрать выбрать, в чем продолжить генерацию: Luma, Runway, Kling, Minimax, Pika

#news #image2video
🤯8👍41
This media is not supported in your browser
VIEW IN TELEGRAM
GS^3: Efficient Relighting with Triple Gaussian Splatting

Релайтинг сцен на гауссианах.
На вход набор изображений. На выходе рендер с заданным освещением.

Код

#relighting #gaussian
🔥3👍2🤯1
ChatGPT (Early Version for Plus, Team, Enterprise, and Edu)

Open AI разродились приложением под Wndows.

Устанавливается из американского Microsoft Store и работает только для платных подписчиков. Мне не показывает даже кнопку установить.
Впрочем ходит слух что для некоторых бесплатных тоже работает. Но я бы на это не рассчитывал.

Установить

#news #assistant
🔥31
VidPanos: Generative Panoramic Videos from Casual Panning Videos

Google DeepMind придумал делать из ваших с рук снятых видео панорамные видео, зацените технологию.

Код ждем

#video2video #paniramicvideo
7
Там, где растут роботы

Первый в истории оригинальный ИИ-полный метр и первый релиз AiMation Studios


Над созданием фильма трудилась команда с костяком из 9 человек. Фильм обошёлся всего в 8000 долларов за минуту — беспрецедентная цифра для профессионально анимированного полнометражного фильма. Для сравнения: малобюджетная телевизионная анимация, созданная зарубежными студиями, стоит от 10 000 до 20 000 долларов за минуту, и она далеко не так хороша, как «Там, где растут роботы».

Хоть на форбсе и пишут что он полностью сделан с применением ИИ-инструментов, это не значит что абсолютно все сгенерировано нейросетками. Тут явно есть 3D композный софт.

Кто не побрезгует посмотреть - поделитесь впечатлениями!

#news #кино
👍43🤯1
Janus

Мультимодальная модель от DeepSeek.
Текст и картинки.

Модель компактная, основана на DeepSeek-LLM-1.3b-base

Гитхаб
Веса на HF

#VLM #assistant #multimodal #text2image #image2text
👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
DepthCrafter ComfyUI

Ноды генератора глубины DepthCrafter

Можете создавать видео с картой глубины на основе любого входного видео

Для рендеринга длинных видео в высоком разрешении (768p и выше) требуется довольно большой объем видеопамяти (>16 ГБ). При меньшем разрешении и более коротких видео будет использоваться меньше видеопамяти. Вы также можете сократить значение context_window для экономии видеопамяти.

Эта модель глубины хорошо сочетается с пакетом Depthflow для создания последовательной анимации глубины

#comfyUI #video2depth
9🔥2
Мемы есть на злобу дня? а если найду?

#humor
😁20👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Робот-манипулятор MAiRA отдает указания жалким людишкам дирижирует Дрезденским симфоническим оркестром.

#news
😁14🤡5