Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.46K photos
3.73K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
AVoCaDO: An AudioVisual Video Captioner Driven by Temporal Orchestration

Кэпшонер на базе Qwen2.5-Omni-7B, создает описание видео, учитывая как визуальную, так и аудиосоставляющую, синхронизируя их во времени

Код
HF

#captioning #VLM #video2text
👍111
EPG: Advancing End-to-End Pixel Space Generative Modeling via Self-supervised Pre-training

Новая #SOTA генератор картинок в пиксельном пространстве

первая успешная попытка обучить консистентную модель непосредственно на изображениях высокого разрешения без использования предварительно обученных VAE или диффузионных моделей.


Код ждем

#research #text2image
👍7🔥2
Говорят, VEO 3.1 сегодня выйдет

#news
👍6😱3
MAI-Image-1

Новый картинкогенератор от Microsoft

Сейчас на 9 месте на LMArena

Очевидно, умеет изображать текст.
Делают ставку на фотореализм и скорость:
MAI-Image-1 отлично подходит для создания фотореалистичных изображений, таких как освещение (например, отраженный свет, блики), пейзажи и многое другое. Это особенно важно по сравнению со многими более крупными и медленными моделями. Благодаря сочетанию скорости и качества пользователи могут быстрее отображать свои идеи на экране, быстро просматривать их, а затем переносить свою работу в другие инструменты для дальнейшей доработки.


Непонятно выдадут ли код или сервис, а пока пробуем на арене. Можно выбрать Direct Chat -> mai-image-1

#text2image
👍5
Veo 3.1 появился на wavespeed.ai и flowith.io

Увы, платно даже если есть триалка и какието кредиты

#news #text2video #image2video
👍2😐2