Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
HunyuanWorld-Mirror

В полку генераторов-реконструкторов объемных сцен от Hunyuan-Tencent прибыло.
Говорю так потому что его определили в одно семейство с генераторами 3D миров

Воссоздает 3D сцены по видео, в том числе сгенерированным, мультиракурсным наборам изображений, и по одному изображению

За один проход создает сразу облако точек, многовидовые карты глубины, параметры камеры, нормали поверхности, сцену на гауссианах.

Код
Демо - очень шустрое. Сделал тест по одной картинке. Лучше все-таки иметь несколько ракурсов
HF ~5 ГБ

#videoto3d #video2scene #gaussian #imageto3d #image2scene #video2gaussian #video2normal #video2depth #image2normal #image2depth
🔥5👎1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Ищем AI/CGI/VFX креаторов или команду для создания реалистичных роликов (реальная съемка + ИИ / 3D элементы)

Оплата: 50-200.000 рублей в месяц (зависит от объема роликов)

Есть оплачиваемое тестовое задание

Требования:
Опыт создания аналогичных реалистичных проектов

Что имеем в виду под реалистичностью?

Не подходит: Полностью сгенерированные все предметы и части ролика, не имеющие отношения к реальным объектам

Подходит: реально отснятые люди (или их реалистичные генеративные копии), реально отснятые предметы (или их генеративные/3D копии) с ИИ-элементами

Пример: реальная девушка (отснятая в студии) взаимодействует с сгенерированным/смоделированным роботом, действие реалистично, ее внешность сохраняется

Прайс и примеры только реалистичных работ присылайте сюда: @dariatareva

P.S. Пожалуйста, не отправляйте ВСЁ портфолио, будем рассматривать тех, кто направил релевантные по ТЗ выше ролики

#вакансия
2👍2🥴2🌚2
MoGA: Mixture-of-Groups Attention for End-to-End Long Video Generation

Это еще один способ генерации длинных видео от ByteDance

Создает многоплановое монтажное видео в формате 480p, 24 фпс, хронометраж до минуты, с контекстом 580К токенов

Интегрируется с современными механизмами внимания, например, FlashAttention, и поддерживает распараллеливание

Умеет в генерацию видео с несколькими сюжетными отрезками и может управлять сценами с помощью текстовых описаний на уровне каждого отрезка

Согласованность персонажей и фона, бла-бла-бла

В качестве базовой модели используются Wan2.1 (1.3B и 14B) и MMDiT.

Код / веса ждем

#text2video #image2video
👍122
Qwen3-VL-2B и Qwen3-VL-32B

Qwen забрасывает нас обновками.

Qwen3-VL-32B превосходит GPT-5 mini и Claude 4 Sonnet по производительности в STEM, VQA, распознавании текста, понимании видео, задачах агентов и многом другом.

Всего в 32B параметров, на уровне моделей с 235B (даже превосходя их в OSWorld!)

Доступны версии FP8
Доступны варианты Instruct и Thinking

Чат
HF
API

#vlm
🔥141👍1
ComfyUI 0.3.66

В версии ComfyUI 0.3.66 два основных обновления:

1. Панель параметров подграфа (Subgraph Parameter Panel). Теперь можно редактировать виджеты, не заходя внутрь подграфов.


2. Переработанная библиотека шаблонов (Template Library). Обновлённый интерфейс позволяет быстрее находить нужные шаблоны благодаря множеству фильтров. Теперь доступны следующие способы фильтрации и сортировки:

- по модели
- по варианту использования
- по лицензии (бесплатная или платная)
- сортировка по новизне, умолчанию, размеру модели, по алфавиту

Сортировка по VRAM пока поддерживается не полностью, но в ближайшее время эта функция будет обновлена.

#ComfyUI
11🍾3
Media is too big
VIEW IN TELEGRAM
UltraGen: High-Resolution Video Generation with Hierarchical Attention

Видеогенератор 4K, масштабирует предварительно обученные модели с низким разрешением/

В исследовании масштабировали Wan-T2V-1.3B

Кода нет, так чисто посмотреть

#text2video #research
👍4👀4
This media is not supported in your browser
VIEW IN TELEGRAM
Suno.ai V4.5

Выдали всем бесплатно, по несколько генераций в день

Бонусом еще два минутных трека на v5

#news #text2music
👍122
This media is not supported in your browser
VIEW IN TELEGRAM
Video-As-Prompt: Unified Semantic Control for Video Generation

Видеогенератор использует видео как пропмт, создавая видео, семантически согласованные с референсами

— создаёт видео с одинаковой семантикой при разных референсных видео и одинаковых изображениях

— переносит семантику (концепцию, стиль, движение, ракурс камеры) с референсного видео на разные изображения

— сохраняет семантику и идентичность при корректировке мелких атрибутов с помощью промпта

— генерирует видео с определёнными концепциями

— создаёт видео в заданном стиле

— воспроизводит заданные движения и стили танца

— имитирует различные движения камеры, включая сложные, вроде дolly zoom (эффекта Хичкока)

Код
HF - прикрутили к WAN2.114B и CogVideox-5B

#referencing #text2video #video2video
👍63🔥2
Media is too big
VIEW IN TELEGRAM
Stable Video Infinity: Infinite-Length Video Generation with Error Recycling

И еще один костыль для увеличения сами знаете чего - хронометража генерируемого видео

SVI создает видео любой длины с высокой временной согласованностью, правдоподобными переходами между сценами и управляемыми сюжетными линиями

Базовая модель — Wan 2.1 14B

Ждем версию Wan 2.2-5B-SVI

Код
HF

спасибо @m_franz

#longvideo #text2video #image2video
👍14
BoldVoice Accent Oracle

Онлайн определятор акцента в английском языке.

Давно не говорил на ангельском, у меня явный русский акцент

Сможете обмануть его?

#misc #online #speech
😁8👍3🤯1
Закинул видео своего медведя на реконструкцию в HunyuanWorld-Mirror по 24 отобранным кадрам

Гауссова сцена далека от идеала, на меш интереснее смотреть. Надо увеличивать количество ракурсов.

Закину гауссианы и меш в комменты для интересующихся

#videoto3d #video2scene #gaussian #imageto3d #image2scene #video2gaussian #video2normal #video2depth #image2normal #image2depth
4👍1