Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
AgenticSeek

Еще один агент, позиционируют себя как локальную опенсорсную альтернативу Manus на DeepSeek R1.
Без отправки данных в облако.

Для установки понадобятся ChromeDriver, Docker, Python 3.10

Гитхаб

#agent #desktop
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
WildGS-SLAM: Monocular Gaussian Splatting SLAM in Dynamic Environments

Реконструкция 3D сцен на гауссианах с удалением движущихся объектов.
На вход нужно монокулярное видео

Код

#gaussian
👍6🔥31
Heygen Avatar IV

Сервис Heygen запустил обновленную функцию оживления портретов.

Достаточно закинуть фото и текст.

А также создали MCP сервер

Доки
Гитхаб

#postrainanimation #lipsync #text2speech #tts #image2video #mcp
👍7🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
LAM: Large Avatar Model for One-shot Animatable Gaussian Head

Анимируемые аватары по одному изображению на гауссианах от Alibaba.

Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах

Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить

#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
👍5🤔21👎1
Подписчики в чате продолжают улучшать FramepackStudio

На сей раз прикрутили настройки teacache.

заменить studio.py в app\studio.py . interface.py в app\modules\interface.py

Файлы в комментариях

Спасибо @m_franz

#image2video #text2video
7👍1
This media is not supported in your browser
VIEW IN TELEGRAM
По совету подписчиков объявляю парад FramePack генераций. Хвастайтесь в комментариях что вам удалось выжать из этого генератора
👍111🔥1
Media is too big
VIEW IN TELEGRAM
HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation

Генерирует панорамные динамичные видео по тексту или по картинке, реконструируя 4D ассеты

Код

#image2scene #text2video #image2video #360 #panorama #4d #textto4d #imageto4d
👍6😱3
This media is not supported in your browser
VIEW IN TELEGRAM
FlexiAct: Towards Flexible Action Control in Heterogeneous Scenarios

Оживлятор персонажей по образцу движения от Tencent. Перенос движения на картинку.
На основе CogVideoX-5B

Код
Веса

#characteranimation #image2video #motion2video
👍71
This media is not supported in your browser
VIEW IN TELEGRAM
FramePack_with_Video_Input

Форк FramePack, принимающий на вход видео и продолжающий его.

На примере первые 3 секунды видео - исходник, дальше - генерация FramePack

Ветка на официальном FramePack

#videoextension #video2video
🔥21👍1👏1
Ace-Step Audio Model Native Support in ComfyUI

Оказывается, в комфи есть нативная поддержка ACE-Step (официальный вокфлоу)

А также Hidream E1 и Wan2.1 FLF2V FP8

Не хотел писать, ибо сворачивают на платные рельсы, но уж напишу. На днях они сменили логотип и объявили о поддержке API всего и вся: Flux, Hailuo, MiniMax, Kling, LumaLabsAI, PixVerse, recraft, StabilityAI, Google Veo2, ideogram, GPT image-1, Pika - всего 65 нод

#news #api #ComfyUI
👍7🤷‍♂1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Multiverse: The First AI Multiplayer World Model

Первая игровая модель с мультиплеером. Модель реагирует на действия двух игроков, управляющих гоночными автомобилями

Мы уже видели много версий генеративных игровых моделей для одного игрока. Тут же авторам пришлось решить задачу взаимодействия агентов в генеративном мире, это следующий уровень

Гитхаб
Веса

#gaming #multiplayer #realtime
👍7🔥3👏1🤮1
DreamO: A Unified Framework for Image Customization

Персонализатор-кастомизатор изображений от ByteDance на базе Flux

Kод
Демо
HF

#personalization #referenceing #tex2image
👍11🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь в ChatGPT DeepResearch может обрабатывать репозитории Github. Отличная новость с учетом того что 3 запроса в месяц в DeepResearch дают даже бесплатным пользователям.

#news #assistant #search
👍6😁2🔥1
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation

Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa

Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами

Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем

#text2video #image2video #audio2video #video2video #personalization #multisubject
👍71
Video Ocean

Проект Open Sora прокачался до коммерческого видеогенератора

Помимо обычного видео умеет создавать видео со звуком, а также картинки.
Ну и еще есть видеоэффекты

На бесплатном тарифе дают 240 токенов на месяц, этого хватит максимум на 8 видео 480p

720p и 1080p тоже есть, но разумеется дороже

#text2image #text2video #image2video
👍42