Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
ACE-Step: A Step Towards Music Generation Foundation Model

Генератор музыки в опенсорсе, базовая модель, пригодная для дальнейшего файнтюна.

Мультиязычный, есть русский!
Помимо собственно генерации музыки по тексту, умеет делать вариации, смену пола вокалиста, замену слов, замену музыкальных фрагментов.

Обещают лоры с контролнетами, генерацию стемов (отдельных партий), вокал по готовому аккомпанементу

Звучит пока не очень, надеемся на пластичность в файнтюне

Код
Демо
Веса

#music #text2music #musicediting
👍11👌1
This media is not supported in your browser
VIEW IN TELEGRAM
LTX VIDEO-13B

Выложили веса модели видеогенератора с 13B параметров
ltxv-13b-0.9.7-dev и
ltxv-13b-0.9.7-dev-fp8
FP8 должен завестись на 4090

HF
Гитхаб
ComfyUI
Попробовать на офсайте - притворитесь что вы не в РФ

#text2video #image2video
🔥91
This media is not supported in your browser
VIEW IN TELEGRAM
Insert Anything: Image Insertion via In-Context Editing in DiT

Короче еще один инпейнтинг персонализатор.
Показываем одной картинкой что вставить, на другой - куда вставить

Под капотом FLUX.1-Fill-dev и FLUX.1-Redux-dev

Код
Демо
ComfyUI

#inpainting #personalization #imageediting
👍10😁2🔥1
Cursor Pro за фото студенческого билета.

Раздают подписку Cursor Pro студентам на год.
Говорят, заявки из России тоже принимают.

#coding #gift
🔥13
This media is not supported in your browser
VIEW IN TELEGRAM
Computer Agent

Агент, аналог Operator

Работает в песочнице

Под капотом
smolagents
Qwen2-VL-72B
E2B Desktop

Демо

#agent #browser
5🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
AgenticSeek

Еще один агент, позиционируют себя как локальную опенсорсную альтернативу Manus на DeepSeek R1.
Без отправки данных в облако.

Для установки понадобятся ChromeDriver, Docker, Python 3.10

Гитхаб

#agent #desktop
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
WildGS-SLAM: Monocular Gaussian Splatting SLAM in Dynamic Environments

Реконструкция 3D сцен на гауссианах с удалением движущихся объектов.
На вход нужно монокулярное видео

Код

#gaussian
👍6🔥31
Heygen Avatar IV

Сервис Heygen запустил обновленную функцию оживления портретов.

Достаточно закинуть фото и текст.

А также создали MCP сервер

Доки
Гитхаб

#postrainanimation #lipsync #text2speech #tts #image2video #mcp
👍7🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
LAM: Large Avatar Model for One-shot Animatable Gaussian Head

Анимируемые аватары по одному изображению на гауссианах от Alibaba.

Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах

Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить

#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
👍5🤔21👎1
Подписчики в чате продолжают улучшать FramepackStudio

На сей раз прикрутили настройки teacache.

заменить studio.py в app\studio.py . interface.py в app\modules\interface.py

Файлы в комментариях

Спасибо @m_franz

#image2video #text2video
7👍1
This media is not supported in your browser
VIEW IN TELEGRAM
По совету подписчиков объявляю парад FramePack генераций. Хвастайтесь в комментариях что вам удалось выжать из этого генератора
👍111🔥1
Media is too big
VIEW IN TELEGRAM
HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation

Генерирует панорамные динамичные видео по тексту или по картинке, реконструируя 4D ассеты

Код

#image2scene #text2video #image2video #360 #panorama #4d #textto4d #imageto4d
👍6😱3
This media is not supported in your browser
VIEW IN TELEGRAM
FlexiAct: Towards Flexible Action Control in Heterogeneous Scenarios

Оживлятор персонажей по образцу движения от Tencent. Перенос движения на картинку.
На основе CogVideoX-5B

Код
Веса

#characteranimation #image2video #motion2video
👍71
This media is not supported in your browser
VIEW IN TELEGRAM
FramePack_with_Video_Input

Форк FramePack, принимающий на вход видео и продолжающий его.

На примере первые 3 секунды видео - исходник, дальше - генерация FramePack

Ветка на официальном FramePack

#videoextension #video2video
🔥21👍1👏1
Ace-Step Audio Model Native Support in ComfyUI

Оказывается, в комфи есть нативная поддержка ACE-Step (официальный вокфлоу)

А также Hidream E1 и Wan2.1 FLF2V FP8

Не хотел писать, ибо сворачивают на платные рельсы, но уж напишу. На днях они сменили логотип и объявили о поддержке API всего и вся: Flux, Hailuo, MiniMax, Kling, LumaLabsAI, PixVerse, recraft, StabilityAI, Google Veo2, ideogram, GPT image-1, Pika - всего 65 нод

#news #api #ComfyUI
👍7🤷‍♂1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Multiverse: The First AI Multiplayer World Model

Первая игровая модель с мультиплеером. Модель реагирует на действия двух игроков, управляющих гоночными автомобилями

Мы уже видели много версий генеративных игровых моделей для одного игрока. Тут же авторам пришлось решить задачу взаимодействия агентов в генеративном мире, это следующий уровень

Гитхаб
Веса

#gaming #multiplayer #realtime
👍7🔥3👏1🤮1
DreamO: A Unified Framework for Image Customization

Персонализатор-кастомизатор изображений от ByteDance на базе Flux

Kод
Демо
HF

#personalization #referenceing #tex2image
👍11🔥1