This media is not supported in your browser
VIEW IN TELEGRAM
ACE-Step: A Step Towards Music Generation Foundation Model
Генератор музыки в опенсорсе, базовая модель, пригодная для дальнейшего файнтюна.
Мультиязычный, есть русский!
Помимо собственно генерации музыки по тексту, умеет делать вариации, смену пола вокалиста, замену слов, замену музыкальных фрагментов.
Обещают лоры с контролнетами, генерацию стемов (отдельных партий), вокал по готовому аккомпанементу
Звучит пока не очень, надеемся на пластичность в файнтюне
Код
Демо
Веса
#music #text2music #musicediting
Генератор музыки в опенсорсе, базовая модель, пригодная для дальнейшего файнтюна.
Мультиязычный, есть русский!
Помимо собственно генерации музыки по тексту, умеет делать вариации, смену пола вокалиста, замену слов, замену музыкальных фрагментов.
Обещают лоры с контролнетами, генерацию стемов (отдельных партий), вокал по готовому аккомпанементу
Звучит пока не очень, надеемся на пластичность в файнтюне
Код
Демо
Веса
#music #text2music #musicediting
👍11👌1
This media is not supported in your browser
VIEW IN TELEGRAM
LTX VIDEO-13B
Выложили веса модели видеогенератора с 13B параметров
ltxv-13b-0.9.7-dev и
ltxv-13b-0.9.7-dev-fp8
FP8 должен завестись на 4090
HF
Гитхаб
ComfyUI
Попробовать на офсайте - притворитесь что вы не в РФ
#text2video #image2video
Выложили веса модели видеогенератора с 13B параметров
ltxv-13b-0.9.7-dev и
ltxv-13b-0.9.7-dev-fp8
FP8 должен завестись на 4090
HF
Гитхаб
ComfyUI
Попробовать на офсайте - притворитесь что вы не в РФ
#text2video #image2video
🔥9❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Insert Anything: Image Insertion via In-Context Editing in DiT
Короче еще один инпейнтинг персонализатор.
Показываем одной картинкой что вставить, на другой - куда вставить
Под капотом FLUX.1-Fill-dev и FLUX.1-Redux-dev
Код
Демо
ComfyUI
#inpainting #personalization #imageediting
Короче еще один инпейнтинг персонализатор.
Показываем одной картинкой что вставить, на другой - куда вставить
Под капотом FLUX.1-Fill-dev и FLUX.1-Redux-dev
Код
Демо
ComfyUI
#inpainting #personalization #imageediting
👍10😁2🔥1
Cursor Pro за фото студенческого билета.
Раздают подписку Cursor Pro студентам на год.
Говорят, заявки из России тоже принимают.
#coding #gift
Раздают подписку Cursor Pro студентам на год.
Говорят, заявки из России тоже принимают.
#coding #gift
🔥13
This media is not supported in your browser
VIEW IN TELEGRAM
Computer Agent
Агент, аналог Operator
Работает в песочнице
Под капотом
smolagents
Qwen2-VL-72B
E2B Desktop
Демо
#agent #browser
Агент, аналог Operator
Работает в песочнице
Под капотом
smolagents
Qwen2-VL-72B
E2B Desktop
Демо
#agent #browser
❤5🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
AgenticSeek
Еще один агент, позиционируют себя как локальную опенсорсную альтернативу Manus на DeepSeek R1.
Без отправки данных в облако.
Для установки понадобятся ChromeDriver, Docker, Python 3.10
Гитхаб
#agent #desktop
Еще один агент, позиционируют себя как локальную опенсорсную альтернативу Manus на DeepSeek R1.
Без отправки данных в облако.
Для установки понадобятся ChromeDriver, Docker, Python 3.10
Гитхаб
#agent #desktop
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
WildGS-SLAM: Monocular Gaussian Splatting SLAM in Dynamic Environments
Реконструкция 3D сцен на гауссианах с удалением движущихся объектов.
На вход нужно монокулярное видео
Код
#gaussian
Реконструкция 3D сцен на гауссианах с удалением движущихся объектов.
На вход нужно монокулярное видео
Код
#gaussian
👍6🔥3❤1
Heygen Avatar IV
Сервис Heygen запустил обновленную функцию оживления портретов.
Достаточно закинуть фото и текст.
А также создали MCP сервер
Доки
Гитхаб
#postrainanimation #lipsync #text2speech #tts #image2video #mcp
Сервис Heygen запустил обновленную функцию оживления портретов.
Достаточно закинуть фото и текст.
А также создали MCP сервер
Доки
Гитхаб
#postrainanimation #lipsync #text2speech #tts #image2video #mcp
👍7🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
LAM: Large Avatar Model for One-shot Animatable Gaussian Head
Анимируемые аватары по одному изображению на гауссианах от Alibaba.
Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах
Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить
#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
Анимируемые аватары по одному изображению на гауссианах от Alibaba.
Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах
Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить
#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
👍5🤔2❤1👎1
Подписчики в чате продолжают улучшать FramepackStudio
На сей раз прикрутили настройки teacache.
Файлы в комментариях
Спасибо @m_franz
#image2video #text2video
На сей раз прикрутили настройки teacache.
заменить studio.py в app\studio.py . interface.py в app\modules\interface.py
Файлы в комментариях
Спасибо @m_franz
#image2video #text2video
❤7👍1
This media is not supported in your browser
VIEW IN TELEGRAM
По совету подписчиков объявляю парад FramePack генераций. Хвастайтесь в комментариях что вам удалось выжать из этого генератора
👍11❤1🔥1
Media is too big
VIEW IN TELEGRAM
HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation
Генерирует панорамные динамичные видео по тексту или по картинке, реконструируя 4D ассеты
Код
#image2scene #text2video #image2video #360 #panorama #4d #textto4d #imageto4d
Генерирует панорамные динамичные видео по тексту или по картинке, реконструируя 4D ассеты
Код
#image2scene #text2video #image2video #360 #panorama #4d #textto4d #imageto4d
👍6😱3
This media is not supported in your browser
VIEW IN TELEGRAM
FlexiAct: Towards Flexible Action Control in Heterogeneous Scenarios
Оживлятор персонажей по образцу движения от Tencent. Перенос движения на картинку.
На основе CogVideoX-5B
Код
Веса
#characteranimation #image2video #motion2video
Оживлятор персонажей по образцу движения от Tencent. Перенос движения на картинку.
На основе CogVideoX-5B
Код
Веса
#characteranimation #image2video #motion2video
👍7❤1
This media is not supported in your browser
VIEW IN TELEGRAM
FramePack_with_Video_Input
Форк FramePack, принимающий на вход видео и продолжающий его.
На примере первые 3 секунды видео - исходник, дальше - генерация FramePack
Ветка на официальном FramePack
#videoextension #video2video
Форк FramePack, принимающий на вход видео и продолжающий его.
На примере первые 3 секунды видео - исходник, дальше - генерация FramePack
Ветка на официальном FramePack
#videoextension #video2video
🔥21👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
А вот вам и воркфлоу генератора музыки ACE-Step
workflow
#music #text2music #musicediting #comfyui #workflow
workflow
#music #text2music #musicediting #comfyui #workflow
🔥12👍5❤1👏1
Ace-Step Audio Model Native Support in ComfyUI
Оказывается, в комфи есть нативная поддержка ACE-Step (официальный вокфлоу)
А также Hidream E1 и Wan2.1 FLF2V FP8
Не хотел писать, ибо сворачивают на платные рельсы, но уж напишу. На днях они сменили логотип и объявили о поддержке API всего и вся: Flux, Hailuo, MiniMax, Kling, LumaLabsAI, PixVerse, recraft, StabilityAI, Google Veo2, ideogram, GPT image-1, Pika - всего 65 нод
#news #api #ComfyUI
Оказывается, в комфи есть нативная поддержка ACE-Step (официальный вокфлоу)
А также Hidream E1 и Wan2.1 FLF2V FP8
Не хотел писать, ибо сворачивают на платные рельсы, но уж напишу. На днях они сменили логотип и объявили о поддержке API всего и вся: Flux, Hailuo, MiniMax, Kling, LumaLabsAI, PixVerse, recraft, StabilityAI, Google Veo2, ideogram, GPT image-1, Pika - всего 65 нод
#news #api #ComfyUI
👍7🤷♂1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Multiverse: The First AI Multiplayer World Model
Первая игровая модель с мультиплеером. Модель реагирует на действия двух игроков, управляющих гоночными автомобилями
Мы уже видели много версий генеративных игровых моделей для одного игрока. Тут же авторам пришлось решить задачу взаимодействия агентов в генеративном мире, это следующий уровень
Гитхаб
Веса
#gaming #multiplayer #realtime
Первая игровая модель с мультиплеером. Модель реагирует на действия двух игроков, управляющих гоночными автомобилями
Мы уже видели много версий генеративных игровых моделей для одного игрока. Тут же авторам пришлось решить задачу взаимодействия агентов в генеративном мире, это следующий уровень
Гитхаб
Веса
#gaming #multiplayer #realtime
👍7🔥3👏1🤮1
DreamO: A Unified Framework for Image Customization
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
👍11🔥1