ComfyUI Wan2.2 Fun Native Support
Нативная поддержка Wan2.2-Fun (контролнет для видео) в #ComfyUI
+ поддержка Wan2.2 Fun InP - генерация видео от начального к конечному кадру
+поддержка LightX2V 4-Step LoRA
Ссылки на воркфлоу в статье
#controlnet #text2video #image2video #flf
Нативная поддержка Wan2.2-Fun (контролнет для видео) в #ComfyUI
+ поддержка Wan2.2 Fun InP - генерация видео от начального к конечному кадру
+поддержка LightX2V 4-Step LoRA
Ссылки на воркфлоу в статье
#controlnet #text2video #image2video #flf
🔥11👍4
GPT-OSS-120B on AMD MI300X
Не знаю зачем вам это, но вдруг кому-то нужно
Демоспейс GPT-OSS-120B от AMD
#assistant #chat
Не знаю зачем вам это, но вдруг кому-то нужно
Демоспейс GPT-OSS-120B от AMD
#assistant #chat
👍7😁7
Wan2.2-Fun-A14B-Control-GGUF
#gguf от QuantStack
Спасибо неизвестному подписчику
#wan22 #text2video #image2video
#gguf от QuantStack
Спасибо неизвестному подписчику
#wan22 #text2video #image2video
❤4👍3😁1
Media is too big
VIEW IN TELEGRAM
Hunyuan-GameCraft
"Игровой движок", о котором все писали в июне, вышел в опенсорс
Построен на базе на Hunyuan Video, в квантизированном виде запустится на 4090, но рилтайма на ней не ждите.
Гитхаб
HF
Демо ждем
#text2world #text2game
"Игровой движок", о котором все писали в июне, вышел в опенсорс
Построен на базе на Hunyuan Video, в квантизированном виде запустится на 4090, но рилтайма на ней не ждите.
Гитхаб
HF
Демо ждем
#text2world #text2game
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
VyvoTTS-LFM2-350M-Jenny
Новая голосовая модель. 350М параметров.
Говорит на английском. Но для дообучения на новый язык или на новый голос достаточно 6Gb VRAM. А для работы всего 2Gb
Авторы планируют выпустить еще несколько моделей, и на HF уже не только Jenny. Работают над поддержкой vLLM и другими фичами прежде чем полностью выпустить проект в опенсорс
#text2speech #tts #voicecloning
Новая голосовая модель. 350М параметров.
Говорит на английском. Но для дообучения на новый язык или на новый голос достаточно 6Gb VRAM. А для работы всего 2Gb
Авторы планируют выпустить еще несколько моделей, и на HF уже не только Jenny. Работают над поддержкой vLLM и другими фичами прежде чем полностью выпустить проект в опенсорс
#text2speech #tts #voicecloning
1👍16🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Higgsfield Draw-to-Video
У Higgsfield очередная обновка. Задаем промпт не текстом, а визуальными пометками на первом (и не только) кадре.
Работает с MiniMax, Veo 3 & Seedance Pro. За ваши деньги, разумеется.
#sketch2video #image2video #online
У Higgsfield очередная обновка. Задаем промпт не текстом, а визуальными пометками на первом (и не только) кадре.
Работает с MiniMax, Veo 3 & Seedance Pro. За ваши деньги, разумеется.
#sketch2video #image2video #online
👍16
Marco-Voice: A Unified Framework for Expressive Speech Synthesis with Voice Cloning
Кросс-лингвальный генератор речи с эмоциями и клонированием голоса от Alibaba.
Модель научили разделять идентичность говорящего и эмоциональную составляющую в отдельные потоки обработки.
Говорит по английски и китайски.
Гитхаб - послушать примеры можно там
#text2speech #tts #voicecloning
Кросс-лингвальный генератор речи с эмоциями и клонированием голоса от Alibaba.
Модель научили разделять идентичность говорящего и эмоциональную составляющую в отдельные потоки обработки.
Говорит по английски и китайски.
Гитхаб - послушать примеры можно там
#text2speech #tts #voicecloning
👍7❤2
Nano Banana
Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...
Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.
Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше
Спасибо @iNevestenko
#text2image #image2image #imageediting
Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...
Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.
Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше
Спасибо @iNevestenko
#text2image #image2image #imageediting
👍6🔥3
Skywork-UniPic
И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки
UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery
Умеет:
- генерация изображений по тексту
- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);
- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)
Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока
Гитхаб
Демо UniPic-1
Демо UniPic-2
#vlm #imageediting #text2image #image2image
И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки
UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery
Умеет:
- генерация изображений по тексту
- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);
- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)
Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока
Гитхаб
Демо UniPic-1
Демо UniPic-2
#vlm #imageediting #text2image #image2image
👍3👎3
Miromind
Полностью опенсорсный фреймворк для deepresearch, по приборам побивающий Opean AI
MiroThinker - набор моделей deepresearch
MiroTrain / MiroRL - микроструктура для обучения MiroThinker
MiroFlow - #sota агент умеющий пользоваться инструментами.
Я дал ему задание найти средний рост мужчин за последние 1000 лет. Выдал подробный результат за 1 минуту, см картинку
Попробовать
#deepresearch #assistant
Полностью опенсорсный фреймворк для deepresearch, по приборам побивающий Opean AI
MiroThinker - набор моделей deepresearch
MiroTrain / MiroRL - микроструктура для обучения MiroThinker
MiroFlow - #sota агент умеющий пользоваться инструментами.
Я дал ему задание найти средний рост мужчин за последние 1000 лет. Выдал подробный результат за 1 минуту, см картинку
Попробовать
#deepresearch #assistant
👍9
Media is too big
VIEW IN TELEGRAM
Раздача студенческих промокодов на ElevenLabs, Vercel, Bolt, Lovable, HeyGen, Hedra, Higgsfield и другие сервисы
В основном скидки. Но на сам ElevenLabs - целая подписка на 3 месяца. Но понадобится карточка Visa/Mastercard
1. Регаем временную студенческую почту здесь. Указываем домен imail.edu.vn.
2. На странице раздачи указываем эту почту, свой номер телефона. Мой обычный российский прокатил
3. Вводим пришедшие коды подтверждения телефона и почты
Промокодов ограниченное количество, может уже разобрали
Ну там еще и игра есть
#giveaway
В основном скидки. Но на сам ElevenLabs - целая подписка на 3 месяца. Но понадобится карточка Visa/Mastercard
1. Регаем временную студенческую почту здесь. Указываем домен imail.edu.vn.
2. На странице раздачи указываем эту почту, свой номер телефона. Мой обычный российский прокатил
3. Вводим пришедшие коды подтверждения телефона и почты
Промокодов ограниченное количество, может уже разобрали
Ну там еще и игра есть
#giveaway
👍8🔥2🥴1
Нейронавт | Нейросети в творчестве
Skywork-UniPic И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки UniPic-1 - авторегрессионная модель с нуля UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M…
А тут и Гигачат подтянулся с редактированием картинок. Ну и чего тянуть, я его затестил. Все что он смог - надеть на Форреста шлем. Скафандр - нивкакую. И лягушонка Пепе не знает
Но это бесплатно, быстро и прямо в телеграме
Пользуйтесь @gigachat_bot
#imageediting #bot
Но это бесплатно, быстро и прямо в телеграме
Пользуйтесь @gigachat_bot
#imageediting #bot
👎10👍4😐2🤷♂1🌚1