This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
LongCat-Video-Avatar
Генератор на базе LongCat-Video создаёт реалистичные длительные видеоролики с липсинком и сохранением идентичности персонажа
Генерирует видео на основе аудио и текста или аудио, текста и изображения
Умеет петь, продлять видео, делать мультидиалог, видеоподкасты, продающие видео
Гитхаб
HF
MS
#ati2v #at2v #avatar #longvideo #characteranimation #speech2animation #image2video
Генератор на базе LongCat-Video создаёт реалистичные длительные видеоролики с липсинком и сохранением идентичности персонажа
Генерирует видео на основе аудио и текста или аудио, текста и изображения
Умеет петь, продлять видео, делать мультидиалог, видеоподкасты, продающие видео
Гитхаб
HF
MS
#ati2v #at2v #avatar #longvideo #characteranimation #speech2animation #image2video
🔥10❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Seedance 1.5
Еще одна обновка видеогенератора от ByteDance
Заявлены естественные диалоги и качественный липсинк
Ежедневные бесплатные генерации в СapCut
https://www.capcut.com/tools/seedance-1-5-ai-video-generator
https://dreamina.capcut.com/ai-tool/generate - Model 3.5
#text2video #image2video
Еще одна обновка видеогенератора от ByteDance
Заявлены естественные диалоги и качественный липсинк
Ежедневные бесплатные генерации в СapCut
https://www.capcut.com/tools/seedance-1-5-ai-video-generator
https://dreamina.capcut.com/ai-tool/generate - Model 3.5
#text2video #image2video
👍6😁2
DistillPatch LoRA
Восстанавливает истинную 8-шаговую скорость Turbo для любой LoRA, обученной на Z-Image Turbo
решает проблему ухудшения качества изображений (размытие) при использовании стандартной тренировки LoRA в Z-Image Turbo при параметрах steps=8 и cfg=1
HF
Демо
MS
MS Демо
Гитхаб
#lora #zimage #optimization
Восстанавливает истинную 8-шаговую скорость Turbo для любой LoRA, обученной на Z-Image Turbo
решает проблему ухудшения качества изображений (размытие) при использовании стандартной тренировки LoRA в Z-Image Turbo при параметрах steps=8 и cfg=1
HF
Демо
MS
MS Демо
Гитхаб
#lora #zimage #optimization
🔥6😁1
Media is too big
VIEW IN TELEGRAM
TRELLIS.2
А вот и треллис обновился.
Генератор текстурировапнных PBR 3D моделей по картинке, разрешение до 1536³
4B параметров.
Обрабатывает сложные структуры: открытые поверхности, nonmanifold-геометрию, внутренние структуры
SC-VAE: Sparse Compression VAE - придумали 3D-VAE для сжатия воксельных данных.
Гитхаб
Демо
HF
#imageto3d #pbr
А вот и треллис обновился.
Генератор текстурировапнных PBR 3D моделей по картинке, разрешение до 1536³
4B параметров.
Обрабатывает сложные структуры: открытые поверхности, nonmanifold-геометрию, внутренние структуры
SC-VAE: Sparse Compression VAE - придумали 3D-VAE для сжатия воксельных данных.
Гитхаб
Демо
HF
#imageto3d #pbr
❤6🔥4👍3
EgoX: Egocentric Video Generation from a Single Exocentric Video
Еще одна работа на субъективный вид от первого лица (POV), от KAIST
Превращает видео с видом со стороны в видео от лица одного из персонажей
Лора на базе Wan 2.1 14B i2v
Код ждем
#video2pov #pov #video2video #cameracontrol #lora
Еще одна работа на субъективный вид от первого лица (POV), от KAIST
Превращает видео с видом со стороны в видео от лица одного из персонажей
Лора на базе Wan 2.1 14B i2v
Код ждем
#video2pov #pov #video2video #cameracontrol #lora
🔥3😱2
chatterbox-turbo
Новая версия голосовой модели от Resemble AI, всего 350М параметров
Для естественности можно добавлять паралингвистические теги, например [cough], [laugh], [chuckle]
В аудиофайлы, созданные с помощью Chatterbox, встраиваются незаметные нейронные водяные знаки Perth, которые сохраняются при сжатии MP3, редактировании аудио и других манипуляциях
Ну и главное - есть мультиязычная версия модели на 500М параметров, поддерживающая более 23 языков, в том числе русский
HF
Демо
Демо мультиязычный - спасибо @Black_human
#voicecloning #tts #russian
Новая версия голосовой модели от Resemble AI, всего 350М параметров
Для естественности можно добавлять паралингвистические теги, например [cough], [laugh], [chuckle]
В аудиофайлы, созданные с помощью Chatterbox, встраиваются незаметные нейронные водяные знаки Perth, которые сохраняются при сжатии MP3, редактировании аудио и других манипуляциях
Ну и главное - есть мультиязычная версия модели на 500М параметров, поддерживающая более 23 языков, в том числе русский
HF
Демо
Демо мультиязычный - спасибо @Black_human
#voicecloning #tts #russian
🔥8
Molmo 2: State-of-the-art video understanding, pointing, and tracking
Семейство пониматоров видео и изображений от AI2 (Allen AI)
#SOTA среди открытых моделей
— обгоняет Gemini 3 Pro и другие открытые модели в отслеживании объектов в видео
— поддерживает работу с одиночными изображениями, несколькими изображениями и видеоклипами разной длины
— указывает конкретные события и объекты в видео, а не просто даёт описательные ответы
— выполняет подсчёт объектов с указанием их местоположения, отслеживание нескольких объектов, плотную разметку видео, обнаружение аномалий и артефактов, работает с субтитрами в видео
Molmo 2 (8B) — лучшая общая модель для работы с видео
Molmo 2 (4B) — оптимизирована для эффективности
Эти две модели на базе Qwen 3
Molmo 2-O (7B) — полностью открытая модель с контролем над всеми компонентами
Playground
HF
#vlm #multimodal
Семейство пониматоров видео и изображений от AI2 (Allen AI)
#SOTA среди открытых моделей
— обгоняет Gemini 3 Pro и другие открытые модели в отслеживании объектов в видео
— поддерживает работу с одиночными изображениями, несколькими изображениями и видеоклипами разной длины
— указывает конкретные события и объекты в видео, а не просто даёт описательные ответы
— выполняет подсчёт объектов с указанием их местоположения, отслеживание нескольких объектов, плотную разметку видео, обнаружение аномалий и артефактов, работает с субтитрами в видео
Molmo 2 (8B) — лучшая общая модель для работы с видео
Molmo 2 (4B) — оптимизирована для эффективности
Эти две модели на базе Qwen 3
Molmo 2-O (7B) — полностью открытая модель с контролем над всеми компонентами
Playground
HF
#vlm #multimodal
👍5❤1🔥1
Нейронавт | Нейросети в творчестве
ChatGPT Images Быстрый и точный редактор картинок от Open AI Новый король? посмотрим Пробуем в ChatGPT #imageediting #text2image
Openai
Gpt-image-1.5 Prompting Guide | OpenAI Cookbook
gpt-image-1.5 is our latest image generation model, designed for production-quality visuals and highly controllable creative workflows. I...
👍2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Music Videos by Mozart AI
Короче вот в чем суть обновки у генератора музыки Mozart AI
Они теперь делают видеоклипы до минуты хронометража
Vibe Sessions — путь от идеи к готовой песне и музыкальному видео в формате чата
Studio Session — среда мультитрек, генерирует стемы и лупы, работает с MIDI-инструментами, эффектами, делает аутпейнтинг и расширения, использует микшер
Ну что ж, суно и удио ушли, на поляне стало просторнее
#music #vusicediting #music2video #musicvideo #midi
Короче вот в чем суть обновки у генератора музыки Mozart AI
Они теперь делают видеоклипы до минуты хронометража
Vibe Sessions — путь от идеи к готовой песне и музыкальному видео в формате чата
Studio Session — среда мультитрек, генерирует стемы и лупы, работает с MIDI-инструментами, эффектами, делает аутпейнтинг и расширения, использует микшер
Ну что ж, суно и удио ушли, на поляне стало просторнее
#music #vusicediting #music2video #musicvideo #midi
🔥3👍1
Gemini 3 Flash: frontier intelligence built for speed
Еще версия иишки от гугла
Мультимодальная модель почти на уровне Gemini 3 Pro но быстрее и дешевле
Тоже понимает картинки и видео, и аудио. Умеет кодить
#news #assistant
Еще версия иишки от гугла
Мультимодальная модель почти на уровне Gemini 3 Pro но быстрее и дешевле
Тоже понимает картинки и видео, и аудио. Умеет кодить
#news #assistant
❤7