Media is too big
VIEW IN TELEGRAM
UltraGen: High-Resolution Video Generation with Hierarchical Attention
Видеогенератор 4K, масштабирует предварительно обученные модели с низким разрешением/
В исследовании масштабировали Wan-T2V-1.3B
Кода нет, так чисто посмотреть
#text2video #research
Видеогенератор 4K, масштабирует предварительно обученные модели с низким разрешением/
В исследовании масштабировали Wan-T2V-1.3B
Кода нет, так чисто посмотреть
#text2video #research
👍4👀4
This media is not supported in your browser
VIEW IN TELEGRAM
Suno.ai V4.5
Выдали всем бесплатно, по несколько генераций в день
Бонусом еще два минутных трека на v5
#news #text2music
Выдали всем бесплатно, по несколько генераций в день
Бонусом еще два минутных трека на v5
#news #text2music
👍12❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Video-As-Prompt: Unified Semantic Control for Video Generation
Видеогенератор использует видео как пропмт, создавая видео, семантически согласованные с референсами
— создаёт видео с одинаковой семантикой при разных референсных видео и одинаковых изображениях
— переносит семантику (концепцию, стиль, движение, ракурс камеры) с референсного видео на разные изображения
— сохраняет семантику и идентичность при корректировке мелких атрибутов с помощью промпта
— генерирует видео с определёнными концепциями
— создаёт видео в заданном стиле
— воспроизводит заданные движения и стили танца
— имитирует различные движения камеры, включая сложные, вроде дolly zoom (эффекта Хичкока)
Код
HF - прикрутили к WAN2.114B и CogVideox-5B
#referencing #text2video #video2video
Видеогенератор использует видео как пропмт, создавая видео, семантически согласованные с референсами
— создаёт видео с одинаковой семантикой при разных референсных видео и одинаковых изображениях
— переносит семантику (концепцию, стиль, движение, ракурс камеры) с референсного видео на разные изображения
— сохраняет семантику и идентичность при корректировке мелких атрибутов с помощью промпта
— генерирует видео с определёнными концепциями
— создаёт видео в заданном стиле
— воспроизводит заданные движения и стили танца
— имитирует различные движения камеры, включая сложные, вроде дolly zoom (эффекта Хичкока)
Код
HF - прикрутили к WAN2.114B и CogVideox-5B
#referencing #text2video #video2video
👍6❤3🔥2
Media is too big
VIEW IN TELEGRAM
Stable Video Infinity: Infinite-Length Video Generation with Error Recycling
И еще один костыль для увеличения сами знаете чего -хронометража генерируемого видео
SVI создает видео любой длины с высокой временной согласованностью, правдоподобными переходами между сценами и управляемыми сюжетными линиями
Базовая модель — Wan 2.1 14B
Ждем версию Wan 2.2-5B-SVI
Код
HF
спасибо @m_franz
#longvideo #text2video #image2video
И еще один костыль для увеличения сами знаете чего -
SVI создает видео любой длины с высокой временной согласованностью, правдоподобными переходами между сценами и управляемыми сюжетными линиями
Базовая модель — Wan 2.1 14B
Ждем версию Wan 2.2-5B-SVI
Код
HF
спасибо @m_franz
#longvideo #text2video #image2video
👍14
BoldVoice Accent Oracle
Онлайн определятор акцента в английском языке.
Давно не говорил на ангельском, у меня явный русский акцент
Сможете обмануть его?
#misc #online #speech
Онлайн определятор акцента в английском языке.
Давно не говорил на ангельском, у меня явный русский акцент
Сможете обмануть его?
#misc #online #speech
😁8👍3🤯1
Закинул видео своего медведя на реконструкцию в HunyuanWorld-Mirror по 24 отобранным кадрам
Гауссова сцена далека от идеала, на меш интереснее смотреть. Надо увеличивать количество ракурсов.
Закину гауссианы и меш в комменты для интересующихся
#videoto3d #video2scene #gaussian #imageto3d #image2scene #video2gaussian #video2normal #video2depth #image2normal #image2depth
Гауссова сцена далека от идеала, на меш интереснее смотреть. Надо увеличивать количество ракурсов.
Закину гауссианы и меш в комменты для интересующихся
#videoto3d #video2scene #gaussian #imageto3d #image2scene #video2gaussian #video2normal #video2depth #image2normal #image2depth
❤4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Claude Desktop
Десктопный ИИ-ассистент от Anthropic раздали всем, а то ишь, Атлас отбивает аудиторию
#MacOS / #Windows
#desktop #assistant
Десктопный ИИ-ассистент от Anthropic раздали всем, а то ишь, Атлас отбивает аудиторию
#MacOS / #Windows
#desktop #assistant
🥴10👍5👎1
BLIP3o-NEXT: Advanced Multimodal Foundation Model
Мультимодальная модель, развитие BLIP3o
Гибрид авторегресси и диффузии
Генератор / пониматор картинок от Salesforce
Улучшенное соответствие подсказкам и точность рендеринга текста за счет обучения с подкреплением по методу GRPO
Хорошо справляется с задачами, требующими пространственной структуры (например, рендеринг текста или генерация нескольких объектов
Гитхаб
HF - там целый зоопарк от 3B до 8B
#text2image #image2text #multimodal #ar #captioning
Мультимодальная модель, развитие BLIP3o
Гибрид авторегресси и диффузии
Генератор / пониматор картинок от Salesforce
Улучшенное соответствие подсказкам и точность рендеринга текста за счет обучения с подкреплением по методу GRPO
Хорошо справляется с задачами, требующими пространственной структуры (например, рендеринг текста или генерация нескольких объектов
Гитхаб
HF - там целый зоопарк от 3B до 8B
#text2image #image2text #multimodal #ar #captioning
👍6❤1
когда твоя девушка работала через AWS
контекст:
на днях полег облачный сервис AWS прихватив с собой полмира, включая не только крупнейшие сайты, но и умные матрасы . И это на фоне сообщения о том что Amazon якобы заменил 40% DevOps-инженеров AWS искусственным интеллектом за несколько дней до сбоя
#humor
на днях полег облачный сервис AWS прихватив с собой полмира, включая
#humor
😁27🤷♂2👍1
LTX-2
Новая версия видеогенератора от Lightricks
Создает видео со звуком в 4K, 50 фпс, рилтайм (нет)
На вход можно подать что угодно: текст, изображения, видео, аудио, карты глубины и отснятый материал для управляемой генерации
Поддерживает лоры и генерацию по нескольким ключевым кадрам
Попробовать (кроме россиян), можно на офсайте
Уже есть на Fal.ai, также можно чекнуть Replicate, ComfyUI
Тест человекорыбом частично провалился. Где рыба, Лебовски?
И тоже не умеет делать лунную походку.
Может оно и 4К по количеству пикселей но не по качеству. Ну зато быстрый. Ждем опенсорс
Гитхаб - новую модель опубликуют в конце ноября
Спасибо @m_franz
#any2video #text2video #image2video
Новая версия видеогенератора от Lightricks
Создает видео со звуком в 4K, 50 фпс, рилтайм (нет)
На вход можно подать что угодно: текст, изображения, видео, аудио, карты глубины и отснятый материал для управляемой генерации
Поддерживает лоры и генерацию по нескольким ключевым кадрам
Попробовать (кроме россиян), можно на офсайте
Уже есть на Fal.ai, также можно чекнуть Replicate, ComfyUI
Тест человекорыбом частично провалился. Где рыба, Лебовски?
И тоже не умеет делать лунную походку.
Может оно и 4К по количеству пикселей но не по качеству. Ну зато быстрый. Ждем опенсорс
Гитхаб - новую модель опубликуют в конце ноября
Спасибо @m_franz
#any2video #text2video #image2video
🔥8😱2❤1⚡1👍1