This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
URSA: Uniform Discrete Diffusion with Metric Path for Video Generation
Картинко- и видеогенератор на базе Qwen3. Модель объединяет преимущества дискретных и непрерывных подходов, сокращая разрыв в производительности между ними.
Кстати, токенизатор взяли от нвидиевского Cosmos
Умеет продлевать видео, генерить по начальному и конечному кадру.
Есть модели генерации картинок по тексту разрешением 1024*1024
И модели генерации видео разрешением 49x512x320
Негусто, но сами видеогенераторы весят около 4 ГБ
Является частью Emu3.5 как дискретная адаптация диффузии (DiDA)
Гитхаб
HF
Демо - обратите внимание на разницу между черрипиками с офсайта и генерациями из демоспейса (последние два видео). В общем, надежда на то что выстругают модельки покрупнее и поумнее
#text2image #image2video #text2video
Картинко- и видеогенератор на базе Qwen3. Модель объединяет преимущества дискретных и непрерывных подходов, сокращая разрыв в производительности между ними.
Соперничает с моделями типа Sora в генерации видео по тексту, используя дискретный токенизатор видео.
Кстати, токенизатор взяли от нвидиевского Cosmos
Умеет продлевать видео, генерить по начальному и конечному кадру.
Есть модели генерации картинок по тексту разрешением 1024*1024
И модели генерации видео разрешением 49x512x320
Негусто, но сами видеогенераторы весят около 4 ГБ
Является частью Emu3.5 как дискретная адаптация диффузии (DiDA)
Гитхаб
HF
Демо - обратите внимание на разницу между черрипиками с офсайта и генерациями из демоспейса (последние два видео). В общем, надежда на то что выстругают модельки покрупнее и поумнее
#text2image #image2video #text2video
👍9😁1
JanusCoder: Towards a Foundational Visual-Programmatic Interface for Code Intelligence
ИИ-программист, который работает и с кодом, и с визуалом и не требует отдельных моделей для разных задач. есть 8B и 14B
Генерирует код из текста и изображений.
Делает визуализации, анимации, интерактивные интерфейсы, редактирует веб-страницы
Базовые модели: для JanusCoder — Qwen3-{8B, 14B}, для JanusCoderV — Qwen2.5-VL-7B-Instruct и InternVL3.5-8B
Гитхаб
HF
#coding #assistant
ИИ-программист, который работает и с кодом, и с визуалом и не требует отдельных моделей для разных задач. есть 8B и 14B
Генерирует код из текста и изображений.
Делает визуализации, анимации, интерактивные интерфейсы, редактирует веб-страницы
Базовые модели: для JanusCoder — Qwen3-{8B, 14B}, для JanusCoderV — Qwen2.5-VL-7B-Instruct и InternVL3.5-8B
Гитхаб
HF
#coding #assistant
❤6🥴1
Media is too big
VIEW IN TELEGRAM
VFXMaster: Unlocking Dynamic Visual Effect Generation via In-Context Learning
Модель для создания VFX по референсному видео на базе CogVideoX-5B-I2V. Переносит динамику и трансформации из эталонного видео на пользовательское изображение.
Вместо сотни отдельных эффектов на Pika и иже с ними - одна модель которая воспроизведет любой эффект.
Код ждем
#vfx #referencing #image2video
Модель для создания VFX по референсному видео на базе CogVideoX-5B-I2V. Переносит динамику и трансформации из эталонного видео на пользовательское изображение.
Вместо сотни отдельных эффектов на Pika и иже с ними - одна модель которая воспроизведет любой эффект.
Код ждем
#vfx #referencing #image2video
👍7🔥4
FIBO
Новый многообещающий генератор картинок обученный на длинных структурированных промптах в формате JSON
Можно начать с краткой идеи, а затем постепенно уточнять и дорабатывать изображение - есть Generator и Refiner
Позволяет менять отдельные параметры (например, угол камеры) без изменения остальной части сцены
Вообще понимание промпта огонь по первому тесту. Из 4 картинок человекорыб на всех идет справа налево как и требовалось
Гитхаб
HF - всего около ~27 ГБ
Демо
Демо 2
Попробовать на офсайте - можно просто в плейграунде потестить, а можно еще взять месяц триалки API но придется дать свою кредитку
ComfyUI:
Generate Node
Refine Node
#text2image #json #longprompt #imageediting #ComfyUI
Новый многообещающий генератор картинок обученный на длинных структурированных промптах в формате JSON
Можно начать с краткой идеи, а затем постепенно уточнять и дорабатывать изображение - есть Generator и Refiner
Позволяет менять отдельные параметры (например, угол камеры) без изменения остальной части сцены
Вообще понимание промпта огонь по первому тесту. Из 4 картинок человекорыб на всех идет справа налево как и требовалось
Гитхаб
HF - всего около ~27 ГБ
Демо
Демо 2
Попробовать на офсайте - можно просто в плейграунде потестить, а можно еще взять месяц триалки API но придется дать свою кредитку
ComfyUI:
Generate Node
Refine Node
#text2image #json #longprompt #imageediting #ComfyUI
🔥17👍6❤3
Forwarded from Киноборт
Этот советский фильм вдохновил Кубрика, Лукаса и Кэмерона! 🚀
Знакомьтесь: «Планета бурь» (1961), реж. Павел Клушанцев.
Это кино без супербюджетов, но которое изменило мир благодаря гениальными идеями.
Чем уникален?
– Первые реалистичные сцены невесомости (с помощью скрытых тросов)
– Робот-андроид с ИИ — за десятилетия до «Терминатора»
– Вулканы из пузырящегося теста и космические вездеходы от инженеров ЗИЛа
– Новаторские комбинированные съемки, когда макеты совмещали с живыми актерами.
Как повлиял на кинематограф?
🎬 Джордж Лукас называл Клушанцева «крёстным отцом „Звездных войн“» – его вездеходы стали прообразом флиппера
🎬 Стэнли Кубрик изучал фильм перед съёмками «Космической одиссеи 2001»
🎬 Джеймс Кэмерон использовал трюк со съёмкой через аквариум в «Титанике»
🎬 Сцена гибели Т-800 в «Терминаторе 2» – прямая отсылка к гибели робота в «Планете бурь»
🎬 Ридли Скотт в «Прометее» повторил дизайн скафандров из советского фильма!
👉 Подпишись на канал Киноборт, чтобы знать больше уникальных фактов!
Знакомьтесь: «Планета бурь» (1961), реж. Павел Клушанцев.
Это кино без супербюджетов, но которое изменило мир благодаря гениальными идеями.
Чем уникален?
– Первые реалистичные сцены невесомости (с помощью скрытых тросов)
– Робот-андроид с ИИ — за десятилетия до «Терминатора»
– Вулканы из пузырящегося теста и космические вездеходы от инженеров ЗИЛа
– Новаторские комбинированные съемки, когда макеты совмещали с живыми актерами.
Как повлиял на кинематограф?
🎬 Джордж Лукас называл Клушанцева «крёстным отцом „Звездных войн“» – его вездеходы стали прообразом флиппера
🎬 Стэнли Кубрик изучал фильм перед съёмками «Космической одиссеи 2001»
🎬 Джеймс Кэмерон использовал трюк со съёмкой через аквариум в «Титанике»
🎬 Сцена гибели Т-800 в «Терминаторе 2» – прямая отсылка к гибели робота в «Планете бурь»
🎬 Ридли Скотт в «Прометее» повторил дизайн скафандров из советского фильма!
👉 Подпишись на канал Киноборт, чтобы знать больше уникальных фактов!
❤11🔥8👍2🥴2
This media is not supported in your browser
VIEW IN TELEGRAM
Can Agent Conquer Web? Exploring the Frontiers of Atlas Agent in Web Games
Протестировали ChatGPT Atlas на способность играть в браузерные игры
Итоги исследования:
Atlas хорошо справляется с задачами, требующими логического мышления и систематического анализа (например, в Sudoku модель решала головоломки значительно быстрее человека).
Модель испытывает серьёзные трудности в играх, где нужны точная координация и управление в реальном времени (в T-Rex Runner и Flappy Bird результаты были намного ниже человеческих)
В RPG-играх (Stein.world) Atlas зависит от чётких инструкций и плохо понимает контекст и сюжет.
Модель демонстрирует некоторые адаптивные способности, например, пытается активировать облегчённые режимы или менять стратегию, но часто не может преодолеть базовые ограничения в управлении и стратегическом планировании.
Короче, Atlas обладает сильными аналитическими способностями, у него есть существенные ограничения в динамичных средах, требующих точного управления, стратегического планирования и понимания контекста.
По ссылке в шапке еще несколько видео с другими играми
#research
Протестировали ChatGPT Atlas на способность играть в браузерные игры
Итоги исследования:
Atlas хорошо справляется с задачами, требующими логического мышления и систематического анализа (например, в Sudoku модель решала головоломки значительно быстрее человека).
Модель испытывает серьёзные трудности в играх, где нужны точная координация и управление в реальном времени (в T-Rex Runner и Flappy Bird результаты были намного ниже человеческих)
В RPG-играх (Stein.world) Atlas зависит от чётких инструкций и плохо понимает контекст и сюжет.
Модель демонстрирует некоторые адаптивные способности, например, пытается активировать облегчённые режимы или менять стратегию, но часто не может преодолеть базовые ограничения в управлении и стратегическом планировании.
Короче, Atlas обладает сильными аналитическими способностями, у него есть существенные ограничения в динамичных средах, требующих точного управления, стратегического планирования и понимания контекста.
По ссылке в шапке еще несколько видео с другими играми
#research
👍3
Wan 2.2 Animate in ComfyUI - Tips for Control and Quality
Недавний стрим с хитростями для контроля и качества Wan Animate
#tutorial #comfyui #wan22
Недавний стрим с хитростями для контроля и качества Wan Animate
#tutorial #comfyui #wan22
YouTube
Wan 2.2 Animate in ComfyUI - Tips for Control and Quality
Wan 2.2 Animate is one of the most powerful open-source video models available today — capable of stunning motion, expressive characters, and cinematic control. But with that power comes complexity. In this session, we’ll take the mystery out of Wan 2.2 Animate…
❤13👍2
Wan ATI
Контроль анимации для WAN
Wan ATI with ComfyUI - Стрим ComfyOrg
HF
#conditioning #text2video #image2video #tutorial
Контроль анимации для WAN
Wan ATI with ComfyUI - Стрим ComfyOrg
HF
#conditioning #text2video #image2video #tutorial
🔥9❤2👍1😱1