This media is not supported in your browser
VIEW IN TELEGRAM
SpatialGen: Layout-guided 3D Indoor Scene Generation
Cоздает фотореалистичные 3D-сцены интерьеров на основе 3D семантического макета и подсказки в виде текста или изображения
Под капотом FLUX.1-Wireframe-dev-lora и SpatialGen-1.0, который является производным от SD2.1
Код
HF
#segmentation2scene #segmentationto3d #layoutto3d #layout2scene
Cоздает фотореалистичные 3D-сцены интерьеров на основе 3D семантического макета и подсказки в виде текста или изображения
Под капотом FLUX.1-Wireframe-dev-lora и SpatialGen-1.0, который является производным от SD2.1
Код
HF
#segmentation2scene #segmentationto3d #layoutto3d #layout2scene
❤4👍2
Open-o3 Video: Grounded Video Reasoning with Explicit Spatio-Temporal Evidence
Пониматор видео на базе Qwen2.5-VL
Интегрирует в процесс рассуждений ключевые временные метки и ограничивающие рамки, что позволяет делать выводы более обоснованными и надёжными.
Гитхаб
HF
#vlm #video2text #reasoning #captioning
Пониматор видео на базе Qwen2.5-VL
Интегрирует в процесс рассуждений ключевые временные метки и ограничивающие рамки, что позволяет делать выводы более обоснованными и надёжными.
Гитхаб
HF
#vlm #video2text #reasoning #captioning
❤5👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Stability AI объявили о сотрудничестве с EA чтобы совместно разрабатывать генеративные ИИ-модели, инструменты и рабочие процессы. Их цели:
- ускорить итерации и рабочие процессы в разработке игр
- расширить творческие возможности дизайнеров, разработчиков и художников EA
- внедрить генеративный ИИ в творческие рабочие процессы, чтобы ускорить прототипирование и визуальное повествование
- ускорить создание PBR материалов
- разработать ИИ-системы, которые смогут предварительно визуализировать целые 3D-среды
#news
- ускорить итерации и рабочие процессы в разработке игр
- расширить творческие возможности дизайнеров, разработчиков и художников EA
- внедрить генеративный ИИ в творческие рабочие процессы, чтобы ускорить прототипирование и визуальное повествование
- ускорить создание PBR материалов
- разработать ИИ-системы, которые смогут предварительно визуализировать целые 3D-среды
#news
⚡3👀3👍2
Нейронавт | Нейросети в творчестве
Тем временем ComfyUI вошел в ТОП-100 репозиториев на Гитхабе #news
ТОП 25 причин пользоваться ComfyUI
😁18👍4
Language Models are Injective and Hence Invertible
Исследование языковых моделей на трансформерах показало, что они "ОБРАТИМЫ"
Это означает, что теперь мы можем точно восстановить ИСХОДНЫЙ промпт по скрытым активациям с помощью SIPit, нового алгоритма с гарантиями линейного времени.
Информация о входном тексте почти наверняка сохраняется в скрытых представлениях модели, опровергая мнение о «потере» информации из-за нелинейностей и других факторов.
Картинка из папиры, загадочная и непостижимая для меня, просто для красоты
#news
Исследование языковых моделей на трансформерах показало, что они "ОБРАТИМЫ"
Это означает, что теперь мы можем точно восстановить ИСХОДНЫЙ промпт по скрытым активациям с помощью SIPit, нового алгоритма с гарантиями линейного времени.
Информация о входном тексте почти наверняка сохраняется в скрытых представлениях модели, опровергая мнение о «потере» информации из-за нелинейностей и других факторов.
Картинка из папиры, загадочная и непостижимая для меня, просто для красоты
#news
1👍6🤔4🔥3
YouTube запустил инструмент для поиска фейков, созданных с помощью ИИ. Доступ дали некоторым участникам партнёрской программы.
Авторы роликов могут проверять и удалять видео, в которых несанкционированно использована их внешность
После подтверждения личности авторы могут просматривать помеченные видео во вкладке Content Detection в YouTube Studio
#news
Авторы роликов могут проверять и удалять видео, в которых несанкционированно использована их внешность
После подтверждения личности авторы могут просматривать помеченные видео во вкладке Content Detection в YouTube Studio
#news
YouTube
Sneak Peek: Likeness Detection
Hello Insiders! Today, we're here to give a sneak peek of an exciting feature, announced this year at Made on YouTube, called Likeness Detection.
Check it out and leave us your comments and questions below!
Links:
Managing your facial likeness with likeness…
Check it out and leave us your comments and questions below!
Links:
Managing your facial likeness with likeness…
👍1😱1
Если вы устанавливали себе Topaz starlight-mini, сейчас он у вас работает?
Anonymous Poll
6%
Проверил - работает
4%
Проверил, не раоотает
90%
Не устанавливал, посмотрю результаты
🔥2👍1
WAN2.2-14B-Rapid-AllInOne MEGA
Обновился мердж все-в-одном WAN2.2-14B-Rapid-AllInOne, появились еще несколько версий MEGA
В одну кучу намешаны WAN 2.2 с ускоряторами: lightx2v, WAN 2.2 Lightning (250928) и rCM.
GGUF искать здесь
FP16 искать здесь
#text2video #image2video #controlnet #gguf #wan22
Обновился мердж все-в-одном WAN2.2-14B-Rapid-AllInOne, появились еще несколько версий MEGA
В одну кучу намешаны WAN 2.2 с ускоряторами: lightx2v, WAN 2.2 Lightning (250928) и rCM.
GGUF искать здесь
FP16 искать здесь
#text2video #image2video #controlnet #gguf #wan22
huggingface.co
Phr00t/WAN2.2-14B-Rapid-AllInOne at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍12
Нейронавт | Нейросети в творчестве
когда твоя девушка работала через AWS контекст: на днях полег облачный сервис AWS прихватив с собой полмира, включая не только крупнейшие сайты, но и умные матрасы . И это на фоне сообщения о том что Amazon якобы заменил 40% DevOps-инженеров AWS искусственным…
💯27😁18😱2👍1
Mirage Studio бесплатно
Сервис говорящих аватаров от Captions объявил бесплатную генерацию видео на эти выходные, до 11:00 понедельника по московскому времени
Попробовать
#humananimation #speech2video #humanavatar #talkinghead #giveaway
Сервис говорящих аватаров от Captions объявил бесплатную генерацию видео на эти выходные, до 11:00 понедельника по московскому времени
Попробовать
#humananimation #speech2video #humanavatar #talkinghead #giveaway
❤5👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
LongCat-Video
Бдительные подписчики не дадут пропустить выход нового видеогенератора даже в выходной
Новая базовая (не является доработкой WAN или другого видеогенератора) опенсорсная модель видеогенерации на 13.6B параметров
Умеет создавать видео по тексту, картинке и продлевать исходное видео. Все это делает одна модель, а не разные ее модицфикации как у WAN
Основная особенность - создает длинные видео (несколько минут) не теряя связности и не деградируя.
Выдает 189 кадров в 720p за 142 секунды на H800. 16/5 шагов с flash attention 3.
Авторы использовали обучение с подкреплением по методу GRPO (как в BLIP3o-NEXT)
Позиционируют модель как "первый шаг к модели мира"
Гитхаб
HF - там только текстовый энкодер весит 23 ГБ, а DIT — 55 ГБ
Ждем кванты и воркфлоу?
Спасибо @m_franz
#text2video #image2video #video2video
Бдительные подписчики не дадут пропустить выход нового видеогенератора даже в выходной
Новая базовая (не является доработкой WAN или другого видеогенератора) опенсорсная модель видеогенерации на 13.6B параметров
Умеет создавать видео по тексту, картинке и продлевать исходное видео. Все это делает одна модель, а не разные ее модицфикации как у WAN
Основная особенность - создает длинные видео (несколько минут) не теряя связности и не деградируя.
Выдает 189 кадров в 720p за 142 секунды на H800. 16/5 шагов с flash attention 3.
Авторы использовали обучение с подкреплением по методу GRPO (как в BLIP3o-NEXT)
Позиционируют модель как "первый шаг к модели мира"
Гитхаб
HF - там только текстовый энкодер весит 23 ГБ, а DIT — 55 ГБ
Ждем кванты и воркфлоу?
Спасибо @m_franz
#text2video #image2video #video2video
🔥24😱6❤2👍1👎1