This media is not supported in your browser
VIEW IN TELEGRAM
GaVS: 3D-Grounded Video Stabilization via Temporally-Consistent Local Reconstruction and Rendering
Стабилизация трясущихся видео за счет 3D-реконструкции на гауссианах
Код
#stabilize #gaussian
Стабилизация трясущихся видео за счет 3D-реконструкции на гауссианах
Код
#stabilize #gaussian
🔥15👍1
Media is too big
VIEW IN TELEGRAM
LongAnimation: Long Animation Generation with Dynamic Global-Local Memory
Создание длинных анимационных видео с согласованным цветом на протяжении всего ролика. Модель умеет автоматически раскрашивать анимации, поддерживая единый стиль и цвет, что важно для анимации.
Менять цвет одежды персонажей можно просто изменив цвет в исходном изображении.
Под капотом CogVideoX-1.5 I2V и пониматор видео Video-XL
Код
#colorize #sketch2animation #image2video #image2animation
Создание длинных анимационных видео с согласованным цветом на протяжении всего ролика. Модель умеет автоматически раскрашивать анимации, поддерживая единый стиль и цвет, что важно для анимации.
Менять цвет одежды персонажей можно просто изменив цвет в исходном изображении.
Под капотом CogVideoX-1.5 I2V и пониматор видео Video-XL
Код
#colorize #sketch2animation #image2video #image2animation
👍9🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
ИИ Ретоп! Наконец то!
Хуньяньский бахнул новый 3д-генератор.
Его зовут Hunyuan3D-PolyGen.
Это точно не оперсорсная версия 2.1, и скорее всего апгрейд версии 2.5(которая без кода).
Судя по видео, Ретоп выглядит достаточно убойно, но я бы не доверял видосам.
Пишут, что сделали свою авторегрессионную модель для ретопа и теперь хошь в игры, хошь в кино.
Ибо теперь также 10 000+ полигонов на модель и повышенная точность генерации.
Умеет выводить в квады - такое мы любим.
Го тестировать:
https://3d.hunyuan.tencent.com/
@cgevent
Хуньяньский бахнул новый 3д-генератор.
Его зовут Hunyuan3D-PolyGen.
Это точно не оперсорсная версия 2.1, и скорее всего апгрейд версии 2.5(которая без кода).
Судя по видео, Ретоп выглядит достаточно убойно, но я бы не доверял видосам.
Пишут, что сделали свою авторегрессионную модель для ретопа и теперь хошь в игры, хошь в кино.
Ибо теперь также 10 000+ полигонов на модель и повышенная точность генерации.
Умеет выводить в квады - такое мы любим.
Го тестировать:
https://3d.hunyuan.tencent.com/
@cgevent
❤13👍2
This media is not supported in your browser
VIEW IN TELEGRAM
UniRelight: Learning Joint Decomposition and Synthesis for Video Relighting
Релайтинг от Nvidia.
Помимо прочего умеет учитывать прозрачность объектов.
Код ждем
#relighting #research
Релайтинг от Nvidia.
Помимо прочего умеет учитывать прозрачность объектов.
Код ждем
#relighting #research
🔥14❤2⚡1👍1
Trae Agent
Агент-программист от ByteDance на Claude и Gemini на стадии альфы
Показал высокие результаты на тесте SWE-bench Verified
Обещают добавить поддержку других LLM и MCP
#agent #coding
Агент-программист от ByteDance на Claude и Gemini на стадии альфы
Показал высокие результаты на тесте SWE-bench Verified
Обещают добавить поддержку других LLM и MCP
#agent #coding
GitHub
GitHub - bytedance/trae-agent: Trae Agent is an LLM-based agent for general purpose software engineering tasks.
Trae Agent is an LLM-based agent for general purpose software engineering tasks. - bytedance/trae-agent
❤3👍1
Media is too big
VIEW IN TELEGRAM
Fellou: The World's First Agentic Browser
"Первый в мире" агентный браузер.
Ну да, можно писать "первый в мире", пока опера дуплится, но тут тоже вход по вейтлисту.
#agent #browser #tools
"Первый в мире" агентный браузер.
Ну да, можно писать "первый в мире", пока опера дуплится, но тут тоже вход по вейтлисту.
#agent #browser #tools
👍5💩3❤1🤔1🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
Orchids
Сервис для создания приложений и веб-сайтов с помощью чата с ИИ. Обещают что результаты не выглядит «сгенерированными ИИ», превосходство над аналогами втрое, блаблабла. И этот тоже "первый в мире"
На бесплатном тарифе 5 запросов в месяц, деплой одного сайта.
#online #text2site #text2app
Сервис для создания приложений и веб-сайтов с помощью чата с ИИ. Обещают что результаты не выглядит «сгенерированными ИИ», превосходство над аналогами втрое, блаблабла. И этот тоже "первый в мире"
На бесплатном тарифе 5 запросов в месяц, деплой одного сайта.
#online #text2site #text2app
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
LangScene-X
Создает из набора изображений (от двух, но лучше больше) согласованное видео с учетом 3D, а также трёхмерную сцену, карту сегментации и нормали поверхности
В основе - CogVideoX, а также SAM2 и гауссианы
Код
#image2scene #imageto3d #image2normal #image2mask #image2video #gaussian
Создает из набора изображений (от двух, но лучше больше) согласованное видео с учетом 3D, а также трёхмерную сцену, карту сегментации и нормали поверхности
В основе - CogVideoX, а также SAM2 и гауссианы
Код
#image2scene #imageto3d #image2normal #image2mask #image2video #gaussian
❤7🔥2😐2
VLM Image Captioning Tool
Инструмент для автоматизации описания большого количества изображений. Главная фича - позволяет настроить серию промптов (а не один промпт) для пошагового процесса.
Поддерживает большинство VLM провайдеров, в том числе локальные VLM
Видео
#captioning #image2text #vlm
Инструмент для автоматизации описания большого количества изображений. Главная фича - позволяет настроить серию промптов (а не один промпт) для пошагового процесса.
Поддерживает большинство VLM провайдеров, в том числе локальные VLM
Видео
#captioning #image2text #vlm
GitHub
GitHub - victorchall/vlm-caption: Multiturn VLM Bulk captioning using your api service
Multiturn VLM Bulk captioning using your api service - victorchall/vlm-caption
👍5❤3
Media is too big
VIEW IN TELEGRAM
Moonvalley Marey
Новый видеогенератор
1. Натренирован не на ворованных видео (важно бизнесам, юзер больше пофик)
2. Много контроля: поза, перенос движения, траектории движения, образцы объектов, контроль камеры в 3D
3. Качество t2v на данный момент объективно похуже конкурентов
4. Нативная поддержка в CumfyUI
Бесплатного тарифа нет, приветственных кредитов не насыпают
Marey Realism v1.5 in ComfyUI
Спасибо @p0lygon
#text2video #comfyUI
Новый видеогенератор
1. Натренирован не на ворованных видео (важно бизнесам, юзер больше пофик)
2. Много контроля: поза, перенос движения, траектории движения, образцы объектов, контроль камеры в 3D
3. Качество t2v на данный момент объективно похуже конкурентов
4. Нативная поддержка в CumfyUI
Бесплатного тарифа нет, приветственных кредитов не насыпают
Marey Realism v1.5 in ComfyUI
Спасибо @p0lygon
#text2video #comfyUI
👍8🤯4❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Sara - AI Interviewer for hiring
Трепещите, кожаные. Теперь вас будет отвергать железяка.
ИИ-собеседователь.
Я попытался получить у нее позицию коммерческого директора. Мои знания о том как быть коммерческим директором равны нулю. Но она высоко оценила мою уверенность.
Дают 10-дневную триалку.
А поболтать можно бесплатно
#assistant #hr #interviewer
Трепещите, кожаные. Теперь вас будет отвергать железяка.
ИИ-собеседователь.
Я попытался получить у нее позицию коммерческого директора. Мои знания о том как быть коммерческим директором равны нулю. Но она высоко оценила мою уверенность.
Дают 10-дневную триалку.
А поболтать можно бесплатно
#assistant #hr #interviewer
😁7👀3👎2😱2🍌1
Flux Kontext Character Turnaround Sheet LoRA
Лора #kontext на рабочий лист персонажа
HF
Civitai
#lora #image2image
Лора #kontext на рабочий лист персонажа
HF
Civitai
#lora #image2image
👍17❤1
Media is too big
VIEW IN TELEGRAM
DLoRAL: One-Step Diffusion for Detail-Rich and Temporally Consistent Video Super-Resolution
Новый апскейлер с фокусом на точность, а не креатив. По капотом SD2.1
Код
Бонус: список диффузных видео апскейлеров
#upscale #Upscalevideo #superresolution
Новый апскейлер с фокусом на точность, а не креатив. По капотом SD2.1
Код
Бонус: список диффузных видео апскейлеров
#upscale #Upscalevideo #superresolution
👍8🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
StreamDiT: Real-Time Streaming Text-to-Video Generation
Генерация видео из текста в режиме реального времени, ресерч от Meta и ко.
Разрешение 512p, 16 fps на H100
Первая тройка видео - на модели 4B параметров
Вторая тройка видео - на модели 30B, не рилтайм
Кода нет
#realtime #text2video #research
Генерация видео из текста в режиме реального времени, ресерч от Meta и ко.
Разрешение 512p, 16 fps на H100
Первая тройка видео - на модели 4B параметров
Вторая тройка видео - на модели 30B, не рилтайм
Кода нет
#realtime #text2video #research
👍11