DanceGRPO
Метод создания изображений и видео по тексту, видео по картинке от ByteDance
Совместим с Stable Diffusion, HunyuanVideo, FLUX, SkyReel-I2V.
Код ждем
#text2image #text2video #image2video #tools
Метод создания изображений и видео по тексту, видео по картинке от ByteDance
Совместим с Stable Diffusion, HunyuanVideo, FLUX, SkyReel-I2V.
Код ждем
#text2image #text2video #image2video #tools
👍7
ComfyUI-VideoUpscale_WithModel
ComfyUI ноды для увеличения разрешения видео с использованием недиффузных моделей, таких как ESRGAN.
Работает с моделями из базы https://openmodeldb.info/
#ComfyUI #upscalevideo
ComfyUI ноды для увеличения разрешения видео с использованием недиффузных моделей, таких как ESRGAN.
Работает с моделями из базы https://openmodeldb.info/
#ComfyUI #upscalevideo
👍9🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
GenGaze
Создание изображений в ComfyUI с использованием направления взгляда пользователя.
Код ждем
#imageediting #tools
Создание изображений в ComfyUI с использованием направления взгляда пользователя.
Код ждем
#imageediting #tools
👀6👍1
This media is not supported in your browser
VIEW IN TELEGRAM
KEEP
Официальный аккаунт Gradio пишет что реставратор - апскейлер лиц на видео KEEP это новая SOTA.
В репозитории две новые модели
Код
Демо
#restoration #enhance #facerestoration #upscale #SOTA
Официальный аккаунт Gradio пишет что реставратор - апскейлер лиц на видео KEEP это новая SOTA.
В репозитории две новые модели
Код
Демо
#restoration #enhance #facerestoration #upscale #SOTA
👍6❤2
Video Overviews
Google тизерит новую функцию, которая станет частью проекта Illuminate. Функция создает короткие видеоролики продолжительностью от 1 до 3 минут
Видео генерируются единой моделью, способной синхронизировать видео и аудио.
Ту же модель планируют прикрутить в NotebookLM
Твиттер
#videoediting #assistant #news
Google тизерит новую функцию, которая станет частью проекта Illuminate. Функция создает короткие видеоролики продолжительностью от 1 до 3 минут
Видео генерируются единой моделью, способной синхронизировать видео и аудио.
Ту же модель планируют прикрутить в NotebookLM
Твиттер
#videoediting #assistant #news
👍8🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Jules
Агент-программист от Гугл.
"Берет на себя задачи которыми вы не хотите заниматься"
Используя Gemini 2.0, интегрируется с GitHub.
Копипует ваш код в облачную виртуальную машину и проверяет его там.
Покажет вам план, обоснует, предложит изменения.
Записаться в вейтлист
Документация
#coding #assistant
Агент-программист от Гугл.
"Берет на себя задачи которыми вы не хотите заниматься"
Используя Gemini 2.0, интегрируется с GitHub.
Копипует ваш код в облачную виртуальную машину и проверяет его там.
Покажет вам план, обоснует, предложит изменения.
Записаться в вейтлист
Документация
#coding #assistant
👍13
Media is too big
VIEW IN TELEGRAM
flowith 2.0
выполнит 1000+ шагов рассуждения с 10M+ токенов контекста
Выполнит задачи по расписанию. Вы спите он работает
Команда агентов под капотом работает параллельно
На бенчмарке GAIA бьет и OpenAI, и Manus
Бесплатно работает - проверил, но лимиты непонятны. При попытке залогиниться сразу требует код инвайта и согласиться на двухнедельную триалку (карта не нужна) или уходи
Поклянчить инвайт можно попробовать здесь
#agent
Первый в мире бесконечный агент - бесконечные шаги, бесконечный контекст, бесконечный вывод в облако
выполнит 1000+ шагов рассуждения с 10M+ токенов контекста
Выполнит задачи по расписанию. Вы спите он работает
Команда агентов под капотом работает параллельно
На бенчмарке GAIA бьет и OpenAI, и Manus
Бесплатно работает - проверил, но лимиты непонятны. При попытке залогиниться сразу требует код инвайта и согласиться на двухнедельную триалку (карта не нужна) или уходи
Поклянчить инвайт можно попробовать здесь
#agent
👍5🔥3😁2❤1
Speech-02-HD
Minimax скинул Open AI и ElevenLabs с трона #TTS - преобразователей текста в речь (первый скриншот)
Но это неточно, минимакс ссылку на арену не приложил и мне не удалось найти арену на которой он рулит. Вот например на этой арене он шестой (второй скриншот)
Энивей, инструмент достойный внимания
#text2speech #news #leaderboard
Minimax скинул Open AI и ElevenLabs с трона #TTS - преобразователей текста в речь (первый скриншот)
Но это неточно, минимакс ссылку на арену не приложил и мне не удалось найти арену на которой он рулит. Вот например на этой арене он шестой (второй скриншот)
Энивей, инструмент достойный внимания
#text2speech #news #leaderboard
👍8👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan Game
Tencent представил ИИ-движок для создания графики в играх.
• AI Art Pipeline: Полный цикл создания арта — от идеи до финальной 3D-проекции — в одном окне.
• Холст в реальном времени: Ты рисуешь — ИИ сразу показывает, как будет выглядеть финальная версия.
• Генератор 2D-графики: ИИ точно понимает, что ты хочешь - без искажённых промптов.
• Мультиракурсы персонажей: ИИ автоматически создаёт вид спереди, сбоку, сзади + 360°-просмотр.
Записаться в вейтлист
#gamedev #3d
Tencent представил ИИ-движок для создания графики в играх.
• AI Art Pipeline: Полный цикл создания арта — от идеи до финальной 3D-проекции — в одном окне.
• Холст в реальном времени: Ты рисуешь — ИИ сразу показывает, как будет выглядеть финальная версия.
• Генератор 2D-графики: ИИ точно понимает, что ты хочешь - без искажённых промптов.
• Мультиракурсы персонажей: ИИ автоматически создаёт вид спереди, сбоку, сзади + 360°-просмотр.
Записаться в вейтлист
#gamedev #3d
👍9🔥5❤1😐1
Magentic-UI
Агентная система от Microsoft Research на AutoGen
• Планирует вместе с тобой: Агент предлагает пошаговый план действий, который можно изменить, утвердить или уточнить.
• Показывает, что делает: Все действия видны — клики, ввод текста, навигация.
• Спрашивает разрешение перед важными действиями: Агент не будет нажимать на кнопки "удалить" или "оплатить" без согласия.
• Обучается на успешных сценариях: Завершил задачу? Теперь этот план можно переиспользовать в будущем.
Где это может пригодиться?
• Заполнение длинных форм и анкет
• Автоматизация рутинных действий в браузере
• Создание умных пользовательских сценариев
• Обучение и настройка собственных браузерных агентов
Устанавливается через Docker
Код
#agent #assistant
Агентная система от Microsoft Research на AutoGen
• Планирует вместе с тобой: Агент предлагает пошаговый план действий, который можно изменить, утвердить или уточнить.
• Показывает, что делает: Все действия видны — клики, ввод текста, навигация.
• Спрашивает разрешение перед важными действиями: Агент не будет нажимать на кнопки "удалить" или "оплатить" без согласия.
• Обучается на успешных сценариях: Завершил задачу? Теперь этот план можно переиспользовать в будущем.
Где это может пригодиться?
• Заполнение длинных форм и анкет
• Автоматизация рутинных действий в браузере
• Создание умных пользовательских сценариев
• Обучение и настройка собственных браузерных агентов
Устанавливается через Docker
Код
#agent #assistant
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Генерация видео LTXV 13b в реальном времени (почти) на H100
Воркфлоу в комментариях
Реддит
#text2video #image2video #realtime #workflow
Воркфлоу в комментариях
Реддит
#text2video #image2video #realtime #workflow
😁6👍2❤1🤯1