Video Overviews
Google тизерит новую функцию, которая станет частью проекта Illuminate. Функция создает короткие видеоролики продолжительностью от 1 до 3 минут
Видео генерируются единой моделью, способной синхронизировать видео и аудио.
Ту же модель планируют прикрутить в NotebookLM
Твиттер
#videoediting #assistant #news
Google тизерит новую функцию, которая станет частью проекта Illuminate. Функция создает короткие видеоролики продолжительностью от 1 до 3 минут
Видео генерируются единой моделью, способной синхронизировать видео и аудио.
Ту же модель планируют прикрутить в NotebookLM
Твиттер
#videoediting #assistant #news
👍8🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Jules
Агент-программист от Гугл.
"Берет на себя задачи которыми вы не хотите заниматься"
Используя Gemini 2.0, интегрируется с GitHub.
Копипует ваш код в облачную виртуальную машину и проверяет его там.
Покажет вам план, обоснует, предложит изменения.
Записаться в вейтлист
Документация
#coding #assistant
Агент-программист от Гугл.
"Берет на себя задачи которыми вы не хотите заниматься"
Используя Gemini 2.0, интегрируется с GitHub.
Копипует ваш код в облачную виртуальную машину и проверяет его там.
Покажет вам план, обоснует, предложит изменения.
Записаться в вейтлист
Документация
#coding #assistant
👍13
Media is too big
VIEW IN TELEGRAM
flowith 2.0
выполнит 1000+ шагов рассуждения с 10M+ токенов контекста
Выполнит задачи по расписанию. Вы спите он работает
Команда агентов под капотом работает параллельно
На бенчмарке GAIA бьет и OpenAI, и Manus
Бесплатно работает - проверил, но лимиты непонятны. При попытке залогиниться сразу требует код инвайта и согласиться на двухнедельную триалку (карта не нужна) или уходи
Поклянчить инвайт можно попробовать здесь
#agent
Первый в мире бесконечный агент - бесконечные шаги, бесконечный контекст, бесконечный вывод в облако
выполнит 1000+ шагов рассуждения с 10M+ токенов контекста
Выполнит задачи по расписанию. Вы спите он работает
Команда агентов под капотом работает параллельно
На бенчмарке GAIA бьет и OpenAI, и Manus
Бесплатно работает - проверил, но лимиты непонятны. При попытке залогиниться сразу требует код инвайта и согласиться на двухнедельную триалку (карта не нужна) или уходи
Поклянчить инвайт можно попробовать здесь
#agent
👍5🔥3😁2❤1
Speech-02-HD
Minimax скинул Open AI и ElevenLabs с трона #TTS - преобразователей текста в речь (первый скриншот)
Но это неточно, минимакс ссылку на арену не приложил и мне не удалось найти арену на которой он рулит. Вот например на этой арене он шестой (второй скриншот)
Энивей, инструмент достойный внимания
#text2speech #news #leaderboard
Minimax скинул Open AI и ElevenLabs с трона #TTS - преобразователей текста в речь (первый скриншот)
Но это неточно, минимакс ссылку на арену не приложил и мне не удалось найти арену на которой он рулит. Вот например на этой арене он шестой (второй скриншот)
Энивей, инструмент достойный внимания
#text2speech #news #leaderboard
👍8👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan Game
Tencent представил ИИ-движок для создания графики в играх.
• AI Art Pipeline: Полный цикл создания арта — от идеи до финальной 3D-проекции — в одном окне.
• Холст в реальном времени: Ты рисуешь — ИИ сразу показывает, как будет выглядеть финальная версия.
• Генератор 2D-графики: ИИ точно понимает, что ты хочешь - без искажённых промптов.
• Мультиракурсы персонажей: ИИ автоматически создаёт вид спереди, сбоку, сзади + 360°-просмотр.
Записаться в вейтлист
#gamedev #3d
Tencent представил ИИ-движок для создания графики в играх.
• AI Art Pipeline: Полный цикл создания арта — от идеи до финальной 3D-проекции — в одном окне.
• Холст в реальном времени: Ты рисуешь — ИИ сразу показывает, как будет выглядеть финальная версия.
• Генератор 2D-графики: ИИ точно понимает, что ты хочешь - без искажённых промптов.
• Мультиракурсы персонажей: ИИ автоматически создаёт вид спереди, сбоку, сзади + 360°-просмотр.
Записаться в вейтлист
#gamedev #3d
👍9🔥5❤1😐1
Magentic-UI
Агентная система от Microsoft Research на AutoGen
• Планирует вместе с тобой: Агент предлагает пошаговый план действий, который можно изменить, утвердить или уточнить.
• Показывает, что делает: Все действия видны — клики, ввод текста, навигация.
• Спрашивает разрешение перед важными действиями: Агент не будет нажимать на кнопки "удалить" или "оплатить" без согласия.
• Обучается на успешных сценариях: Завершил задачу? Теперь этот план можно переиспользовать в будущем.
Где это может пригодиться?
• Заполнение длинных форм и анкет
• Автоматизация рутинных действий в браузере
• Создание умных пользовательских сценариев
• Обучение и настройка собственных браузерных агентов
Устанавливается через Docker
Код
#agent #assistant
Агентная система от Microsoft Research на AutoGen
• Планирует вместе с тобой: Агент предлагает пошаговый план действий, который можно изменить, утвердить или уточнить.
• Показывает, что делает: Все действия видны — клики, ввод текста, навигация.
• Спрашивает разрешение перед важными действиями: Агент не будет нажимать на кнопки "удалить" или "оплатить" без согласия.
• Обучается на успешных сценариях: Завершил задачу? Теперь этот план можно переиспользовать в будущем.
Где это может пригодиться?
• Заполнение длинных форм и анкет
• Автоматизация рутинных действий в браузере
• Создание умных пользовательских сценариев
• Обучение и настройка собственных браузерных агентов
Устанавливается через Docker
Код
#agent #assistant
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Генерация видео LTXV 13b в реальном времени (почти) на H100
Воркфлоу в комментариях
Реддит
#text2video #image2video #realtime #workflow
Воркфлоу в комментариях
Реддит
#text2video #image2video #realtime #workflow
😁6👍2❤1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
VEO 3
Новая модель видеогенератора от Google Deepmind
Нативно создает звук вместе с видео, в том числе диалоги.
Лучше понимает сложные промпты, в том числе с меняющимися сценами
Доступен сегодня в правильной стране
#text2video #news #text2movie #sota
Новая модель видеогенератора от Google Deepmind
Нативно создает звук вместе с видео, в том числе диалоги.
Лучше понимает сложные промпты, в том числе с меняющимися сценами
Доступен сегодня в правильной стране
#text2video #news #text2movie #sota
🔥15👍8❤1