MVGD: Zero-Shot Novel View and Depth Synthesis with Multi-View Geometric Diffusion
Диффузный генератор новых консистентных ракурсов с картой глубины заданной сцены. На вход - любое количество ракурсов сцены.
Код ждем
#image2depth #novelview
Диффузный генератор новых консистентных ракурсов с картой глубины заданной сцены. На вход - любое количество ракурсов сцены.
Код ждем
#image2depth #novelview
👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Open Deep Research
Опенсорсный клон Deep Reserach вышел спустя 12 часов после презентации Open AI агента для исследований
Экономим $200 на подписке
#assistant #agent
Опенсорсный клон Deep Reserach вышел спустя 12 часов после презентации Open AI агента для исследований
Экономим $200 на подписке
#assistant #agent
👍9😁4🤔1
Qwen Video
Я писал про генерацию видео в Qwen2.5-1M, но она была недоступна. А на днях ее таки подключили видимо для всех
Если еще не пробовали, даю отмашку
#text2video #image2video
Я писал про генерацию видео в Qwen2.5-1M, но она была недоступна. А на днях ее таки подключили видимо для всех
Если еще не пробовали, даю отмашку
#text2video #image2video
👍6🎃2
This media is not supported in your browser
VIEW IN TELEGRAM
Срочные (нет) новости (нет)
Слышали про квадрат на Марсе?
Так вот, там целый датацентр уже построен и даже нанесен на гуглмапс с панорамами самим Гуглом1 апреля 2017 года
#оффтоп #humor
Слышали про квадрат на Марсе?
Так вот, там целый датацентр уже построен и даже нанесен на гуглмапс с панорамами самим Гуглом
#оффтоп #humor
😁27🔥6🤡2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Leapfusion Hunyuan Image-to-Video V2
Обновка опенсорсного генератора видео по картинке, разрешение 544p
воркфлоу
#image2video #ComfyUI
Обновка опенсорсного генератора видео по картинке, разрешение 544p
воркфлоу
#image2video #ComfyUI
🔥9👍5🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Dialog 1.0
Новая голосовая диалоговая модель от Play AI (aka PlayHT)
"Ультраэмоциональная"
Рилтайм, задержка 303 мс
30+ языков, русский есть
до 48КГц
Возможности:
- клонирование голоса
- ИИ подкасты из PDF, картинок, текстов
- голосовые агенты
- API
- рилтайм среда - диктор или диалог 2 голоса
Попробовать
#voicecloning #text2speech #tts #agent #podcast
Новая голосовая диалоговая модель от Play AI (aka PlayHT)
"Ультраэмоциональная"
Рилтайм, задержка 303 мс
30+ языков, русский есть
до 48КГц
Возможности:
- клонирование голоса
- ИИ подкасты из PDF, картинок, текстов
- голосовые агенты
- API
- рилтайм среда - диктор или диалог 2 голоса
Попробовать
#voicecloning #text2speech #tts #agent #podcast
👍11👎1
This media is not supported in your browser
VIEW IN TELEGRAM
BEN2: Background Erase Network
Удаление фона с изображений и видео
Ест 3.5 ГБ VRAM, скорость 3fps на RTX3090
Демоспейс выдает RGB mp4 с зеленкой, естественно без альфы
Демо
Код
Веса
Попробовать на офсайте
#bg #bgremoval #image2matte #video2matte
Удаление фона с изображений и видео
Ест 3.5 ГБ VRAM, скорость 3fps на RTX3090
Демоспейс выдает RGB mp4 с зеленкой, естественно без альфы
Демо
Код
Веса
Попробовать на офсайте
#bg #bgremoval #image2matte #video2matte
🔥11👍5🤔2💯2
Сравнение опенсорсных видеогенераторов от подписчика Mr. D
Сделано запросом к DeepResearch
высокие цифры = лучшие для пользователя
Hunyuan на диаграмме: 🤘
#comparison
Сделано запросом к DeepResearch
высокие цифры = лучшие для пользователя
Hunyuan на диаграмме: 🤘
#comparison
👍7💩5😁2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Diffusion-Eraser
Инпейнтинг на gradio
Никаких настроек, только выделение области кистью
Что под капотом непонятно
Попробовал - рисует фигню
Ну пусть будет на всякий случай
#inpainting
Инпейнтинг на gradio
Никаких настроек, только выделение области кистью
Что под капотом непонятно
Попробовал - рисует фигню
Ну пусть будет на всякий случай
#inpainting
👀6👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Auffusion: Leveraging the Power of Diffusion and Large Language Models for Text-to-Audio Generation
Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке
Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий
Демо
Код
Колаб ноутбуки
#text2audio #tta #audio2audio #audioinpainting
Генератор звука по тексту, по входному звуку, инпейнтинг звука, примеры по ссылке в заголовке
Умеет:
- контроль акустики
- контроль материала предметов, издающих звук
- контроль высоты тона
- контроль хронологии событий
Демо
Код
Колаб ноутбуки
#text2audio #tta #audio2audio #audioinpainting
👍6
LightDiffusion-Next
Новая оболочка для диффузных генераторов картинок, хвастается тем что на 30% быстрее ComfyUI
Функционал пока скупой
Ладно, запомним на будущее
Гитхаб
Демо
Обсуждение на реддит
#text2image #tools #gui
Новая оболочка для диффузных генераторов картинок, хвастается тем что на 30% быстрее ComfyUI
Функционал пока скупой
Ладно, запомним на будущее
Гитхаб
Демо
Обсуждение на реддит
#text2image #tools #gui
👍9❤1
Replit: Idea to app, fast
Отличный заход от replit, который когда-то просто был для меня сайтом для упражнений на питоне.
Предлагают юзерам смартфонов без опыта в программировании создавать приложения по текстовому запросу
AppStore
GooglePlay
#iOS #coding #assistant #android
Отличный заход от replit, который когда-то просто был для меня сайтом для упражнений на питоне.
Предлагают юзерам смартфонов без опыта в программировании создавать приложения по текстовому запросу
AppStore
GooglePlay
#iOS #coding #assistant #android
👍9🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
SWE Arena: An Open Evaluation Platform for Vibe Coding
А вот и арена вайб-кодинга (заходим с чужеземного IP)
vibe coding - термин Андрея Карпаты. Если кратко, это когда вы вообще не программируете сами, а просто полностью доверяетесь ИИ.
#arena #coding #vibecoding
А вот и арена вайб-кодинга (заходим с чужеземного IP)
vibe coding - термин Андрея Карпаты. Если кратко, это когда вы вообще не программируете сами, а просто полностью доверяетесь ИИ.
Вы полностью отдаетесь вибрациям и забываете, что код вообще существует. Я пользуюсь голосовым вводом, поэтому практически не касаюсь клавиатуры.
#arena #coding #vibecoding
👍9😁2🥴1