This media is not supported in your browser
VIEW IN TELEGRAM
moonshine-live
Распознавание речи в реальном времени на Moonshine
Демо
Модели
#speech2text #ASR #subnoscripts #realtime
Распознавание речи в реальном времени на Moonshine
Демо
Модели
#speech2text #ASR #subnoscripts #realtime
🔥4
MASt3R-SLAM: Real-Time Dense SLAM with 3D Reconstruction Priors
Реконструкция сцен реального мира по одному видео в реальном времени, 15 кадров в секунду на RTX 4090
Код
#video2scene #rendering #videoto3D
Реконструкция сцен реального мира по одному видео в реальном времени, 15 кадров в секунду на RTX 4090
Код
#video2scene #rendering #videoto3D
👍19🤯6🔥2
GPT-4.5
Open AI выпустили новую языковую модель
Доступна для подписчиков Pro
На следующе неделе выдадут тем у кого Plus
#news #assistant #reasoning
Open AI выпустили новую языковую модель
Доступна для подписчиков Pro
На следующе неделе выдадут тем у кого Plus
#news #assistant #reasoning
👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
3DTopia-XL: Scaling High-quality 3D Asset Generation via Primitive Diffusion
Диффузный генератор высококачественных 3D PBR ассетов по тексту.
Процесс занимает 5 секунд
Ключевая идея - кодирование 3D-меша, текстуры и материалов в компактный тензор N x D. это называется PrimX
Код
Демо (еще не работает)
#PBR #textto3d
Диффузный генератор высококачественных 3D PBR ассетов по тексту.
Процесс занимает 5 секунд
Ключевая идея - кодирование 3D-меша, текстуры и материалов в компактный тензор N x D. это называется PrimX
Код
Демо (еще не работает)
#PBR #textto3d
🔥4🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Motion Prediction
Wonder Dynamics выпустили модель для точной реконструкции движений актера, даже там где он перекрыт другими объектами в кадре
#video2pose
Wonder Dynamics выпустили модель для точной реконструкции движений актера, даже там где он перекрыт другими объектами в кадре
#video2pose
🔥9🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
ImageTo3D
Создает 3D локацию из любой картинки
Сделано в Claude 3.7
Бесполезно, но вы ведь уже знаете что с этим делать
Твит автора
#imageto3d
Создает 3D локацию из любой картинки
Сделано в Claude 3.7
Бесполезно, но вы ведь уже знаете что с этим делать
Твит автора
#imageto3d
😁14👍2🤷♂1
DreamEngine
Какая-то хитрая интеграция визуально-языковых моделей с диффузными генераторами для генерации крутых картинок со сложными концепциями
Сайта нет
Код ждем
#text2image #vlm #personalization
Какая-то хитрая интеграция визуально-языковых моделей с диффузными генераторами для генерации крутых картинок со сложными концепциями
Сайта нет
Код ждем
#text2image #vlm #personalization
👍6👎1
LuminaBrush
Экспериментальный проект lllyasviel, похожий на IC-Light
Эффект освещения задаем цветными мазками кисти и текстовым промптом, на выходе получаем наш картинку, где персонаж помещен в другие условия освещения.
Обработка происходит в два этапа. На первом этапе объект приводят к равномерному освещению. Из этого этапа автор сделал отдельную фичу, см второе демо.
Гитхаб - там кода нет, только описание и примеры, так обычно оформляют сайт проекта
Демо
Демо2 равномерное освещение
#relighting
Экспериментальный проект lllyasviel, похожий на IC-Light
Эффект освещения задаем цветными мазками кисти и текстовым промптом, на выходе получаем наш картинку, где персонаж помещен в другие условия освещения.
Обработка происходит в два этапа. На первом этапе объект приводят к равномерному освещению. Из этого этапа автор сделал отдельную фичу, см второе демо.
Гитхаб - там кода нет, только описание и примеры, так обычно оформляют сайт проекта
Демо
Демо2 равномерное освещение
#relighting
🔥9❤3
Distill Any Depth: Distillation Creates a Stronger Monocular Depth Estimator
И у нас новый лидер (SOTA, если не врут) в оценке глубины изображения
Код
Демо
#image2depth
И у нас новый лидер (SOTA, если не врут) в оценке глубины изображения
Код
Демо
#image2depth
👍14🔥3