#оффтоп
Разбавлю вашу новогоднюю ленту "пулянино" Маттиаса Кранца
Этот чувак вытворяет всякие штуки с пианино и иногда другими инструментами. Например, он выдоил из пауков 6 км паутины чтобы сделать из нее гитарные струны. Заменил все молоточки в пианино на обычные молотки. Настроил все ноты в пианино на Ми.
А сегодня послушайте пианино, сделанное из пейнтбольных винтовок и живых людей.
https://www.youtube.com/watch?v=yFIxf2gTg_k
Разбавлю вашу новогоднюю ленту "пулянино" Маттиаса Кранца
Этот чувак вытворяет всякие штуки с пианино и иногда другими инструментами. Например, он выдоил из пауков 6 км паутины чтобы сделать из нее гитарные струны. Заменил все молоточки в пианино на обычные молотки. Настроил все ноты в пианино на Ми.
А сегодня послушайте пианино, сделанное из пейнтбольных винтовок и живых людей.
https://www.youtube.com/watch?v=yFIxf2gTg_k
YouTube
Gun piano should be illegal
If you’re struggling, consider therapy with our paid partner. Click https://betterhelp.com/mattias for a discount on your first month of therapy.
---------
Join this channel to get access to perks:
https://www.youtube.com/channel/UCEgm-3RvRn4nCR-fGGVsfdQ/join…
---------
Join this channel to get access to perks:
https://www.youtube.com/channel/UCEgm-3RvRn4nCR-fGGVsfdQ/join…
🔥4💩1👌1
StereoCrafter: Diffusion-based Generation of Long and High-fidelity Stereoscopic 3D from Monocular Videos
Модель для преобразования обычного видео в стерео 3D от Tencent
Может помните времена когда было модно выпускать кино в 3D. И чтобы не заморачиваться на съемках и основном посте, делали стереоконверсию фильма. На это нужны были армии ротоскоперов. А теперь эта задача становится намного дешевле
Код
#stereoconversion
Модель для преобразования обычного видео в стерео 3D от Tencent
Может помните времена когда было модно выпускать кино в 3D. И чтобы не заморачиваться на съемках и основном посте, делали стереоконверсию фильма. На это нужны были армии ротоскоперов. А теперь эта задача становится намного дешевле
Код
#stereoconversion
👍7❤1🔥1
GenWarp: Single Image to Novel Views with Semantic-Preserving Generative Warping
модель генерирует правдоподобные новые ракурсы по одному входному изображению.
Созданные новые ракурсы можно использовать для 3D-реконструкции. В приведенном на видео примере реконструкция 3D-сцены с помощью InstantSplat
Код
Демо
#novelview
модель генерирует правдоподобные новые ракурсы по одному входному изображению.
Созданные новые ракурсы можно использовать для 3D-реконструкции. В приведенном на видео примере реконструкция 3D-сцены с помощью InstantSplat
Код
Демо
#novelview
👍7❤2
Aria-UI: Visual Grounding for GUI Instructions
Быстрый легковесный ИИ-агент для выполнения задач на устройстве пользователя через взаимодействие с пользовательским интерфейсом
Код
Демо
#assistant #agent
Быстрый легковесный ИИ-агент для выполнения задач на устройстве пользователя через взаимодействие с пользовательским интерфейсом
Код
Демо
#assistant #agent
👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Animate AI
Генератор анимации с консистентными персонажами
записаться в вейтлист
#image2video #text2video #cartoon
Генератор анимации с консистентными персонажами
записаться в вейтлист
#image2video #text2video #cartoon
👍8🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
OCTAVE (Omni-Capable Text and Voice Engine)
Генератор речи следующего поколения от Hume AI.
Сочетает возможности EVI 2 с возможностями таких систем, как Voice Engine от OpenAI, TTS Voice Design от Elevenlab и NotebookLM от Google Deepmind
OCTAVE может генерировать любой голос и индивидуальность - и сопровождающий язык – по подсказке, имитируя пол, возраст, акцент, вокальный регистр, эмоциональную интонацию, стили речи.
Клонирует голос, акцент и индивидуальность любого говорящего из шумной записи продолжительностью всего в 5 секунд.
Общается голосом в реальном времени. Может создать несколько агентов, общающихся между собой, как в NotebookLM, только в реальном времени.
Сейчас идет тестирование "безопасности" модели кругом избранных, осторожничают
#realtime #text2speech #tts #voicecloning
Генератор речи следующего поколения от Hume AI.
Сочетает возможности EVI 2 с возможностями таких систем, как Voice Engine от OpenAI, TTS Voice Design от Elevenlab и NotebookLM от Google Deepmind
OCTAVE может генерировать любой голос и индивидуальность - и сопровождающий язык – по подсказке, имитируя пол, возраст, акцент, вокальный регистр, эмоциональную интонацию, стили речи.
Клонирует голос, акцент и индивидуальность любого говорящего из шумной записи продолжительностью всего в 5 секунд.
Общается голосом в реальном времени. Может создать несколько агентов, общающихся между собой, как в NotebookLM, только в реальном времени.
Сейчас идет тестирование "безопасности" модели кругом избранных, осторожничают
#realtime #text2speech #tts #voicecloning
🔥12🤔2👍1🥴1
This media is not supported in your browser
VIEW IN TELEGRAM
Опубликован код генератора 3D сцен на гауссианах по картинке WonderWorld
Код
#gaussian #image2scene #imageto3d
Код
#gaussian #image2scene #imageto3d
🔥11
Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis
Масштабируемый трансформер для быстрой генерации картинок от Yandex Research. Приятно под занавес года увидеть отечественный релиз.
По словам разработчиков, превосходит существующие авторегрессионные (AR) модели и тягается наравне с ведущими диффузными моделями по качеству, при этом обходя их в 7 раз по скорости.
Код
Демо 512
Демо 1024
#text2image
Масштабируемый трансформер для быстрой генерации картинок от Yandex Research. Приятно под занавес года увидеть отечественный релиз.
По словам разработчиков, превосходит существующие авторегрессионные (AR) модели и тягается наравне с ведущими диффузными моделями по качеству, при этом обходя их в 7 раз по скорости.
Код
Демо 512
Демо 1024
#text2image
👍9❤3🤔2🔥1💩1
1.58-bit FLUX
Bytedance и POSTECH квантизовали FLUX [dev].
Квантизованная модель требует для инференса в 5 раз меньше VRAM и занимает на диске в 7.7 раз меньше места.
К сожалению, есть только препринт, а ссылка из препринта ведет на несуществующий сайт. Ждем
#news #optimization #flux
Bytedance и POSTECH квантизовали FLUX [dev].
Квантизованная модель требует для инференса в 5 раз меньше VRAM и занимает на диске в 7.7 раз меньше места.
К сожалению, есть только препринт, а ссылка из препринта ведет на несуществующий сайт. Ждем
#news #optimization #flux
👍12🔥2
DepthLab: From Partial to Complete
инпейнт карт глубины на основе диффузионных моделей.
Пригодно для заполнения недостающих данных, инпейнтинга 3D сцен, генерации оных по набору некалиброваных изображений или по тексту.
Код
Веса
#inpainting #image2depth
инпейнт карт глубины на основе диффузионных моделей.
Пригодно для заполнения недостающих данных, инпейнтинга 3D сцен, генерации оных по набору некалиброваных изображений или по тексту.
Код
Веса
#inpainting #image2depth
🔥5👍2❤1