Animate Anyone 2: High-Fidelity Character Image Animation with Environment Affordance
Второе поколение нейронки от Tongyi Lab и Alibaba Group. Кода к первому так и нет.
Заменяет персонажа на видео по одному фото.
Кода нет и не стоит губу раскатывать
#image2video #humananimation #characteranimation #pose2video
Второе поколение нейронки от Tongyi Lab и Alibaba Group. Кода к первому так и нет.
Заменяет персонажа на видео по одному фото.
Кода нет и не стоит губу раскатывать
#image2video #humananimation #characteranimation #pose2video
🔥7🤷♂1
Только что опубликован код реконструктора-рейтрейсера Radiant Foam
Рекомендуют уменьшать количество точек на открытых сценах чтобы влезало в 24Гб VRAM
Код
#raytracing #realtime
Рекомендуют уменьшать количество точек на открытых сценах чтобы влезало в 24Гб VRAM
Код
#raytracing #realtime
Telegram
Нейронавт | Нейросети в творчестве
Radiant Foam: Real-Time Differentiable Ray Tracing
Google Deepmind с соавторами придумали новый метод представления объемных сцен, который может вытеснить гауссианы.
называется Radiant Foam (лучевая пена, пена излучения???), позволяет быстро делать рейтрейс…
Google Deepmind с соавторами придумали новый метод представления объемных сцен, который может вытеснить гауссианы.
называется Radiant Foam (лучевая пена, пена излучения???), позволяет быстро делать рейтрейс…
🔥4🤔2❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
OmniParser V2
Вторая версия анализатора пользовательского интерфейса от Microsoft для ИИ-агентов
OmniTool - инструмент для управления виртуальной машиной Windows 11 с LLM на выбор
#screen2text #agent #assistant
Вторая версия анализатора пользовательского интерфейса от Microsoft для ИИ-агентов
OmniTool - инструмент для управления виртуальной машиной Windows 11 с LLM на выбор
#screen2text #agent #assistant
❤7👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Голосовая модель Zonos уже в браузере Pinokio.
Простая установка локально
#voicecloning #tts #text2speech
Простая установка локально
#voicecloning #tts #text2speech
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Step-Video-T2V
Новый опенсорсный китайский видеогенератор
30B параметров
544px992, 204кадров
80gb VRAM
Код
HF
Попробовать - вход по телефону. Мне по российскому телефону код пришел в телеграм
#text2video
Новый опенсорсный китайский видеогенератор
30B параметров
544px992, 204кадров
80gb VRAM
Код
HF
Попробовать - вход по телефону. Мне по российскому телефону код пришел в телеграм
#text2video
🔥10👍5❤1
Нейронавт | Нейросети в творчестве
Step-Video-T2V
попробовал Step-Video-T2V
Надо наверно подробнее описывать действие, а то стилл лайф какойто
Движение камеры понимает +-
#neuronaut_art
Надо наверно подробнее описывать действие, а то стилл лайф какойто
Движение камеры понимает +-
#neuronaut_art
👍8🔥2
Авторы MatAnyone запустили демоспейс, можно тестить
Демо
#segmentation #matting #video2matte #video2mask
Демо
#segmentation #matting #video2matte #video2mask
Telegram
Нейронавт | Нейросети в творчестве
MatAnyone: Stable Video Matting with Consistent Memory Propagation
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь…
Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. Но потеть не придется, целевая маска создается в несколько кликов.
Пока еще далеко от идеала, но надеюсь…
🔥11👍2
This media is not supported in your browser
VIEW IN TELEGRAM
CLaMP 3: Universal Music Information Retrieval Across Unaligned Modalities and Unseen Languages
Многоязычная (100 языков) мультимодальная платформа поиска музыкальной информации (MIR), поддерживающая ноты, аудио и сигналы исполнения (что это???)
Демо ищет музыку по тексту или по картинке в бенчмарке WikiMT-X из 1000 треков 20 века
Код
Демо
#search #music #musicsearch
Многоязычная (100 языков) мультимодальная платформа поиска музыкальной информации (MIR), поддерживающая ноты, аудио и сигналы исполнения (что это???)
Демо ищет музыку по тексту или по картинке в бенчмарке WikiMT-X из 1000 треков 20 века
Код
Демо
#search #music #musicsearch
👍11👏2
Grok 3
Ну очень умный, в двух вариантах Grok-3 и Grok-3 mini, причем веса еще нефинальные.
ворвался на вершину арены по всем лидербордам
По режиму рассуждений будут доступны два режима: просто Thinking и Thinking Hard.
Есть режим DeepSearch - аналог DeepResearch
Доступен премиум пользователям твиттера
А бесплатно можно попробовать на арене
#assistant #reasoning
Ну очень умный, в двух вариантах Grok-3 и Grok-3 mini, причем веса еще нефинальные.
ворвался на вершину арены по всем лидербордам
По режиму рассуждений будут доступны два режима: просто Thinking и Thinking Hard.
Есть режим DeepSearch - аналог DeepResearch
Доступен премиум пользователям твиттера
А бесплатно можно попробовать на арене
#assistant #reasoning
🔥9👍5👎2