This media is not supported in your browser
VIEW IN TELEGRAM
ActionMesh: Animated 3D Mesh Generation with Temporal 3D Diffusion
Экстремисты здорового человека
FB продолжают радовать народ опенсорсными моделями
ActionMesh генерит анимированный 3д-меш (без рига) из видео меньше чем за минуту (правда, на H100 - все по нынешним gpu-poor критериям)
git
x
paper
demo
project
Экстремисты здорового человека
FB продолжают радовать народ опенсорсными моделями
ActionMesh генерит анимированный 3д-меш (без рига) из видео меньше чем за минуту (правда, на H100 - все по нынешним gpu-poor критериям)
git
x
paper
demo
project
🔥13🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
Месяц спустя бахнули kling 2.6 motion control в Mago.
I am speed 😵💫
Норм липсинк, в целом хороший апгрейд по сравнению с wan animate v1
Исходный видос слева в углу тоже сгенеренный. Хороший лайфхак если нужно показать до и после, и не нарваться на страйк: берём инфлюенсера, генерим рандомного человека на первый кадр, анимируем. Затем загоняем по второму кругу и уже стилизуем по вкусу.
Тыкать тут
Норм липсинк, в целом хороший апгрейд по сравнению с wan animate v1
Исходный видос слева в углу тоже сгенеренный. Хороший лайфхак если нужно показать до и после, и не нарваться на страйк: берём инфлюенсера, генерим рандомного человека на первый кадр, анимируем. Затем загоняем по второму кругу и уже стилизуем по вкусу.
Тыкать тут
🔥15🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
Портативный симулятор соседа
🔥29👍4😱3🤡3👀3❤2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Интересно, что происходит с лицом elevenlabs после выхода Qwen3 TTS?
Модели 0.6b и 1.7b запустить можно на каждом втором чайнике.
🐦 tweet
💻 git
🧩 comfy nodes
🎥 yt туториал
📦 веса
🚀демо
Модели 0.6b и 1.7b запустить можно на каждом втором чайнике.
🐦 tweet
💻 git
🧩 comfy nodes
🎥 yt туториал
📦 веса
🚀демо
4🔥44😱8😁2❤1🤣1
https://www.youtube.com/watch?v=HHNLfxBxcvo
Террария неожиданно живёт, даром что инди.
Интересно, переживет ли Ubisoft? 😁
Террария неожиданно живёт, даром что инди.
Интересно, переживет ли Ubisoft? 😁
YouTube
Terraria 1.4.5 Bigger & Boulder Official Trailer
Terraria 1.4.5 is launching on January 27th, Bigger and Boulder than ever before! Check out some of the new changes and content in the brand new trailer... and stay tuned for the full launch posts and changelog on launch day!
❤12🔥7🤡2
Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders
Попытка пересадить эти ваши диффузии с иглы vae на rae.
Основная разница в том, что с rae латент больше отражает сущности нежели текстуры.
Если завалящий sd vae жмет rgb картинку 1024х1024х3 в 128х128х4, rae - в 64х64х1024
Так как даже в unet архитектуре stable diffusion основным ботлнеком по памяти был все равно аттеншен, новый подход позволяет обойти эту проблему, тк он больше чувствителен к количеству токенов, чем их размерности.
Модели на таком латентном пространстве учатся быстрее, инференсятся за меньшее количество шагов (хоть и более тяжёлых), все счастливы.
Все потому, что vae latent это просто уменьшенная картинка, а rae - семантическое описание сцены с общим указанием координат.
Hf paper
Попытка пересадить эти ваши диффузии с иглы vae на rae.
Основная разница в том, что с rae латент больше отражает сущности нежели текстуры.
Если завалящий sd vae жмет rgb картинку 1024х1024х3 в 128х128х4, rae - в 64х64х1024
Так как даже в unet архитектуре stable diffusion основным ботлнеком по памяти был все равно аттеншен, новый подход позволяет обойти эту проблему, тк он больше чувствителен к количеству токенов, чем их размерности.
Модели на таком латентном пространстве учатся быстрее, инференсятся за меньшее количество шагов (хоть и более тяжёлых), все счастливы.
Все потому, что vae latent это просто уменьшенная картинка, а rae - семантическое описание сцены с общим указанием координат.
Hf paper
🔥8❤5👨💻2👀2🤡1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Интересно, как народ комбинирует 3Д-генераторы.
У каждого есть свои сильные и слабые стороны.
По идее все это должно быть прикручено к Блендору максимально нативно. Вон ComfyUI-ноды прикрутили к Худини, пора с нодами Блендора сделать также.
Тут:
Images from Grok Imagine,
Tripo for raw 3D generation,
Hunyuan 3D Studio for lowpoly and UV unwrap,
Trellis2 in ComfyUI for texturing + upscaling.
Blender final preparation.
Unreal Engine / UEFN shaders.
А представьте, что вы читаете такое 3 года назад...
P.S. Колеса полностью сделаны в Блендоре
@cgevent
У каждого есть свои сильные и слабые стороны.
По идее все это должно быть прикручено к Блендору максимально нативно. Вон ComfyUI-ноды прикрутили к Худини, пора с нодами Блендора сделать также.
Тут:
Images from Grok Imagine,
Tripo for raw 3D generation,
Hunyuan 3D Studio for lowpoly and UV unwrap,
Trellis2 in ComfyUI for texturing + upscaling.
Blender final preparation.
Unreal Engine / UEFN shaders.
А представьте, что вы читаете такое 3 года назад...
@cgevent
👍4❤1
Если вы до этого были не в состоянии попросить Claude code развернуть clawdbot на виртуалке, вот пошаговый гайд
Если вы жили под камнем, clawdbot - Jarvis у нас дома. Локальный ассистент, который может ходить в интернет, рендерить в канвасе, юзать Клод и чатгпт по апи, и все это в вашем любимом мессенджере (кроме парковочного)
Помнитвсе твои трещинки переписку, можно добавлять скилы из хаба тут
Само собой это опенсорс+ агент, поэтому секурные риски надо иметь в виду, равно как и торчащие наружу порты с вашей виртуалки.
Git (50k ⭐ за январь)
Сайт
@derplearning
Если вы жили под камнем, clawdbot - Jarvis у нас дома. Локальный ассистент, который может ходить в интернет, рендерить в канвасе, юзать Клод и чатгпт по апи, и все это в вашем любимом мессенджере (кроме парковочного)
Помнит
Само собой это опенсорс+ агент, поэтому секурные риски надо иметь в виду, равно как и торчащие наружу порты с вашей виртуалки.
Git (50k ⭐ за январь)
Сайт
@derplearning
🔥9❤2👍2
QMD - Quick Markdown Search
Ну и полезная тулза для этих ваших агентов - полноценный локальный поиск.
Чтобы не жрали токены, как не в себя, грепая поштучно файлы из вашей базы знаний.
BM25 full-text search, vector semantic search, and LLM re-ranking на llama.cpp, поддержка MCP.
Git
Ну и полезная тулза для этих ваших агентов - полноценный локальный поиск.
Чтобы не жрали токены, как не в себя, грепая поштучно файлы из вашей базы знаний.
BM25 full-text search, vector semantic search, and LLM re-ranking на llama.cpp, поддержка MCP.
Git
GitHub
GitHub - tobi/qmd: mini cli search engine for your docs, knowledge bases, meeting notes, whatever. Tracking current sota approaches…
mini cli search engine for your docs, knowledge bases, meeting notes, whatever. Tracking current sota approaches while being all local - tobi/qmd
🔥22❤2
Forwarded from Борис опять
На днях обсуждали с админом @pseudolabeling, что автоматические фильтры резюме совсем оборзели. Некоторые ребята которых я менторил из-за этого вручную оптимизировали резюме под каждую вакансию. Почему бы не автоматизировать?
Навайбкодил за два вечера hr-breaker:
1. Загружаете резюме
2. Даете ссылку на вакансию
3. LLM вооруженная тулколами генерирует оптимизированное резюме (в том числе по советам из методички)
4. Делаются стандартные проверки: keyword matching, vector similarity, проверка LLM-кой (в том числе визуально, что всё не поехало), проверка на галлюцинации, проверка на очевидный AI-generated текст
5. Если хотя бы одна проверка не пройдена оптимизация продолжается
Важно, что всё сконфигурировано не врать и не изобретать опыта которого нет, поэтому получается очень неплохо. Но если у вас нет совести ничто вам не мешает поиграться с промптами🤗
Скачиваете, подставляете свой ключ Gemini API,
@boris_again
Навайбкодил за два вечера hr-breaker:
1. Загружаете резюме
2. Даете ссылку на вакансию
3. LLM вооруженная тулколами генерирует оптимизированное резюме (в том числе по советам из методички)
4. Делаются стандартные проверки: keyword matching, vector similarity, проверка LLM-кой (в том числе визуально, что всё не поехало), проверка на галлюцинации, проверка на очевидный AI-generated текст
5. Если хотя бы одна проверка не пройдена оптимизация продолжается
Важно, что всё сконфигурировано не врать и не изобретать опыта которого нет, поэтому получается очень неплохо. Но если у вас нет совести ничто вам не мешает поиграться с промптами
Скачиваете, подставляете свой ключ Gemini API,
uv run и уничтожаете скрининг как явление. Добейте выживших@boris_again
Please open Telegram to view this post
VIEW IN TELEGRAM
🫡17❤6🤡4😢3🤬1