Derp Learning – Telegram
Derp Learning
13.1K subscribers
3.2K photos
929 videos
9 files
1.34K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
😁50🔥21
This media is not supported in your browser
VIEW IN TELEGRAM
ActionMesh: Animated 3D Mesh Generation with Temporal 3D Diffusion

Экстремисты здорового человека

FB продолжают радовать народ опенсорсными моделями

ActionMesh генерит анимированный 3д-меш (без рига) из видео меньше чем за минуту (правда, на H100 - все по нынешним gpu-poor критериям)

git
x
paper
demo
project
🔥13🗿1
💯54😁216🤡4
This media is not supported in your browser
VIEW IN TELEGRAM
Месяц спустя бахнули kling 2.6 motion control в Mago.
I am speed 😵‍💫

Норм липсинк, в целом хороший апгрейд по сравнению с wan animate v1

Исходный видос слева в углу тоже сгенеренный. Хороший лайфхак если нужно показать до и после, и не нарваться на страйк: берём инфлюенсера, генерим рандомного человека на первый кадр, анимируем. Затем загоняем по второму кругу и уже стилизуем по вкусу.

Тыкать тут
🔥15🗿1
🤩23👍7😁5🤡4😢32🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
Портативный симулятор соседа
🔥29👍4😱3🤡3👀32😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Интересно, что происходит с лицом elevenlabs после выхода Qwen3 TTS?

Модели 0.6b и 1.7b запустить можно на каждом втором чайнике.

🐦 tweet
💻 git
🧩 comfy nodes
🎥 yt туториал
📦 веса
🚀демо
4🔥44😱8😁21🤣1
😁56💯7😢5
Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

Попытка пересадить эти ваши диффузии с иглы vae на rae.

Основная разница в том, что с rae латент больше отражает сущности нежели текстуры.

Если завалящий sd vae жмет rgb картинку 1024х1024х3 в 128х128х4, rae - в 64х64х1024

Так как даже в unet архитектуре stable diffusion основным ботлнеком по памяти был все равно аттеншен, новый подход позволяет обойти эту проблему, тк он больше чувствителен к количеству токенов, чем их размерности.

Модели на таком латентном пространстве учатся быстрее, инференсятся за меньшее количество шагов (хоть и более тяжёлых), все счастливы.

Все потому, что vae latent это просто уменьшенная картинка, а rae - семантическое описание сцены с общим указанием координат.

Hf paper
🔥85👨‍💻2👀2🤡1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Интересно, как народ комбинирует 3Д-генераторы.

У каждого есть свои сильные и слабые стороны.
По идее все это должно быть прикручено к Блендору максимально нативно. Вон ComfyUI-ноды прикрутили к Худини, пора с нодами Блендора сделать также.

Тут:
Images from Grok Imagine,
Tripo for raw 3D generation,
Hunyuan 3D Studio for lowpoly and UV unwrap,
Trellis2 in ComfyUI for texturing + upscaling.
Blender final preparation.
Unreal Engine / UEFN shaders.

А представьте, что вы читаете такое 3 года назад...

P.S. Колеса полностью сделаны в Блендоре

@cgevent
👍41
😁66💯21🤣9
Mmo chess doesn't exist, it can't hurt you.
Mmo chess:
😁508🔥3🤡1
Для тех, кто ещё не понял, что происходит
4😱39🤡7💯5🤣3🗿211
Если вы до этого были не в состоянии попросить Claude code развернуть clawdbot на виртуалке, вот пошаговый гайд

Если вы жили под камнем, clawdbot - Jarvis у нас дома. Локальный ассистент, который может ходить в интернет, рендерить в канвасе, юзать Клод и чатгпт по апи, и все это в вашем любимом мессенджере (кроме парковочного)
Помнит все твои трещинки переписку, можно добавлять скилы из хаба тут

Само собой это опенсорс+ агент, поэтому секурные риски надо иметь в виду, равно как и торчащие наружу порты с вашей виртуалки.

Git (50k за январь)
Сайт

@derplearning
🔥92👍2
Forwarded from Stolen memes (al)
😁49🤣7
QMD - Quick Markdown Search

Ну и полезная тулза для этих ваших агентов - полноценный локальный поиск.
Чтобы не жрали токены, как не в себя, грепая поштучно файлы из вашей базы знаний.

BM25 full-text search, vector semantic search, and LLM re-ranking на llama.cpp, поддержка MCP.

Git
🔥222
Forwarded from Dev Meme / devmeme
😁6719🤩4
This media is not supported in your browser
VIEW IN TELEGRAM
Все сходится
1😁29🔥3👍2🤩1🗿1
Пора вводить термин слоп-бренды?
Трендовые лоры с хиггсфилда в ассортименте 😁
1😁30
Forwarded from Борис опять
На днях обсуждали с админом @pseudolabeling, что автоматические фильтры резюме совсем оборзели. Некоторые ребята которых я менторил из-за этого вручную оптимизировали резюме под каждую вакансию. Почему бы не автоматизировать?

Навайбкодил за два вечера hr-breaker:

1. Загружаете резюме
2. Даете ссылку на вакансию
3. LLM вооруженная тулколами генерирует оптимизированное резюме (в том числе по советам из методички)
4. Делаются стандартные проверки: keyword matching, vector similarity, проверка LLM-кой (в том числе визуально, что всё не поехало), проверка на галлюцинации, проверка на очевидный AI-generated текст
5. Если хотя бы одна проверка не пройдена оптимизация продолжается

Важно, что всё сконфигурировано не врать и не изобретать опыта которого нет, поэтому получается очень неплохо. Но если у вас нет совести ничто вам не мешает поиграться с промптами 🤗

Скачиваете, подставляете свой ключ Gemini API, uv run и уничтожаете скрининг как явление. Добейте выживших

@boris_again
Please open Telegram to view this post
VIEW IN TELEGRAM
🫡176🤡4😢3🤬1