Derp Learning – Telegram
Derp Learning
13.1K subscribers
3.2K photos
929 videos
9 files
1.34K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Энциклопедия LTX.

Для тех, кто локально генерит видосы.

Собрано всё самое годное:
Промпт гайды
Веса
Чекпойнты
Дистиляты
Кванты
Апскейлеры
Ггуфы
Текстовые енкодеры
VAEs
Embedding Connectors
Лоры(много)
Разные воркфлоу

В общем ЛТХ Клондайк

https://github.com/wildminder/awesome-ltx2

@cgevent
18👍1
Forwarded from Alina Rin 🐟
Media is too big
VIEW IN TELEGRAM
Warner Music China представила свою первую ИИ-певицу по имени AI-Hua. С её участием уже выпустили дебютный клип в ретро-стилистике гонконгских кунг-фу боевиков.

Блин, а мне нравится, кстати.
🔥20🗿201
This media is not supported in your browser
VIEW IN TELEGRAM
Пока что лучший гаррипоттерный слоп во Вьетнаме
🗿24🤣12🤡5👍42👀1
Вот это я понимаю рисерч, а не эти ваши ллм.
🏆45😁1613🤡4🔥2🤩1💯1
Segment anything ... Fast

GPU-poor актуалочка

Взяли segment-anything, навалили всего, до чего дотянулись git clone руки:

- bfloat16
- torch.compile with max-autotune
- torch.scaled_dot_product_attention
- A custom Triton kernel that implements SDPA for relative positional encodings for long sequence lengths
- NestedTensors
- Dynamic int8 symmetric quantization
- 2:4 sparse format

Ускорили х2.5 по сравнению с BF16,
точность падает только на sparse, 0.53 -> 0.48

С fp32 сравнивать не буду, они б еще fp64 за бейзлайн взяли

git
blog
👍11🤣2
This media is not supported in your browser
VIEW IN TELEGRAM
Ну а как только ИИ научится есть спагетти, дни Уилла Смита будут сочтены.
1😁50🔥65😢5
Вышел pytorch 2.10

Хайлайты релиза:
- Поддержка Python 3.14 для torch.compile().
Python 3.14t (freethreaded build) также поддерживается в экспериментальном режиме.
- Снижение оверхеда на запуск кернелов благодаря combo-kernels и horizontal fusion в torchinductor.
- Новый оператор varlen_attn(), обеспечивающий поддержку ragged и packed сиквенсов.
- Эффективные разложения на собственные значения с использованием DnXgeev.
- Оптимизации производительности и расширения функциональности для Intel GPU.
- torch.compile() теперь поддерживает use_deterministic_mode.
- DebugMode для отслеживания dispatch-реквестов и отладки расхождения малых чисел.

Такие вот дитейлз.

Blog
1👍10🔥21
😁50🔥21
This media is not supported in your browser
VIEW IN TELEGRAM
ActionMesh: Animated 3D Mesh Generation with Temporal 3D Diffusion

Экстремисты здорового человека

FB продолжают радовать народ опенсорсными моделями

ActionMesh генерит анимированный 3д-меш (без рига) из видео меньше чем за минуту (правда, на H100 - все по нынешним gpu-poor критериям)

git
x
paper
demo
project
🔥13🗿1
💯54😁216🤡4
This media is not supported in your browser
VIEW IN TELEGRAM
Месяц спустя бахнули kling 2.6 motion control в Mago.
I am speed 😵‍💫

Норм липсинк, в целом хороший апгрейд по сравнению с wan animate v1

Исходный видос слева в углу тоже сгенеренный. Хороший лайфхак если нужно показать до и после, и не нарваться на страйк: берём инфлюенсера, генерим рандомного человека на первый кадр, анимируем. Затем загоняем по второму кругу и уже стилизуем по вкусу.

Тыкать тут
🔥15🗿1
🤩23👍7😁5🤡4😢32🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
Портативный симулятор соседа
🔥29👍4😱3🤡3👀32😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Интересно, что происходит с лицом elevenlabs после выхода Qwen3 TTS?

Модели 0.6b и 1.7b запустить можно на каждом втором чайнике.

🐦 tweet
💻 git
🧩 comfy nodes
🎥 yt туториал
📦 веса
🚀демо
4🔥44😱8😁21🤣1
😁56💯7😢5
Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

Попытка пересадить эти ваши диффузии с иглы vae на rae.

Основная разница в том, что с rae латент больше отражает сущности нежели текстуры.

Если завалящий sd vae жмет rgb картинку 1024х1024х3 в 128х128х4, rae - в 64х64х1024

Так как даже в unet архитектуре stable diffusion основным ботлнеком по памяти был все равно аттеншен, новый подход позволяет обойти эту проблему, тк он больше чувствителен к количеству токенов, чем их размерности.

Модели на таком латентном пространстве учатся быстрее, инференсятся за меньшее количество шагов (хоть и более тяжёлых), все счастливы.

Все потому, что vae latent это просто уменьшенная картинка, а rae - семантическое описание сцены с общим указанием координат.

Hf paper
🔥85👨‍💻2👀2🤡1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Интересно, как народ комбинирует 3Д-генераторы.

У каждого есть свои сильные и слабые стороны.
По идее все это должно быть прикручено к Блендору максимально нативно. Вон ComfyUI-ноды прикрутили к Худини, пора с нодами Блендора сделать также.

Тут:
Images from Grok Imagine,
Tripo for raw 3D generation,
Hunyuan 3D Studio for lowpoly and UV unwrap,
Trellis2 in ComfyUI for texturing + upscaling.
Blender final preparation.
Unreal Engine / UEFN shaders.

А представьте, что вы читаете такое 3 года назад...

P.S. Колеса полностью сделаны в Блендоре

@cgevent
👍41
😁66💯21🤣9
Mmo chess doesn't exist, it can't hurt you.
Mmo chess:
😁508🔥3🤡1
Для тех, кто ещё не понял, что происходит
4😱39🤡7💯5🤣3🗿211