Derp Learning – Telegram
Derp Learning
13.1K subscribers
3.2K photos
929 videos
9 files
1.34K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
😁56💯7😢5
Scaling Text-to-Image Diffusion Transformers with Representation Autoencoders

Попытка пересадить эти ваши диффузии с иглы vae на rae.

Основная разница в том, что с rae латент больше отражает сущности нежели текстуры.

Если завалящий sd vae жмет rgb картинку 1024х1024х3 в 128х128х4, rae - в 64х64х1024

Так как даже в unet архитектуре stable diffusion основным ботлнеком по памяти был все равно аттеншен, новый подход позволяет обойти эту проблему, тк он больше чувствителен к количеству токенов, чем их размерности.

Модели на таком латентном пространстве учатся быстрее, инференсятся за меньшее количество шагов (хоть и более тяжёлых), все счастливы.

Все потому, что vae latent это просто уменьшенная картинка, а rae - семантическое описание сцены с общим указанием координат.

Hf paper
🔥85👨‍💻2👀2🤡1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Интересно, как народ комбинирует 3Д-генераторы.

У каждого есть свои сильные и слабые стороны.
По идее все это должно быть прикручено к Блендору максимально нативно. Вон ComfyUI-ноды прикрутили к Худини, пора с нодами Блендора сделать также.

Тут:
Images from Grok Imagine,
Tripo for raw 3D generation,
Hunyuan 3D Studio for lowpoly and UV unwrap,
Trellis2 in ComfyUI for texturing + upscaling.
Blender final preparation.
Unreal Engine / UEFN shaders.

А представьте, что вы читаете такое 3 года назад...

P.S. Колеса полностью сделаны в Блендоре

@cgevent
👍41
😁66💯21🤣9
Mmo chess doesn't exist, it can't hurt you.
Mmo chess:
😁508🔥3🤡1
Для тех, кто ещё не понял, что происходит
4😱39🤡7💯5🤣3🗿211
Если вы до этого были не в состоянии попросить Claude code развернуть clawdbot на виртуалке, вот пошаговый гайд

Если вы жили под камнем, clawdbot - Jarvis у нас дома. Локальный ассистент, который может ходить в интернет, рендерить в канвасе, юзать Клод и чатгпт по апи, и все это в вашем любимом мессенджере (кроме парковочного)
Помнит все твои трещинки переписку, можно добавлять скилы из хаба тут

Само собой это опенсорс+ агент, поэтому секурные риски надо иметь в виду, равно как и торчащие наружу порты с вашей виртуалки.

Git (50k за январь)
Сайт

@derplearning
🔥92👍2
Forwarded from Stolen memes (al)
😁49🤣7
QMD - Quick Markdown Search

Ну и полезная тулза для этих ваших агентов - полноценный локальный поиск.
Чтобы не жрали токены, как не в себя, грепая поштучно файлы из вашей базы знаний.

BM25 full-text search, vector semantic search, and LLM re-ranking на llama.cpp, поддержка MCP.

Git
🔥222
Forwarded from Dev Meme / devmeme
😁6719🤩4
This media is not supported in your browser
VIEW IN TELEGRAM
Все сходится
1😁29🔥3👍2🤩1🗿1
Пора вводить термин слоп-бренды?
Трендовые лоры с хиггсфилда в ассортименте 😁
1😁30
Forwarded from Борис опять
На днях обсуждали с админом @pseudolabeling, что автоматические фильтры резюме совсем оборзели. Некоторые ребята которых я менторил из-за этого вручную оптимизировали резюме под каждую вакансию. Почему бы не автоматизировать?

Навайбкодил за два вечера hr-breaker:

1. Загружаете резюме
2. Даете ссылку на вакансию
3. LLM вооруженная тулколами генерирует оптимизированное резюме (в том числе по советам из методички)
4. Делаются стандартные проверки: keyword matching, vector similarity, проверка LLM-кой (в том числе визуально, что всё не поехало), проверка на галлюцинации, проверка на очевидный AI-generated текст
5. Если хотя бы одна проверка не пройдена оптимизация продолжается

Важно, что всё сконфигурировано не врать и не изобретать опыта которого нет, поэтому получается очень неплохо. Но если у вас нет совести ничто вам не мешает поиграться с промптами 🤗

Скачиваете, подставляете свой ключ Gemini API, uv run и уничтожаете скрининг как явление. Добейте выживших

@boris_again
Please open Telegram to view this post
VIEW IN TELEGRAM
🫡176🤡4😢3🤬1
This media is not supported in your browser
VIEW IN TELEGRAM
GTA 6 : Greenland edition
Google genie 3

Судя по всему, мы будем жить в матрице ещё до того, как выйдет гта 6.

@derplearning
136🔥15😢3🌚2
Derp Learning
GTA 6 : Greenland edition Google genie 3 Судя по всему, мы будем жить в матрице ещё до того, как выйдет гта 6. @derplearning
Нас наебали, расходимся 🤣

https://youtu.be/pXEVLaLNbH0?si=pgoPPnx9Y18gujUs

Оригинальный видос сделан через vid2vid в mago

Забавно, что автор твита уже дал заднюю, сказав что это всё шутка.
Правда, после того, как ему влепили community notice

Твит
Ориг видос
Опровержение
🤣10🤡2👍1
1🤣54😁91👍1🔥1😱1
Kimi K2.5 у нас дома + BitNet CPU Inference Optimization

Пока все отвлекались на Epstein Island: Christmas Edition GTA 6 Greenland,
unsloth, дай ему б-г здоровья, скачал и пожал Kimi K2.5 вплоть до читерского UD-TQ1_0, который 1 бит (или 1.58 не-маркетинговых битов)

Вся эта радость влезает на любое железо, где есть 256гб любой (sic!) памяти.

rtx 4090 24gb + 256gb ram/fast ssd = 5tokens/s для 1.58 бит.

Плюсом к этом GPU тоже больше нинужны, если у вас есть много свободного времени, так как:

Microsoft завезли оптимизаций для CPU-инференса в свой BitNet, и 1.58б квант Kimi K2.5 можно теперь гонять как не в себя, но это не точно.

tweet
bitnet github
веса
🤩82🌚2
Как перейти из телеграм админов в синьор мл инжиры меты? легко

https://huggingface.co/spaces/AlexWortega/hr-breaker

Два клика и в дамки
😁31
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросети официально убили кальянный рэп.

Как вам такое прочтение Jonh Carpenter's The Thing?

Prompt:
Dark cinematic neurofunk at 174 BPM, female Slavic vocals. Long evolving intro with bowed cello drones, Spanish guitar tremolo, and distant glitch textures over a mutating sub. Gradual tension build as rhythmic motifs and FX swirls thicken, then a sharp rise into skittering drums and panoramic cyberpunk sound design. Huge melodic bass drop in the chorus, bass carrying the main hook while vocals slice through. Second half leans into call‑and‑response between melodic bass and chopped vocal phrases, ending in a simmering, restless half‑time outro with sparse drums and echoing drones., dramatic, cello, dynamic, rhythmic, deep, minimal, frantic, neurofunk, glitch, very fast drums

текст в комментах если надо

Maybe the last thing we have in common
Is watching the same sun.
🔥11