Sparse Hash AI – Telegram
Sparse Hash AI
134 subscribers
154 photos
257 videos
3 files
340 links
AI обогатительная разработка ML месторождений. Осторожно, в канале ведутся подрывные работы!

Персональный чат https://news.1rj.ru/str/sparsehash
Download Telegram
Forwarded from Алексей
Обучение без изменения весов

Ошибку предсказания следующего токена err распространим назад в указанную на картинке точку через матрицу 𝐖qkᵀ, то есть умножим ошибку на 𝐖qk, получим вектор 𝐕bp.

𝐕bp = err • 𝐖qk

Если вектор добавить в контекст 𝐗, конкатенировать, то это сработает как если бы сделали апдейт весов матрицы внимания 𝐖qk.

𝐗 = concat(𝐗, err • 𝐖qk)

На повторное предъявление входа 𝑥, в стриме будет вектор "выученного" следующего токена.
Forwarded from Алексей
Sparse Hash AI
https://habr.com/ru/companies/smartengines/articles/879088/
Прикольно как в альтернативной записи скалярного произведения входного вектора с весами исчезает интерпретация "взвешивания входа".

С этой "логарифмической" позиции это не взвешивание, а суммирование входа с весами.
OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models
https://omnihuman-lab.github.io/
This media is not supported in your browser
VIEW IN TELEGRAM
ELEGNT: Expressive and Functional Movement Design for Non-anthropomorphic Robot
https://arxiv.org/abs/2501.12493
1
Language Models Use Trigonometry to Do Addition
https://www.lesswrong.com/posts/E7z89FKLsHk5DkmDL/language-models-use-trigonometry-to-do-addition-1

https://arxiv.org/abs/2502.00873

https://x.com/thesubhashk/status/1887138694546788556

Для сложения чисел LLM кодирует их на спирали с разным периодом (2, 5, 10, 100). Алгоритму дали название "Clock algorithm".

MLP первой половины трансформера кодируют сумму на спирали, MLP второй половины декодируют результат в токен.

Как и в других похожих исследованиях внимание здесь занимается тем, что копирует операнды (числа) в стрим токена '=', с которым уже MLP проводят операции.
🔥1
Better & Faster Large Language Models via Multi-token Prediction
https://arxiv.org/abs/2404.19737

Голова трансформера способна из стрима вытаскивать не только следующий токен, но и токены в k-ой позиции.

В работе к телу трансформера прикрутили ещё несколько голов, которые делают Multi-token Prediction.
2
This media is not supported in your browser
VIEW IN TELEGRAM
Unitree сделала апгрейд своему андроиду G1.

Можно сравнить с моделью H1, которая выступала на фестивале всего пару недель назад, и с самим G1 месяц назад.
👍1🔥1
Media is too big
VIEW IN TELEGRAM
It's a collection of shots mostly using Midjourney Niji to Luma Ray 2, image to video. Audio from MMAudio and Suno.


X
This media is not supported in your browser
VIEW IN TELEGRAM
Protoclone

200 степеней свободы, более 1000 "Myofibers" (мускульных приводов) и 500 сенсоров.

https://www.clonerobotics.com/
https://x.com/clonerobotics
This media is not supported in your browser
VIEW IN TELEGRAM
Компания 1X Technologies представила NEO Gamma — гуманоидного робота нового поколения, предназначенного для домашнего использования.
Отличается походкой, похожей на человеческую, улучшенной манипуляцией объектами и мягкой, безопасной конструкцией. Собственная программа LLM от 1X обеспечивает естественное общение.

https://www.1x.tech/?=latest

X