🔥1
From Kernel Regression to Attention Mechanisms
Связь ядерной регрессии с аттеншеном в картинках.
Sparse Hash AI
Связь ядерной регрессии с аттеншеном в картинках.
Sparse Hash AI
Google Docs
From Regression to Attention (Public)
From Kernel Regression to Attention Mechanisms A six decade journey (1960-2020) Peyman Milanfar Google
👍2
Less is More: Recursive Reasoning with Tiny Networks
https://arxiv.org/abs/2510.04871
https://alexiajm.github.io/2025/09/29/tiny_recursive_models.html
Рекурсивная модель рассуждений, развитие идеи из Hierarchical Reasoning Model (HRM). Размером всего в 7 млн параметров и выбивает 45% на ARC-AGI-1 и 8% на ARC-AGI-2.
Tiny Recursion Model (TRM) упрощает рекурсивные рассуждения до их основной сути, которая в конечном итоге не имеет ничего общего с человеческим мозгом, не требует ни математической (fixed-point) теоремы, ни какой-либо иерархии.
Sparse Hash AI
https://arxiv.org/abs/2510.04871
https://alexiajm.github.io/2025/09/29/tiny_recursive_models.html
Рекурсивная модель рассуждений, развитие идеи из Hierarchical Reasoning Model (HRM). Размером всего в 7 млн параметров и выбивает 45% на ARC-AGI-1 и 8% на ARC-AGI-2.
Tiny Recursion Model (TRM) упрощает рекурсивные рассуждения до их основной сути, которая в конечном итоге не имеет ничего общего с человеческим мозгом, не требует ни математической (fixed-point) теоремы, ни какой-либо иерархии.
Sparse Hash AI
👍2
Цепи Маркова — математика предсказаний [Veritasium]
https://www.youtube.com/watch?v=QI7oUwNrQ34
Sparse Hash AI
https://www.youtube.com/watch?v=QI7oUwNrQ34
Sparse Hash AI
YouTube
Цепи Маркова — математика предсказаний [Veritasium]
По вопросам рекламы: vertdider@blossom-agency.ru
Поддержать проект можно по ссылкам:
Если вы в России: https://boosty.to/vertdider
Если вы не в России: https://www.patreon.com/VertDider
Сколько раз нужно перетасовать колоду, чтобы порядок карт стал абсолютно…
Поддержать проект можно по ссылкам:
Если вы в России: https://boosty.to/vertdider
Если вы не в России: https://www.patreon.com/VertDider
Сколько раз нужно перетасовать колоду, чтобы порядок карт стал абсолютно…
👍3
🔥2
Sparse Hash AI
Sparse Hash AI
Играют биоэлектрические сигналы подберёзовика.
https://d.fixupx.com/Rainmaker1973/status/1976618087928782898
Sparse Hash AI
https://d.fixupx.com/Rainmaker1973/status/1976618087928782898
Sparse Hash AI
🤔1
Демонстрационное видео от Kreuzberg Dynamics, Mark 003.
Это было вСимпсонах Кибердеревне.
Sparse Hash AI
Это было в
Sparse Hash AI
🔥2
Base Models Know How to Reason, Thinking Models Learn When
https://www.alphaxiv.org/overview/2510.07364v1
https://github.com/cvenhoff/thinking-llms-interp
https://thinking-llms-interp.com/
https://fixupx.com/cvenhoff00/status/1976633766811734461
Модели мышления не осваивают навыки мышления. Базовые модели уже содержат механизмы рассуждения, а модели мышления учатся, когда их использовать!
Sparse Hash AI
https://www.alphaxiv.org/overview/2510.07364v1
https://github.com/cvenhoff/thinking-llms-interp
https://thinking-llms-interp.com/
https://fixupx.com/cvenhoff00/status/1976633766811734461
Модели мышления не осваивают навыки мышления. Базовые модели уже содержат механизмы рассуждения, а модели мышления учатся, когда их использовать!
Sparse Hash AI
👍1
Attention Illuminates LLM Reasoning: The Preplan-and-Anchor Rhythm Enables Fine-Grained Policy Optimization
https://www.alphaxiv.org/ru/overview/2510.13554v1
Исследование показывает, как паттерны внимания в LLM могут пролить свет на их процессы рассуждения и обеспечить более эффективные методы обучения. Авторы демонстрируют, что механизмы внимания служат «механистическим планом» для рассуждений, раскрывая внутренний «ритм предварительного планирования и закрепления», который управляет тем, как эти модели структурируют свои мысли.
Sparse Hash AI
https://www.alphaxiv.org/ru/overview/2510.13554v1
Исследование показывает, как паттерны внимания в LLM могут пролить свет на их процессы рассуждения и обеспечить более эффективные методы обучения. Авторы демонстрируют, что механизмы внимания служат «механистическим планом» для рассуждений, раскрывая внутренний «ритм предварительного планирования и закрепления», который управляет тем, как эти модели структурируют свои мысли.
Sparse Hash AI
👍2