NEW BOT Телеграм, страница

gonzo-обзоры ML статей

Отдельный интересный результат в том, что Coconut с k=0, то есть когда он вынужден генерировать обычную языковую цепочку CoT без латентных мыслей (но уже с парой токенов <bot>/<eot>), качество выше, чем у CoT, меньше галлюцинирует. Видимо, помогает процедура обучения с замешиванием разных этапов (а может и пара дополнительных токенов тоже).

Латентный ризонинг можно интерпретировать как поиск по дереву, если опираться на интуицию, что непрерывные мысли могут содержать более одного шага рассуждения. Так, первая мысль кокоса может выбрать всех детей узла графа, следующая — детей детей. Получается похоже на поиск в ширину (BFS), но не равномерный, а с вероятностями или приоритетами. В работе посчитали эти вероятности для примеров, получается неявная value function для исследования графа. По ощущению тут где-то рядом MCTS. И вообще выглядит, что обучили не непрерывный CoT, а непрерывный ToT.

По полученным вероятностям можно оценить степень параллелизма мыслей, если смотреть на кумулятивные значения top-1/2/3 кандидатов. У первых мыслей такой параллелизм (разница между линиями для top-1/top-2/top-3) выше, чем у вторых.

Латентное рассуждение позволяет модели отложить выбор конкретных слов и «обдумывать» варианты глубже по дереву поиска, оценивая узлы уже у самых листьев, где ошибочные пути легко выявить. Экспериментально видно, что уверенность модели обратно пропорциональна высоте узла: на малых высотах она чётко отделяет правильные варианты от неправильных, тогда как на больших это различие размывается — поэтому планирование в непрерывном латентном пространстве оказывается выгодным.

---

Интересный подход, он сильно перекликается с LCM (https://news.1rj.ru/str/gonzo_ML/3149), только в LCM сразу работали на уровне отдельных больших мыслей-предложений, а здесь скорее избавляются от токенов для промежуточных вычислений. Наверное, где-то посередине есть подход с латентными концептами для объектов, действий и свойств, пока вроде не видел такого. Верю глобально в это направление с латентным ризонингом и латентным всем. Thought vector is a thing.

In the meantime, прослушайте ~~пение дрозда~~ песню из шапки.

arXiv.org

Training Large Language Models to Reason in a Continuous Latent Space

Large language models (LLMs) are typically constrained to reason in the language space, where they express the reasoning process through a chain-of-thought (CoT) to solve complex problems....

👍27🔥4❤‍🔥2

4.31K views11:36

gonzo-обзоры ML статей

4.25K views11:37

gonzo-обзоры ML статей

4.21K views11:37

gonzo-обзоры ML статей

4.51K views11:38

gonzo-обзоры ML статей

4.6K views11:38

gonzo-обзоры ML статей

4.68K views11:38

gonzo-обзоры ML статей

4.87K views11:38

gonzo-обзоры ML статей

5.15K views11:39

gonzo-обзоры ML статей

5.06K views11:39

gonzo-обзоры ML статей

5.74K views11:39

gonzo-обзоры ML статей

6.4K views11:39

gonzo-обзоры ML статей

6.64K views11:40

gonzo-обзоры ML статей

6.69K views11:41

gonzo-обзоры ML статей

This media is not supported in your browser

VIEW IN TELEGRAM

6.98K views11:41

❤26

gonzo-обзоры ML статей

Just in case, бахнул авторазбор статьи про iCoT (https://arxiv.org/abs/2405.14838), которую упоминали в разборе Coconut'а (https://news.1rj.ru/str/gonzo_ML/3567). По мне так довольно полезно уже.

https://news.1rj.ru/str/gonzo_ML_podcasts/117

gonzo_ML_podcasts

From Explicit CoT to Implicit CoT: Learning to Internalize CoT Step by Step
Yuntian Deng, Yejin Choi, Stuart Shieber
Статья: https://arxiv.org/abs/2405.14838
Код: https://github.com/da03/Internalize_CoT_Step_by_Step

Эта статья посвящена ключевой проблеме…

🤯7👍3

6.58K views11:21

gonzo-обзоры ML статей

Работы, на которые надо обратить внимание

https://blog.iclr.cc/2025/04/22/announcing-the-outstanding-paper-awards-at-iclr-2025/

❤16😱1

6.74K views23:07

gonzo-обзоры ML статей

Концепция изменилась

😁116❤20👍3💔1

13.8K views13:09

gonzo-обзоры ML статей

Ну и раз мы сегодня про терминаторов, то вот есть прекрасный свежий THOUGHTTERMINATOR (https://news.1rj.ru/str/gonzo_ML_podcasts/123), заставляющий ризонинг модели не уходить в слишком глубокие обдумывания. Как полагается, обзор тоже сделан терминатором.

😎18😁5👍3❤1

7.31K views13:53

gonzo-обзоры ML статей

Это шедевр ящетаю!

6.59K views13:54

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

1😁64❤1

5.9K views13:54

gonzo-обзоры ML статей

Датасет DUMB500 — это тоже прекрасно, кстати!

❤7

6.06K views16:52

About

Blog

Apps

Platform