NEW BOT Телеграм, страница

The popular AI agent "Manus" launched in China is automating about 50 tasks, and the scenario is too dystopian.
It's said to be more accurate than DeepSeek.
It can simultaneously perform SNS analysis, financial transactions, research, purchasing, and more.

54 views19:05

Sparse Hash AI

красивое )

👍3

69 views13:47

Sparse Hash AI

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

В сингулярности, в которую провалились, становится не сразу понятно что перед глазами: очередной новый андроид на этой неделе или новая генеративная модель.

🔥2👍1

241 views14:14

This media is not supported in your browser

VIEW IN TELEGRAM

Модель Vega от стартапа Dexmate разработана всего за полгода, $90K в предзаказе.

https://shop.dexmate.ai/

🔥1

66 views14:28

Sparse Hash AI

Steering Large Language Model Activations in Sparse Spaces
https://arxiv.org/abs/2503.00177

X

54 views16:32

Sparse Hash AI

0:53

This media is not supported in your browser

VIEW IN TELEGRAM

2025-й, видимо, можно считать зарёй эры андроидов.

Ещё один стартап, ещё один андроид. Модель Adam от PNDbotics.

👍2

91 views11:37

Sparse Hash AI

Diffusion of Thoughts: Chain-of-Thought Reasoning in Diffusion Language Models
https://arxiv.org/abs/2402.07754

Вводят Diffusion of Thought (DoT) для параллельного выполнения шагов CoT в диффузной модели. DoT улучшает самокоррекцию, устраняя накопление ошибок в рассуждениях.

X

arXiv.org

Diffusion of Thoughts: Chain-of-Thought Reasoning in Diffusion...

Recently, diffusion models have garnered significant interest in the field of text processing due to their many potential advantages compared to conventional autoregressive models. In this work,...

51 views12:19

Sparse Hash AI

EngineAI, модель PM01 * всего через месяц после нашумевшей походки модели SE01

1:15

This media is not supported in your browser

VIEW IN TELEGRAM

Теперь он побежал.

* от человеческой походки до прыжков через голову прошёл месяц, до бега - пара недель. сингулярность

61 views16:39

Sparse Hash AI

0:18

This media is not supported in your browser

VIEW IN TELEGRAM

54 views16:15

Sparse Hash AI

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

0:57

This media is not supported in your browser

VIEW IN TELEGRAM

MagicBot от MagicLab.

49 views10:57

Sparse Hash AI

MagicBot от MagicLab.

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

И этот побежал.

55 views11:01

Sparse Hash AI

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

поцелуй мой блестящий зад

62 views13:05

Sparse Hash AI

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

Зачем бежать, на велике быстрее.

Lingxi X2 от AgiBot.

🔥1

51 views15:09

Sparse Hash AI

Self-Improving Transformers Overcome Easy-to-Hard and Length Generalization Challenges
https://arxiv.org/abs/2502.01612
https://www.alphaxiv.org/overview/2502.01612

Трансформер улучшает себя на арифметических задачах в работе с большими числами. Ключевая техника: Majority Voting.

Majority Voting: The authors train multiple models with different random seeds and retain only the outputs where a majority of models agree, providing a form of ensemble-based quality control without human supervision.

48 views11:37

Sparse Hash AI

smalldiffusion: Simple and readable code for training and sampling from diffusion models
https://github.com/yuanchenyang/smalldiffusion

47 viewsedited 12:51

Sparse Hash AI

1:06

This media is not supported in your browser

VIEW IN TELEGRAM

🔥1

117 views13:00

Sparse Hash AI

How to explain grokking
https://arxiv.org/abs/2412.18624

В статье предлагается термодинамическое объяснение гроккинга. Обобщение происходит в две фазы: меморизация (оверфит) и гроккинг.

В фазе меморизации градиентный спуск приводит к оверфиту, это обязательное условие. Здесь решение попадает в многообразие нулевого риска (zero-risk manifold) с низкой энтропией.

В фазе отсроченной генерализации (гроккинг) решение посредством броуновского движения диффундирует по многообразию в сторону областей с большей энтропией.

Практические следствия

Длительность фазы гроккинга равна квадрату фазы меморизации. Это следствие исследования пространства броуновским движением.

Наблюдается экспоненциальный рост времени гроккинга с уменьшением обучающей выборки. Следствие, увеличение размера обучающей выборки приводит к уменьшению времени до гроккинга.

Рекомендую вначале прочесть пересказ статьи, вкладка blog на https://www.alphaxiv.org/overview/2412.18624

86 views15:54

Sparse Hash AI