Mathematical Models of the Real World – Telegram
Mathematical Models of the Real World
808 subscribers
317 photos
3 videos
20 files
878 links
Channel of Professor Andrey Uskov @ProfUskov about mathematical models.
Download Telegram
OpenRouter подготовило обширное исследование: как реально используют LLM

Основные сценарии использования LLM:

Ролевые игры (Roleplay... И это не то что вы подумали!) — около 30–35% всего трафика. Это крупнейший сегмент: пользователи активно используют модели для диалогов, симуляций персонажей, креативных историй.

Программирование (Coding) — примерно 25–30%. Генерация кода, помощь в отладке, объяснение алгоритмов. Особенно популярны модели среднего размера (15–70B).

Общая генерация текста (General writing) — около 15–20%. Сюда входят эссе, статьи, письма, резюме, креативные тексты.

Образование и объяснения (Education / Q&A) — примерно 10–15%. Ответы на вопросы, объяснение теории, помощь в учёбе.

Анализ данных / утилитарные задачи — около 5–10%. Таблицы, преобразования текста, структурирование информации.
https://openrouter.ai/state-of-ai
На русском https://habr.com/ru/news/975226/
🤔4
Долой детерминанты!

Всегда приятно когда в какой-то сфере ты не очень большой корифей, но предлагаешь новую идеи и оказывается, что да, есть признанные специалисты, которые думают так же.
Теория матриц для меня - это математический язык, который используется в анализе данных и теории управления, которыми я занимаюсь.
Решил я написать букварь про векторы, матрицы и тензоры для не математиков, а тех кто использует высшую алгебру.
Застрял на главе про детерминанты (определители), мне показалось, что можно построить изложение так,  что детерминант возникнет после собственных чисел матрицы, мало того, сам детерминант может может быть определен как произведение ее собственных чисел...
И вот пожалуйста, статья крупного американского математика и специалиста в области линейной алгебры: "Долой детерминанты!", как раз про это!
https://www.axler.net/DwD.html
🔥5
Какие вы знаете сервисы для преобразования текста с формулами из LLM в файлы форматов Ворд и LaTeX?
🤔1
Хороший обзор по теории матриц...
Я, конечно, несколько спорных моментов нашел, например, когда автор говорит, что диагонализация лишь для нахождения степени от матриц, она для нахождения любых функций от матриц и много ещё чего, в том числе, упрощает выкладки и делая их прозрачными.
Но в целом обзор очень неплох.
https://habr.com/ru/articles/949084/
🎉2
Исследовалось каким образом объем транзакции на бирже изменяет цену акций. Проанализировали данные по акциям Токийской фондовой биржи за восемь лет. 

Подтвердили универсальность закона квадратного корня (square-root law, SRL), согласно которому ценовое воздействие растет пропорционально квадратному корню из количества проданных или купленных акций.
Например, если при покупке 100 акций крупным инвестором их цена увеличится на 15 процентов, то для роста цены акций на 30 процентов тот же инвестор должен будет купить не 200, а 400 акций.
https://journals.aps.org/prl/abstract/10.1103/65jz-81kv
На русском https://naked-science.ru/article/physics/srl-big-stock-physics
🤔2
Это было давно... Матрицы...

Когда я поступил в аспирантуру, мой научный руководитель сказал, что мне нужно изучить некоторые разделы математики, которые очень поверхностно рассматриваются во время учебы в институте... Я ожидал чего угодно: кратных интегралов, теорию поля, ночей над вариационными принципами, толстых монографий по теории оптимального управления...

Он посмотрел на меня поверх очков — так, как смотрят люди, которые уже давно знают, что ты собираешься спросить, но всё равно дадут тебе шанс.

— Интегралы? — переспросил он, когда я робко упомянул, что хотел бы углубиться в методы интегрирования. — Интегралы никому не нужны. Забудь.

Я даже не сразу понял, шутит он или нет. Но он продолжил:

— Хочешь заниматься моделированием? Хочешь понимать, как устроены современные методы? Тогда тебе нужен аппарат теории матриц. Всё, что угодно — от механики до машинного обучения — держится на матрицах. Интегралы — это романтика прошлого века.

Я стоял, слушал и чувствовал, как внутри меня что‑то смещается. Как будто я пришёл в университет изучать звёзды, а мне сказали: «Начни с гаечного ключа. Без него телескоп не соберёшь».

— Матрицы — это язык, — продолжал он. — На нём разговаривают модели, алгоритмы, физика, экономика. Хочешь понять мир — учись говорить на этом языке...
👍6🔥64
Картинка к предыдущему посту... В руках у молодого человека Гантмахер "Теория матриц". :)
😁3👍1
Книжка о том как сделаны большие языковые модели... Оставлю здесь, чтобы не потерялась...
🔥3
2501.09223v2.pdf
2.6 MB
Этот PDF-файл на 277 страницах раскрывает секреты больших языковых моделей. Вот что в нём содержится: 🧵

В первой главе рассматриваются основы предварительного обучения. Это фундамент больших языковых моделей. Здесь будут обсуждаться распространённые методы предварительного обучения и архитектуры моделей.

Во второй главе рассказывается о генеративных моделях — больших языковых моделях, которые мы обычно используем сегодня. После описания основного процесса создания таких моделей вы узнаете, как масштабировать обучение моделей и работать с длинными текстами.

В главе 3 представлены методы подсказок для больших языковых моделей. Ознакомьтесь с различными стратегиями подсказок, а также с более продвинутыми методами, такими как цепочка логических рассуждений и автоматическое составление подсказок.

В главе 4 представлены методы согласования для больших языковых моделей. Изучите тонкую настройку и согласование на основе обратной связи от человека.

В главе 5 представлены методы логического вывода для больших языковых моделей. Узнайте секреты алгоритмов декодирования, методов ускорения и решения проблемы масштабирования времени логического вывода.
🔥4
Предисловие для второй главы мой книги про векторы, матрицы и тензоры...

Глава 2. Теория определителей

Когда-то давно, задолго до появления современных учебников, люди уже умели решать системы линейных уравнений. И что удивительно — один из первых методов, который мы сегодня называем методом исключения Гаусса, появился вовсе не в Европе и не в XIX веке, когда творил Гаусс. Он родился в древнем Китае, как описано в древней «Математике в девяти книгах». Тогда математики выкладывали числа в таблицы, по сути, матрицы и шаг за шагом устраняли переменные. Это был прообраз того, что спустя почти две тысячи лет станет «методом Гаусса». Но тогда никто не думал о матрицах. Не было ни теории, ни языка, чтобы описать происходящее. Были только числа и необходимость решать задачи.
В Европе XVII–XVIII веков всё пошло по другому пути. Лейбниц первым записал формулы, похожие на определители. Крамер в 1750 году предложил свой знаменитый метод решения систем: заменить столбцы, вычислить определители, разделить одно на другое — и получить ответ. Это выглядело красиво, строго и очень «математично». Определители стали модным инструментом. В XIX веке их изучали как самостоятельный объект: многие математики были уверены, что определители — это главное, а всё остальное вторично. Даже когда Гаусс формализовал метод исключения в начале XIX века, его воспринимали скорее как удобный технический трюк, а не как основу линейной алгебры. Это был момент, когда казалось, что определители победили, они стали центром теории, а методы исключения — лишь ремеслом вычислителя. В XVIII–XIX веках математики решали системы линейных уравнений через формулы Крамера — алгебраический подход, красивый, но громоздкий. Для маленьких систем — нормально. Для больших — кошмар.
XX век всё перевернул. Когда появились вычислительные машины, стало ясно: определители — прекрасны в теории, но ужасны на практике: они неустойчивы к численным ошибкам, метод Крамера требует вычислять много определителей — это слишком дорого.
В то же время, метод Гаусса легко алгоритмизируется, работает быстро и надёжно. И вот тут произошёл перелом: метод исключения вернулся и стал основой всей вычислительной линейной алгебры. LU-разложение, QR-разложение, SVD сингулярное разложение и многое другое.
Определители же заняли более скромное, но всё ещё важное место. Они стали инструментом для: проверки обратимости матриц и линейной независимости, построения характеристических многочленов, вычисление объёма параллелепипеда, заданного векторами, аналитических выкладок для теоретических доказательств и некоторых других проблем, но не для решения систем уравнений. Сейчас никто не считает, что определители важнее матриц.
👍6🔥4🤔1
GLM‑4.7 — новая китайская модель для программирования, которая догоняет западных лидеров
Китайская компания Zhipu AI (Z.ai) представила модель GLM‑4.7, ориентированную на программирование, агентные сценарии и сложные многошаговые задачи.

По данным NewsBytes и SCMP:
GLM‑4.7 уступает:
Claude Opus 4.5
Gemini Pro 3
GPT‑5 / GPT‑5.1 (в зависимости от теста)

Но превосходит:
предыдущие китайские модели
многие open‑source модели
некоторые версии GPT‑5 на отдельных кодовых бенчмарках
Позиция в глобальном рейтинге (по слепому тестированию):
1‑е место среди open‑source моделей
1‑е место среди китайских моделей
6‑е место в мире

Это делает GLM‑4.7 одним из самых сильных открытых решений для кода.

https://www.scmp.com/tech/tech-trends/article/3337516/chinese-start-ups-zhipu-and-minimax-release-latest-ai-models-ahead-hong-kong-listing
🤔3👍1
Почему характеристическое уравнение иногда называется вековым уравнением?

Название «вековое уравнение» (по‑русски) — это прямой перевод французского термина équation séculaire, который появился в астрономии XVIII–XIX веков.
В небесной механике изучали движение планет, и оказалось, что их орбиты испытывают медленные, очень долгие изменения, растянутые на столетия. Эти изменения называли:
вековыми возмущениями
secular variations (от лат. saeculum — век)
Чтобы описать эти медленные изменения, Лаплас, Лагранж и другие учёные выводили линейные системы дифференциальных уравнений, коэффициенты которых зависели от масс и орбит планет.
При анализе этих систем возникали уравнения на собственные значения — именно те, что мы сегодня называем характеристическими.
И вот эти уравнения в астрономии называли:
«вековыми уравнениями»
потому что они описывали вековые (очень медленные) изменения орбит.
🔥7
Размышление на тему, почему одни посты вызывают жаркую дискуссию и поток комментариев, а другие, по-сути, точно такие же ничего не вызывают...

Про число комментариев. Это не совсем психология, это из области сложных систем. Точно так же как камень сброшенный с горы может вызвать лавину, а может ничего не вызвать, скатиться и все.
Кратко идея выглядит так: пост должен привлечь внимание одного или нескольких концентраторов сети социальных связей, если эти концентраторы ещё зацепят других концентраторов, то уже может пойти и лавина. Если же пост не зацепил ни одного концентратора сети, то несколько комментариев изолированных пользователей и все.
Самое главное здесь, что это стохастический процесс, т.е. пост, который вызвал лавину может быть ничем не лучше того, который оставил всех равнодушным, просто так сложилась цепочка случайных событий.
😁3👍2🤣2
Среди видео, рекомендованных новым пользователям YouTube, 20% - это низкокачественный контент, созданный ИИ и известный как AI-slop, или ИИ-мусор, показало исследование компании Kapwing.
Аналитики изучили топ-100 каналов в 150 странах, обнаружив 278 полностью ИИ-ориентированных каналов с общим числом просмотров свыше 63 млрд и 221 млн подписчиков. По оценкам, они приносят около $117 млн дохода ежегодно.

Хлеба и зрелищ... Как метко сформулировали давным давно...
🔥4
Друзья! С наступающим Новым Годом!
Здоровья, счастья и творческих успехов!
8🔥2👏1
Требуется решить уравнение... Некоторые большие языковые модели пишут, что решений нет...
В числителе, который может быть представлен как (х-1)*(х-1) при х=1 будет 0 второго порядка малости, в знаменателе при этом 0 первого порядка малости, соответственно, в знаменателе при х=1 будет 0, а в числителе - 0 в квадрате. Ноль в квадрате, делить на просто ноль равно 0.
х=1 - решение. Так?
😁4🤔41
Математики смотрели... все правильно...

Вспомнил тут анекдотичную историю, связанную с подобным уравнением, что приведено в посте выше...
Идёт защита докторской диссертации по техническим наукам, не чистая математика, но где-то близко...
Соискатель рассказывает про некий коэффициент в виде дроби, который в процессе функционирования системы поддерживается равным 1.
Все шло хорошо, пока один профессор, сидевший возле плаката с формулой коэффициента не разглядел, что в знаменателе дроби получается ноль и задал вопрос об этом соискателю.
Соискатель ответил, что в числителе тоже ноль, а в результате раскрытия неопределенности отлично себе получается та единица.
Но профессор не унимался, вот я беру данные из вашего же примера, где вы утверждаете что коэффициент будет равен единице, подставляю их в формулу и вижу, что на ноль делить нельзя, нет там никакой единицы.
Возникла совсем нехорошая для соскателя дискуссия. Ситуацию спас председатель совета, который сказал примерно следующее:
да, строго говоря здесь нужно писать не равенства, а предел, при параметрах стремящихся к значениям из примера, коэффициент стремится к 1.
Математики это смотрели, допускается и так написать, с учётом того, что мы понимаем указанную оговорку.
😁6
О скорости света...

Как известно скорость света является одной из фундаментальных констант нашего мира. Еще более 100 лет назад эксперимент Микельсона-Морли показал, что скорость света не зависит от скорости движения его источника и приемника. Что легло в основу теории относительности Эйнштейна.

В тоже время, некоторые современные модели квантовой гравитации вынуждены предположить, что скорость света все-таки немного зависит от энергии фотона, т.е. от его цвета.
Предыдущие эксперименты это не выявили. Сейчас удалось улучшить точность измерения скорости света на порядок.

Авторы исследования решили проверить эту идею, используя астрофизические наблюдения. Их подход основан на огромных расстояниях, которые свет преодолевает во Вселенной. Если фотоны с разной энергией выпускаются одновременно из удаленного источника, даже мельчайшие различия в их скорости могут привести к измеримым задержкам во времени к моменту их достижения Земли.

Результат - скорость света по прежнему константа!!!!!

https://journals.aps.org/prd/abstract/10.1103/k3xg-wkrc

https://www.sciencedaily.com/releases/2026/01/260107225544.htm
3🔥3🤔3👻1
Как большая языковая модель делает математические расчеты?

Как известно, большие языковые модели не мыслят и не рассуждают, они лишь предсказывают следующий токен.
Но при этом они умеют выполнять арифметику — и это вызывает вопросы. Как?!
Кажется, что внутри модели должен быть встроенный калькулятор — но его нет.

И здесь нам помогает новое научное направление "Исследование интерпретируемости", которое занимается изучением того, как обученная нейронная сеть решает задачи.

Что же показало исследование?
В нейросети нет единого «модуля сложения».
Модель разбивает задачу на подзадачи:
Например: оценка масштаба результата («около 90»),
Вычисление последней цифры («6 + 9 → 5»),
Сопоставление с известными шаблонами.

Разные части сети выполняют разные микрофункции:
грубая оценка,
точная обработка разрядов,
заученная таблица сложения однозначных чисел.

Почему модель ошибается на длинных числах?
У неё нет универсального алгоритма, как у человека.

Она использует эвристики, а не правила.

Поэтому:
двух- и трёхзначные числа — работает отлично,
длинные числа, необычные форматы — частые ошибки.

И самое интересное! Почему модель «лжёт» о том, как она получила ответ!!!

Если спросить, она опишет человеческий алгоритм («перенос разряда»). Но это не отражает реальных внутренних вычислений.
Модель генерирует правдоподобное объяснение, потому что видела тысячи таких объяснений в данных.
Это касается не только арифметики, но и рассуждений вообще.

https://fferoz.medium.com/how-ai-really-thinks-and-why-it-feels-so-human-1b0d4a340c3a

https://transformer-circuits.pub/2025/attribution-graphs/biology.html#dives-addition

https://transformer-circuits.pub/2025/attribution-graphs/methods.html#graphs-addition

https://habr.com/ru/companies/bothub/articles/983426/
🤔4👍32
Интересное исследование об устойчивости клеток как систем

Как известно жизнь клетки, это не только выполнение нужных реакций, но и постоянная борьба с хаосом. Внутри клетки происходит огромное количество химических реакций. Молекулы могут соединяться и распадаться десятками разных способов.

Но клетке нужен только один правильный путь, чтобы:
получать энергию,
строить белки,
расти и делиться.

Все остальные реакции — вредные. Они тратят ресурсы и создают мусор.

Чтобы выжить, клетка должна запретить большинству реакций происходить.

Учёные нашли, что у этого запрета тоже есть цена.
Раньше физики считали только то, сколько энергии тратится на сами полезные реакции.
Но что бы остановить ненужные реакции, клетка тоже тратит энергию.
Это как если бы я не только писал этот пост, но и постоянно следил за рядом других процессов, которые меня отвлекают, это тоже большие затраты.

Таким образом, у клетки есть два вида затрат:
1. Энергия, чтобы реакции шли в нужном направлении.
2. Энергия, чтобы не дать другим реакциям происходить.
Вторая часть — новая. Раньше её никто не умел считать.

Далее учёные сравнили химические реакции с электрическими цепями:
В этой модели:

Поток вещества через реакции аналогичен электрическому току.
Разность химических потенциалов работает как напряжение.
Сами реакции выступают в роли резисторов, обладающих сопротивлением.

Если оставить много путей — ток течёт легко.
Если оставить только один — сопротивление растёт.

Авторы математически доказали, что этот принцип справедлив и для химических сетей. Выделение (изоляция) узкого метаболического пути из более широкой сети всегда увеличивает эффективное сопротивление системы. Следовательно, для поддержания того же потока вещества через изолированный путь требуется приложить большую движущую силу (разность химических потенциалов), что ведет к большим энергетическим потерям.

Это приводит к контринтуитивному выводу: вблизи равновесия специализация всегда энергетически невыгодна. Термодинамически системе удобнее использовать все доступные пути реакции, а не ограничивать себя одним маршрутом.

Почему тогда клетки используют узкие пути?
Потому что у них есть ферменты — специальные белки.
Ферменты:
ускоряют нужные реакции,
уменьшают их «сопротивление»,
делают правильный путь выгодным.
То есть ферменты — это как супер‑проводники, которые помогают клетке экономить энергию.

Обнаружено, что вблизи точек бифуркации (неустойчивых состояний, где система может резко сменить режим работы) строгая иерархия затрат может нарушаться. В определенных условиях изолированный путь может оказаться термодинамически «дешевле», чем работа всей сети целиком, даже без учета действия катализаторов. Это открытие улучшает понимание добиологической эволюции. Оно подсказывает, как в первичном химическом бульоне могли спонтанно закрепляться устойчивые циклы реакций еще до появления сложных белковых катализаторов — просто потому, что в неравновесных условиях эти циклы оказывались термодинамически предпочтительными.

https://iopscience.iop.org/article/10.1088/1742-5468/ae22eb
https://www.ixbt.com/live/science/skolko-stoit-zhizn-fiziki-vpervye-rasschitali-skrytuyu-cenu-kletochnogo-metabolizma.html
🔥4🤯1
Почти всем приходилось решать задачу протаскивания крупной мебели по узким коридорам

Корейский математик Пэк Джин-он решил известную геометрическую задачу «о перемещении дивана», над которой учёные бились почти шесть десятилетий.
Задача, сформулированная в 1966 году математиком Лео Мозером, звучит просто: какая самая большая жёсткая фигура может повернуть за прямой угол в L-образном коридоре шириной 1 метр?  
Десятилетиями исследователи предлагали различные варианты того, какой формы и максимальной площади мог бы быть такой предмет. Так, в 1968 году британец Джон Хаммерсли описал фигуру площадью около 2,2074 м². В 1992-м профессор Ратгерского университета Джозеф Гервер улучшил результат Хаммерсли и предложил изогнутую площадью примерно 2,2195 м². Однако доказать, что площадь фигуры не может быть ещё больше, до сих пор не удавалось.
Пэк, научный сотрудник Центра математических задач имени Джун Э. Ху в Корейском институте перспективных исследований, потратил на исследование семь лет. В итоге он смог доказать, что фигура Джозефа Гервера оптимальна. В статье, опубликованной на препринт-сервере arXiv, он указал, что «диван, превышающий по размерам форму Гервера, невозможен» в рамках задачи.

https://arxiv.org/abs/2411.19826

Статья на русском https://habr.com/ru/news/984358/
🔥3🤔2