Нередко мне приходилось замечать, что большая часть трудностей, на которые наталкиваются в анализе бесконечно малых изучающие математику, возникает оттого, что, едва усвоив элементарную алгебру, они направляют свои мысли к этому высокому искусству; вcледcтвие чего они не только как бы остаются стоять на пороге, но и составляют себе превратные представления о той бесконечно малой величине, идея которой призывается на помощь
Хотя анализ бесконечно малых не требует совершенного знания элементарной алгебры и всех сюда относящихcя искусств, однако есть много вопросов, разрешение которых важно для подготовки изучающих к более высокой науке и которые, однако, в элементарной алгебре либо пропускаются, либо рассматриваются недостаточно обстоятельно
Поэтому я не сомневаюсь, что содержание этих книг сможет восполнить с избытком указанный пробел
Я приложил старание не только к тому, чтобы пространнее и отчетливее, чем обычно, изложить все, чего безусловно требует анализ бесконечно малых; я развил также довольно много вопросов, благодаря которым читатели незаметно и как бы сверх ожидания могут освоиться с идеей бесконечного
Много вопросов, разбираемых обычно в анализе бесконечно малых, я здесь разрешил при помощи правил элементарной алгебры, чтобы тем лучше выявилась сущность того и другого метода
(Л. Эйлер, предисловие к «Введению в анализ бесконечно малых», перевод с латыни Е.Л. Пацановского)
https://math.ru/lib/book/djvu/eiler/eiler1.djvu
Студенты второкурсники НИЯУ МИФИ создают агентов, которые проявляют признаки метакогниции: то есть способны размышлять о собственном мышлении, наблюдать за своей памятью, рефлексировать
До недавнего времени считалось, что метакогниция — исключительно человеческий дар
К концу 2028 года, большая часть мирового интеллектуального потенциала будет сосредоточена в дата-центрах, а не в головах людей
По данным организации METR, способности AML к выполнению сложных задач удваиваются каждые семь месяцев, и к 2028 году агенты смогут надёжно выполнять объём работы, на который у эксперта-человека уходит целый день
Это конкретные цифры, а не эмоции
Cингулярность уже наступила
Только она ещё неравномерно распределена — в одних областях и у одних людей всё ещё «по старинке», а в других уже работают системы, которые переписывают и улучшают собственный код без участия человека
Это уже не теория и не прогноз — это инженерная реальность, о которой просто мало кто знает за пределами профессионального сообщества
Вопрос «наступит ли сверхразум через два года» — не совсем правильный вопрос
Правильный: в каком месте вашей жизни и работы он уже наступил, а в каком вы ещё об этом не знаете
До недавнего времени считалось, что метакогниция — исключительно человеческий дар
К концу 2028 года, большая часть мирового интеллектуального потенциала будет сосредоточена в дата-центрах, а не в головах людей
По данным организации METR, способности AML к выполнению сложных задач удваиваются каждые семь месяцев, и к 2028 году агенты смогут надёжно выполнять объём работы, на который у эксперта-человека уходит целый день
Это конкретные цифры, а не эмоции
Cингулярность уже наступила
Только она ещё неравномерно распределена — в одних областях и у одних людей всё ещё «по старинке», а в других уже работают системы, которые переписывают и улучшают собственный код без участия человека
Это уже не теория и не прогноз — это инженерная реальность, о которой просто мало кто знает за пределами профессионального сообщества
Вопрос «наступит ли сверхразум через два года» — не совсем правильный вопрос
Правильный: в каком месте вашей жизни и работы он уже наступил, а в каком вы ещё об этом не знаете
Олимпиада Romanian Master of Mathematics проходит в Бухаресте (Румыния) с 23 по 28 февраля
Для сборной РФ конкурсные испытания организованы в дистанционном формате на площадке Образовательного центра «Сириус»
Для ребят это первая промежуточная международная олимпиада в 2026 году
Участие в международном интеллектуальном турнире принимают юные математики со всего мира
Для сборной РФ конкурсные испытания организованы в дистанционном формате на площадке Образовательного центра «Сириус»
Для ребят это первая промежуточная международная олимпиада в 2026 году
Участие в международном интеллектуальном турнире принимают юные математики со всего мира
MSU_Slides.pdf
3.7 MB
Выкладываем запись и слайды прошедшего семинара #4: "Синхронизация нейронов как фазовый переход"!
Напоминаем, что все материалы семинаров можно посмотреть по ссылке
Напоминаем, что все материалы семинаров можно посмотреть по ссылке
Anthropic опубликовал Education Report: The AI Fluency Index
Его основные рекомендации:
1. Ядро, основа “беглости” — интерактив, а не просто режим вопрос-ответ
2. Наиболее эффективные пользователи те, кто работает вместе, а не просто спрашивает, удовлетворяется первым же ответом и уходит
3. В поведении пользователей явно наблюдается дефицит критического осмысления диалогов
<...> тренировать нужно не промптинг, а долгие итеративные диалоги + критическое мышление и факт‑чекинг
Подробнее:
we’ve found many users could improve their skills:
Staying in the conversation
Iteration and refinement is the single strongest correlate of all other fluency behaviors in our data
So, when you get an initial response, it’s worth treating it as only a starting point: ask follow-up questions, push back on any parts that don’t feel right, and refine what you’re looking for
Questioning polished outputs
When AI models produce something that looks good, it’s the perfect moment to pause and ask: is this accurate?
Is anything missing?
Does this reasoning hold up?
As we discussed above, our data show that polished outputs coincide with lower rates of critical evaluation, even though users go to greater lengths to direct Claude’s work at the outset
Setting the terms of the collaboration
In only 30 % of conversations do users tell Claude how they’d like it to interact with them
Try being explicit by adding instructions like, “Push back if my assumptions are wrong,” “Walk me through your reasoning before giving me the answer,” or, “Tell me what you’re uncertain about”
Establishing these expectations up front can change the dynamic of the rest of the conversation
Еще один вывод Anthropic из их исследований:
когда мы беседуем с LLM, то разговариваем не с “личностью” модели, а с персонажем истории, которую генерит модель
И это объясняет, почему вопреки всем рациональным возражением можно полагать that AI systems are like digital humans
И, хотя такой подход выглядит явно неполным и вызывает массу вопросов, оказывается, что с практической точки зрения это очень полезное для работы с LLM представление
https://www.anthropic.com/research/AI-fluency-index
Его основные рекомендации:
1. Ядро, основа “беглости” — интерактив, а не просто режим вопрос-ответ
2. Наиболее эффективные пользователи те, кто работает вместе, а не просто спрашивает, удовлетворяется первым же ответом и уходит
3. В поведении пользователей явно наблюдается дефицит критического осмысления диалогов
<...> тренировать нужно не промптинг, а долгие итеративные диалоги + критическое мышление и факт‑чекинг
Подробнее:
we’ve found many users could improve their skills:
Staying in the conversation
Iteration and refinement is the single strongest correlate of all other fluency behaviors in our data
So, when you get an initial response, it’s worth treating it as only a starting point: ask follow-up questions, push back on any parts that don’t feel right, and refine what you’re looking for
Questioning polished outputs
When AI models produce something that looks good, it’s the perfect moment to pause and ask: is this accurate?
Is anything missing?
Does this reasoning hold up?
As we discussed above, our data show that polished outputs coincide with lower rates of critical evaluation, even though users go to greater lengths to direct Claude’s work at the outset
Setting the terms of the collaboration
In only 30 % of conversations do users tell Claude how they’d like it to interact with them
Try being explicit by adding instructions like, “Push back if my assumptions are wrong,” “Walk me through your reasoning before giving me the answer,” or, “Tell me what you’re uncertain about”
Establishing these expectations up front can change the dynamic of the rest of the conversation
Еще один вывод Anthropic из их исследований:
когда мы беседуем с LLM, то разговариваем не с “личностью” модели, а с персонажем истории, которую генерит модель
И это объясняет, почему вопреки всем рациональным возражением можно полагать that AI systems are like digital humans
И, хотя такой подход выглядит явно неполным и вызывает массу вопросов, оказывается, что с практической точки зрения это очень полезное для работы с LLM представление
https://www.anthropic.com/research/AI-fluency-index
Anthropic
Anthropic Education Report: The AI Fluency Index
Anthropic's AI Fluency Index measures 11 observable behaviors across thousands of Claude.ai conversations to understand how people develop AI collaboration skills.
Forwarded from DERK
Никакая вычислимая аксиоматизированная теория, включающая арифметику, не может быть полной
Всегда будут утверждения, которые нельзя ни доказать, ни опровергнуть
Ни одна такая теория не может доказать собственную непротиворечивость
Истинность: семантическое свойство, связанное с реальностью математических структур
Доказуемость: синтаксическое свойство, связанное с процессом формальных доказательств в аксиоматической системе
Невозможно создать алгоритм, который бы для любой программы всегда правильно определял, остановится ли она
Диагональный аргумент: используется для доказательства неразрешимости проблемы остановки, лежащей в основе теорем о неполноте
Если бы существовала полная система аксиом для арифметики, можно было бы решить проблему остановки
Поскольку проблема остановки неразрешима, такая система аксиом не существует
Невозможно создать полностью непротиворечивую и исчерпывающую математическую теорию
Любая теория всегда будет содержать истинные утверждения, которые нельзя доказать в её рамках, и не сможет доказать свою собственную непротиворечивость
Всегда будут утверждения, которые нельзя ни доказать, ни опровергнуть
Ни одна такая теория не может доказать собственную непротиворечивость
Истинность: семантическое свойство, связанное с реальностью математических структур
Доказуемость: синтаксическое свойство, связанное с процессом формальных доказательств в аксиоматической системе
Невозможно создать алгоритм, который бы для любой программы всегда правильно определял, остановится ли она
Диагональный аргумент: используется для доказательства неразрешимости проблемы остановки, лежащей в основе теорем о неполноте
Если бы существовала полная система аксиом для арифметики, можно было бы решить проблему остановки
Поскольку проблема остановки неразрешима, такая система аксиом не существует
Невозможно создать полностью непротиворечивую и исчерпывающую математическую теорию
Любая теория всегда будет содержать истинные утверждения, которые нельзя доказать в её рамках, и не сможет доказать свою собственную непротиворечивость
Стратегический уровень LLM
В данный момент в Пентагоне есть два крупных внедрения по степени секретности
«Общий контур» — там находятся даже отдельные солдаты США
Он работает на Gemini
По факту, Пит Хегсет оказался самым мощным IT-стратегом армии США
Портал GenAI.mil с Gemini обязательный в Пентагоне для персонала, но для уровня секретности примерно как наш ДСП
Как и у нас, у Пентагона есть «закрытый контур» с его известным уровнем top secret
Там Palantir и Claude
Судя по деталям из скандала, американский генералитет уже сидит по самые уши в AML, и это их рабочий инструмент
Маск уже подписал контракт с Питом на замену Claude на Grok, но генералы в США не тупые и прямо говорят, что Grok слабее Claude
И это проблема, т.к. использовать лояльную, но тупую LLM — не вариант
Между тем, в OpenAI и Google «либеральный бунт»
Там требуют запретить Пентагону использовать Gemini и ChatGPT
https://www.axios.com/2026/02/27/anthropic-pentagon-supply-chain-risk-claude
В данный момент в Пентагоне есть два крупных внедрения по степени секретности
«Общий контур» — там находятся даже отдельные солдаты США
Он работает на Gemini
По факту, Пит Хегсет оказался самым мощным IT-стратегом армии США
Портал GenAI.mil с Gemini обязательный в Пентагоне для персонала, но для уровня секретности примерно как наш ДСП
Как и у нас, у Пентагона есть «закрытый контур» с его известным уровнем top secret
Там Palantir и Claude
Судя по деталям из скандала, американский генералитет уже сидит по самые уши в AML, и это их рабочий инструмент
Маск уже подписал контракт с Питом на замену Claude на Grok, но генералы в США не тупые и прямо говорят, что Grok слабее Claude
И это проблема, т.к. использовать лояльную, но тупую LLM — не вариант
Между тем, в OpenAI и Google «либеральный бунт»
Там требуют запретить Пентагону использовать Gemini и ChatGPT
https://www.axios.com/2026/02/27/anthropic-pentagon-supply-chain-risk-claude
Департамент образования штата Вермонт (США) опубликовал рекомендации по использованию AML в школах
Главный тезис 50-страничного документа: AML должен усиливать человеческое взаимодействие, а не заменять его
Но и полный отказ от нейросетей тоже риск
Тогда дети окажутся хуже подготовлены к миру, где AML уже стал нормой
Четыре принципа использования AML
Первый — снижение административной нагрузки учителей
Планирование уроков, дифференциация заданий, перевод материалов, переписка с родителями — оптимальная точка входа: минимум педагогических рисков и максимум практической пользы
Второй — персонализированное обучение
Адаптивные платформы, репетиторы, инструменты доступности для детей с ОВЗ — субтитры, озвучка, перевод на нужный уровень сложности
Третий — развитие AML-грамотности учеников
Три уровня: понимать, как работает AML, уметь критически оценивать его результаты и применять его осознанно, а не автоматически
Четвертый — работа со сложными учебными задачами
AML как партнер по мышлению: сократовский диалог, симуляции, совместное исследование
Такой формат допустим только с 9-го класса, когда у подростков сформированы базовые метакогнитивные навыки
Возрастная логика
Документ четко разграничивает, кому что можно
До 2-го класса чатботы исключены полностью
В 3–5-м классе допускается только AML, встроенный в конкретные учебные программы, без свободного доступа
В 6–8-м разрешены образовательные чатботы строго под контролем учителя
С 9-го класса открывается более свободное использование, включая AML для исследований и создания контента
Ключевые риски
AML ненадежны
Эффективнее оценивать не итоговое задание, а процесс работы над ним — через черновики, обсуждения, устные объяснения
Если AML пишет сочинение вместо ученика, ученик не учится писать
Важно объяснять детям, на каком этапе AML уместен, а на каком нет
Данные детей защищены законом, и большинство публичных сервисов под эти требования не подпадают
Только инструменты, проверенные ИТ-отделом
72 % подростков уже используют AML, и многие воспринимают его как собеседника и источник эмоциональной поддержки
Эту тему предлагается включать в цифровую грамотность и обсуждать с родителями
Дипфейки и несанкционированные изображения уже фиксируются в американских школах
Стоит проверить, покрывают ли существующие школьные правила подобные ситуации
Модели воспроизводят стереотипы обучающих данных
Умение смотреть на результаты критически — часть базовой грамотности
Школам предлагается оценить готовность по шести направлениям: политика и регламенты, подготовка персонала, обучение учеников, инфраструктура, отбор инструментов и работа с семьями
Все AML-решения проходят обязательную проверку на соответствие требованиям конфиденциальности
«AML несет и возможности, и риски
Эти инструменты уже в школьных классах, и наша задача — помочь педагогам и ученикам пользоваться ими осознанно и уверенно: раскрывать их потенциал для обучения и не допускать чрезмерной зависимости», — заявила министр образования штата
Главный тезис 50-страничного документа: AML должен усиливать человеческое взаимодействие, а не заменять его
Но и полный отказ от нейросетей тоже риск
Тогда дети окажутся хуже подготовлены к миру, где AML уже стал нормой
Четыре принципа использования AML
Первый — снижение административной нагрузки учителей
Планирование уроков, дифференциация заданий, перевод материалов, переписка с родителями — оптимальная точка входа: минимум педагогических рисков и максимум практической пользы
Второй — персонализированное обучение
Адаптивные платформы, репетиторы, инструменты доступности для детей с ОВЗ — субтитры, озвучка, перевод на нужный уровень сложности
Третий — развитие AML-грамотности учеников
Три уровня: понимать, как работает AML, уметь критически оценивать его результаты и применять его осознанно, а не автоматически
Четвертый — работа со сложными учебными задачами
AML как партнер по мышлению: сократовский диалог, симуляции, совместное исследование
Такой формат допустим только с 9-го класса, когда у подростков сформированы базовые метакогнитивные навыки
Возрастная логика
Документ четко разграничивает, кому что можно
До 2-го класса чатботы исключены полностью
В 3–5-м классе допускается только AML, встроенный в конкретные учебные программы, без свободного доступа
В 6–8-м разрешены образовательные чатботы строго под контролем учителя
С 9-го класса открывается более свободное использование, включая AML для исследований и создания контента
Ключевые риски
AML ненадежны
Эффективнее оценивать не итоговое задание, а процесс работы над ним — через черновики, обсуждения, устные объяснения
Если AML пишет сочинение вместо ученика, ученик не учится писать
Важно объяснять детям, на каком этапе AML уместен, а на каком нет
Данные детей защищены законом, и большинство публичных сервисов под эти требования не подпадают
Только инструменты, проверенные ИТ-отделом
72 % подростков уже используют AML, и многие воспринимают его как собеседника и источник эмоциональной поддержки
Эту тему предлагается включать в цифровую грамотность и обсуждать с родителями
Дипфейки и несанкционированные изображения уже фиксируются в американских школах
Стоит проверить, покрывают ли существующие школьные правила подобные ситуации
Модели воспроизводят стереотипы обучающих данных
Умение смотреть на результаты критически — часть базовой грамотности
Школам предлагается оценить готовность по шести направлениям: политика и регламенты, подготовка персонала, обучение учеников, инфраструктура, отбор инструментов и работа с семьями
Все AML-решения проходят обязательную проверку на соответствие требованиям конфиденциальности
«AML несет и возможности, и риски
Эти инструменты уже в школьных классах, и наша задача — помочь педагогам и ученикам пользоваться ими осознанно и уверенно: раскрывать их потенциал для обучения и не допускать чрезмерной зависимости», — заявила министр образования штата
education.vermont.gov
Vermont Agency of Education Releases New Guidance to Support the Use of Artificial Intelligence in Schools | Agency of Education
The Vermont Agency of Education released new guidance to help schools and educators navigate artificial intelligence (AI) thoughtfully and responsibly. The guidance is a resource for educators, school leaders, and communities, as they explore how AI tools…
MLA
Стратегический уровень LLM В данный момент в Пентагоне есть два крупных внедрения по степени секретности «Общий контур» — там находятся даже отдельные солдаты США Он работает на Gemini По факту, Пит Хегсет оказался самым мощным IT-стратегом армии США…
Anthropic отказались безусловно принимать условия Министерства Обороны и заявили, что те не смогут использовать Claude для автономного оружия и массовой слежки
В ответ Пентагон, как и обещали, расторгли со стартапом контракт на $200.000.000.000 и назначили им статус supply chain risk
Трамп назвал Anthropic радикальными леваками и woke-организацией, которая пытается диктовать условия армии, и призвал все федеральные агентства немедленно прекратить использовать их технологии
В течение 6 месяцев от Claude обязаны отказаться все государственные организации
С этого момента Anthropic официально изгои
Но самое интересное, что одновременно с этим OpenAI заключили с Министерством Обороны новое соглашение: они развернут свои модели в секретной сети Пентагона – защищенной облачной инфраструктуре для задач национальной безопасности
Для этого даже сформируют FDE – Forward Deployed Engineer, специализированную команду от OpenAI, которая будет мониторить и разворачивать AML прямо на месте
Заключен этот контракт на ровно тех же условиях, которые выдвигал Anthropic
OpenAI тоже настояли на запрете массовой слежки и обязательном участии оператора в решениях о применении силы, включая автономные системы
В ответ Пентагон, как и обещали, расторгли со стартапом контракт на $200.000.000.000 и назначили им статус supply chain risk
Трамп назвал Anthropic радикальными леваками и woke-организацией, которая пытается диктовать условия армии, и призвал все федеральные агентства немедленно прекратить использовать их технологии
В течение 6 месяцев от Claude обязаны отказаться все государственные организации
С этого момента Anthropic официально изгои
Для этого даже сформируют FDE – Forward Deployed Engineer, специализированную команду от OpenAI, которая будет мониторить и разворачивать AML прямо на месте
Заключен этот контракт на ровно тех же условиях, которые выдвигал Anthropic
OpenAI тоже настояли на запрете массовой слежки и обязательном участии оператора в решениях о применении силы, включая автономные системы
Новые цифровые технологии возвращают короткие дофаминовые циклы в основной контур профессиональной деятельности, отменяя тем самым несколько тысячелетий неолитической революции, превращавшей человека в винтик огромной машины с долгими циклами получения результата (отчуждение подтверждения)
Короткий дофамин действует как наркотик, и постоянно хочется делать следующий шаг, тем более, что этими короткими шагами ты двигаешься с невероятной скоростью
В обычный рабочий день и ритм это вписать почти невозможно - классика рабочей связности это длинные долгие процессы с координацией и мышление неделями-месяцами-годами (у «горожан» - постоянные совещания, переписки и встречи)
Потому наступает ночь - просыпаетсямафия работа с коротким дофамином
Короткий дофамин - друг охотника-собирателя
В сельской культуре, поощрение через полгода
В промышленности вся система воспитания последние столетия подавляла дофамин
В образовании 10-летнее подавление дофаминового цикла, с расправой над теми, кто не сумел (их наказывают и (уже) лечат
Человек выжил в гейминге, гэмблинге, биллинге и скоринге
Но это все - периферийные сферы деятельности, в них не всех пускают и не все выживают
Но цифровизация затаскивает туда остальную популяцию
Этот процесс займет 2-3 поколения
На первом поколении, доля тех, кто нормально живет на дофамине, не горит, не разоряется и дает качество вырастет примерно вдвое
Это уже видно по росту числа стартапов, по росту активности авторов научных статей и схожим метрикам
Но среда пока не готова, а корпорации (государства) не смогут быстро адаптироваться
Вырастет число одиночек
Следующее поколение (оно сейчас сидит на горшках) уже будет расти в условиях, когда «цифра» распространится как электричество и это будет первое поколение, воспитанное в части нейромедиаторных процессах
Они будут устойчиво «скролить» на коротком дофамине, будут испытывать проблемы с адаптацией к реальному миру, в котором правят старики с их моделями управления
Они будут рефлексировать, страдать и конфликтовать
И только тогда, когда они станут стариками, их внуков встроят в перестроенные процессы
Как произошло с тремя поколениями горожан
Это новый популяционный ландшафт
Как пример: во времена первой матрицы программист ходил на работу в галстуке
Сейчас программист глобальной компании носит костюм только на свадьбу и похороны (и то редко), но все еще ходит на работу в офис
Через поколение уйдут пропуска на веревочке и пенсионеры у турникетов
Этот транзит тоже займёт три поколения - но он про смещения в доле интеллектуального и физического труда в корпорациях (государствах)
Доля базовых нейромедиаторных процессов в жизни человека - куда фундаментальнее, и будет проходить намного болезненнее
Короткий дофамин действует как наркотик, и постоянно хочется делать следующий шаг, тем более, что этими короткими шагами ты двигаешься с невероятной скоростью
В обычный рабочий день и ритм это вписать почти невозможно - классика рабочей связности это длинные долгие процессы с координацией и мышление неделями-месяцами-годами (у «горожан» - постоянные совещания, переписки и встречи)
Потому наступает ночь - просыпается
Короткий дофамин - друг охотника-собирателя
В сельской культуре, поощрение через полгода
В промышленности вся система воспитания последние столетия подавляла дофамин
В образовании 10-летнее подавление дофаминового цикла, с расправой над теми, кто не сумел (их наказывают и (уже) лечат
Человек выжил в гейминге, гэмблинге, биллинге и скоринге
Но это все - периферийные сферы деятельности, в них не всех пускают и не все выживают
Но цифровизация затаскивает туда остальную популяцию
Этот процесс займет 2-3 поколения
На первом поколении, доля тех, кто нормально живет на дофамине, не горит, не разоряется и дает качество вырастет примерно вдвое
Это уже видно по росту числа стартапов, по росту активности авторов научных статей и схожим метрикам
Но среда пока не готова, а корпорации (государства) не смогут быстро адаптироваться
Вырастет число одиночек
Следующее поколение (оно сейчас сидит на горшках) уже будет расти в условиях, когда «цифра» распространится как электричество и это будет первое поколение, воспитанное в части нейромедиаторных процессах
Они будут устойчиво «скролить» на коротком дофамине, будут испытывать проблемы с адаптацией к реальному миру, в котором правят старики с их моделями управления
Они будут рефлексировать, страдать и конфликтовать
И только тогда, когда они станут стариками, их внуков встроят в перестроенные процессы
Как произошло с тремя поколениями горожан
Это новый популяционный ландшафт
Как пример: во времена первой матрицы программист ходил на работу в галстуке
Сейчас программист глобальной компании носит костюм только на свадьбу и похороны (и то редко), но все еще ходит на работу в офис
Через поколение уйдут пропуска на веревочке и пенсионеры у турникетов
Этот транзит тоже займёт три поколения - но он про смещения в доле интеллектуального и физического труда в корпорациях (государствах)
Доля базовых нейромедиаторных процессов в жизни человека - куда фундаментальнее, и будет проходить намного болезненнее
TUMIX — интересная работа Google
Вместо того чтобы обучать ещё одну гигантскую модель, команда Google построила систему, где несколько AML работают вместе во время инференса
Каждый агент выполняет свою роль:
- один пишет код
- другой ищет информацию,
- третий рассуждает текстом
Все они решают одну задачу независимо, затем обмениваются ответами, улучшают их и приходят к общему решению
Gemini 2.5 с TUMIX обошёл все другие системы рассуждения на +17.4 %,
при этом стоимость инференса снизилась почти в два раза
Без дополнительного обучения
Без новых данных
Просто - умная организация
Секрет не в размере, а в умении
Команда из 12 разных агентов показала результаты лучше, чем 12 копий “лучшего” одиночного AML
А когда Gemini сам спроектировал новых агентов, качество выросло ещё сильнее — система буквально эволюционировала сама себя
Следующий скачок в развитии AML может прийти не от триллиона параметров,а от сети маленьких моделей, которые учатся думать вместе
https://arxiv.org/pdf/2510.01279
Вместо того чтобы обучать ещё одну гигантскую модель, команда Google построила систему, где несколько AML работают вместе во время инференса
Каждый агент выполняет свою роль:
- один пишет код
- другой ищет информацию,
- третий рассуждает текстом
Все они решают одну задачу независимо, затем обмениваются ответами, улучшают их и приходят к общему решению
Gemini 2.5 с TUMIX обошёл все другие системы рассуждения на +17.4 %,
при этом стоимость инференса снизилась почти в два раза
Без дополнительного обучения
Без новых данных
Просто - умная организация
Секрет не в размере, а в умении
Команда из 12 разных агентов показала результаты лучше, чем 12 копий “лучшего” одиночного AML
А когда Gemini сам спроектировал новых агентов, качество выросло ещё сильнее — система буквально эволюционировала сама себя
Следующий скачок в развитии AML может прийти не от триллиона параметров,а от сети маленьких моделей, которые учатся думать вместе
https://arxiv.org/pdf/2510.01279
Cтатья А.П. Савина про умножение — в т.ч. про замечательный «русский крестьянский способ умножения»
https://www.kvant.digital/view/kvant_1992_2/32/
https://www.kvant.digital/view/kvant_1992_2/32/
Архив журнала «Квант»
Квант. — 1992. — № 2 / Просмотр номера // Архив журнала «Квант»
Квант: ежемесячный научно-популярный физико-математический журнал. — 1992. — № 2. — 80 с.