К вопросу о прогрессе. Агент от SakanaAI занял уверенное первое место на соревновании по кодингу. В прошлом году на этом же конкурсе агент от OpenAI занял только второе место.
В AtCoder Heuristic Contest в этом году принимало участие около 800 человек. ALE-Agent от японской лаборатории обошел всех и с приличным отрывом взял топ. Стоимость решения составила примерно $1300.
При этом, что интересно: сами авторы оптимизационной задачи этого года предполагали классический подход с использованием отжига и конструктивных эвристик, но агент Sakana пошел другим путем. Он внезапно реализовал эвристику virtual power, и это позволило ему выходить из локальных оптимумов даже лучше, чем эксперты-люди.
Агент представляет из себя достаточно хитрую обертку над (в данном случае) GPT‑5.2 high и Gemini 3 Pro high. Сами Sakana, в плане моделей, звезд с неба никогда не хватали, но научились грамотно работать с inference time scaling – и вот результат. Одним словом, молодцы.
https://sakana.ai/ahc058/
В AtCoder Heuristic Contest в этом году принимало участие около 800 человек. ALE-Agent от японской лаборатории обошел всех и с приличным отрывом взял топ. Стоимость решения составила примерно $1300.
При этом, что интересно: сами авторы оптимизационной задачи этого года предполагали классический подход с использованием отжига и конструктивных эвристик, но агент Sakana пошел другим путем. Он внезапно реализовал эвристику virtual power, и это позволило ему выходить из локальных оптимумов даже лучше, чем эксперты-люди.
Агент представляет из себя достаточно хитрую обертку над (в данном случае) GPT‑5.2 high и Gemini 3 Pro high. Сами Sakana, в плане моделей, звезд с неба никогда не хватали, но научились грамотно работать с inference time scaling – и вот результат. Одним словом, молодцы.
https://sakana.ai/ahc058/
👍135🔥54❤34☃4😁3❤🔥2
Очень интересная статья от MIT про дообучение моделей после деплоя
Фанфэкт: некоторые из авторов работают в OpenAI, так что читаем внимательно🤨
Подход красиво назвали тюленем: SEAL – Self-Adapting Language Models.
Суть тюленя в том, что модель учится извлекать из условных чатов информацию в таком виде, которая дообучит ее лучше всего. Звучит немного запутанно, поэтому разбираемся:
1. Модель получает на вход некоторый контекст и извлекает из него так называемые self-edit (SE). Это структура, на которой модель дальше будет дообучаться (например, список следствий/импликаций из абзаца).
2. Таких SE генерируется много, а затем по каждому из них мы делаем мини-файнтюн и смотрим, какие SE улучшили знания модели лучше всего. Тестирование проходит на той же downstream-задаче (например, вопросах по абзацу без подсказки-абзаца в контексте).
3. Чем лучше SE обучил модель, тем больший reward он получает. Далее политика генерации self-edit обновляется так, чтобы в следующий раз SE были более и полезными.
То есть модель как бы учиться выбирать наилучшую процедуру адаптации для самой себя. Красиво, да?
И работает неплохо. Из примера в статье: на бенчмарке SQuAD тюлень улучшил Qwen2.5-7B аж на 15 процентных пунктов. В сравнении, base model + дообучение на синтетике от сильной GPT-4.1 дает результат на пару процентов меньше, хотя разница в размере моделей «учителей» огромна.
Есть, конечно, и парочка НО. Например:
– Это адски дорого. Одна оценка self-edit занимает примерно 30–45 секунд. 750 итераций – это 6 часов на двух H100. Авторы предлагают это немного сгладить, применяя вместо мини-файнтюнингов Proxy reward, когда SE оценивает другая LLM. Это уже не так интересно, и метрики чуть хуже, но как вариант.
– Для тестов требуется разметка. Хотя тут, опять же, можно генерировать.
– Модели показывают деградацию на прошлых задачах по мере числа обновлений. Это частично лечится reward shaping, но полностью проблема не исчезает.
Стоит ли игра свеч, пока непонятно. Но идея прикольная. Статья полностью здесь -> https://arxiv.org/abs/2506.10943
Фанфэкт: некоторые из авторов работают в OpenAI, так что читаем внимательно
Подход красиво назвали тюленем: SEAL – Self-Adapting Language Models.
Суть тюленя в том, что модель учится извлекать из условных чатов информацию в таком виде, которая дообучит ее лучше всего. Звучит немного запутанно, поэтому разбираемся:
1. Модель получает на вход некоторый контекст и извлекает из него так называемые self-edit (SE). Это структура, на которой модель дальше будет дообучаться (например, список следствий/импликаций из абзаца).
2. Таких SE генерируется много, а затем по каждому из них мы делаем мини-файнтюн и смотрим, какие SE улучшили знания модели лучше всего. Тестирование проходит на той же downstream-задаче (например, вопросах по абзацу без подсказки-абзаца в контексте).
3. Чем лучше SE обучил модель, тем больший reward он получает. Далее политика генерации self-edit обновляется так, чтобы в следующий раз SE были более и полезными.
То есть модель как бы учиться выбирать наилучшую процедуру адаптации для самой себя. Красиво, да?
И работает неплохо. Из примера в статье: на бенчмарке SQuAD тюлень улучшил Qwen2.5-7B аж на 15 процентных пунктов. В сравнении, base model + дообучение на синтетике от сильной GPT-4.1 дает результат на пару процентов меньше, хотя разница в размере моделей «учителей» огромна.
Есть, конечно, и парочка НО. Например:
– Это адски дорого. Одна оценка self-edit занимает примерно 30–45 секунд. 750 итераций – это 6 часов на двух H100. Авторы предлагают это немного сгладить, применяя вместо мини-файнтюнингов Proxy reward, когда SE оценивает другая LLM. Это уже не так интересно, и метрики чуть хуже, но как вариант.
– Для тестов требуется разметка. Хотя тут, опять же, можно генерировать.
– Модели показывают деградацию на прошлых задачах по мере числа обновлений. Это частично лечится reward shaping, но полностью проблема не исчезает.
Стоит ли игра свеч, пока непонятно. Но идея прикольная. Статья полностью здесь -> https://arxiv.org/abs/2506.10943
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤87👍35🔥23🤔9😁2
Data Secrets
ИИ-система стартапа, существующего 4 месяца, решила 9/12 задач в одном из самых сложных в мире экзаменов по математике Putnam (полное название William Lowell Putnam Mathematical Competition) – это ежегодная очень сложная математическая олимпиада для студентов…
Агент Axiom Prover решил 12 из 12 задач на самом сложном математическом экзамене в мире
Возможно, вы помните, что это за система. В начале декабря (когда и проводился конкурс Putnam, о котором идет речь) она решила 8 из 12 задач за отведенное на олимпиаду время + еще одну вне зачета. Это очень классный результат: большинство студентов получает круглый ноль.
Теперь разработчики сообщили, что агент дорешал самые сложные оставшиеся задачи и выложили все его решения сюда.
Интересно, что среди задач явно выделяются группы таких, которые(1) просты для человека и сложны для ИИ; (2) и наоборот. Например:
– Комбинаторные задачи человек решает достаточно быстро, а Axiom Prover одна из таких обошлась в 2054 строки формального кода и 518 минут вычислений. Это из-за того, что Lean, в котором работает агент, требует формального доказательства даже очевидных фактов, и они получались крупными и долгими, хотя человеку было бы достаточно одной фразы.
– Есть задачи, где у ИИ и человека кардинально разный подход. Например, A4: люди думали алгебраически, а Axiom Prover внезапно подошел геометрически. Это занятно.
– А вот А6 ни один штатный математик Axiom не смог решить, а Axiom Prover довольно быстро довел решение от идеи до формального доказательства.
Короче: все равно люди все еще выигрывают в плане математической интуиции. Для ИИ задача становится сложной, если нет готовых библиотечных кирпичей + идеи. Плюс, внезапным узким местом становится доказательство мелких фактов (опять же, для человека это вопрос интуиции).
axiommath.ai/territory/from-seeing-why-to-checking-everything
Возможно, вы помните, что это за система. В начале декабря (когда и проводился конкурс Putnam, о котором идет речь) она решила 8 из 12 задач за отведенное на олимпиаду время + еще одну вне зачета. Это очень классный результат: большинство студентов получает круглый ноль.
Теперь разработчики сообщили, что агент дорешал самые сложные оставшиеся задачи и выложили все его решения сюда.
Интересно, что среди задач явно выделяются группы таких, которые(1) просты для человека и сложны для ИИ; (2) и наоборот. Например:
– Комбинаторные задачи человек решает достаточно быстро, а Axiom Prover одна из таких обошлась в 2054 строки формального кода и 518 минут вычислений. Это из-за того, что Lean, в котором работает агент, требует формального доказательства даже очевидных фактов, и они получались крупными и долгими, хотя человеку было бы достаточно одной фразы.
– Есть задачи, где у ИИ и человека кардинально разный подход. Например, A4: люди думали алгебраически, а Axiom Prover внезапно подошел геометрически. Это занятно.
– А вот А6 ни один штатный математик Axiom не смог решить, а Axiom Prover довольно быстро довел решение от идеи до формального доказательства.
Короче: все равно люди все еще выигрывают в плане математической интуиции. Для ИИ задача становится сложной, если нет готовых библиотечных кирпичей + идеи. Плюс, внезапным узким местом становится доказательство мелких фактов (опять же, для человека это вопрос интуиции).
axiommath.ai/territory/from-seeing-why-to-checking-everything
❤97👍56🔥21🤯6😁3🕊1👾1
У Суцкевера «нашли» 4 миллиарда долларов в акциях OpenAI
Все новые и новые интересные детальки пазла несет нам иск Илона Маска против OpenAI.
На этот раз в материалах дела оказалась переписка COO OpenAI Брэда Лайткапa с представителями Microsoft.
Когда в 2023 Альтмана внезапно уволили, Microsoft во главе с Сатьей Наделлой готовилась переманить его и команду OpenAI. CTO компании Кевин Скотт еще тогда публично говорил, что компания наняла бы и выровняла компенсации для любого сотрудника OpenAI, который ушел бы к ним вместе с Альтманом.
Но Альтмана в должности скоро восстановили, а вот переписки с обсуждением финансовых деталей – остались. И вот какая фраза в них есть:
То есть на момент ноября 2023 года у Ильи Суцкевера было около 4 млрд долларов доли в OpenAI. При этом подчеркивается, что 4 млрд – это только vested‑часть, а размер ещё не дозревших (unvested) опционов Суцкевера из переписки непонятен.
Короче, многих эта сумма, мягко говоря, удивила. Теперь Илью еще раз будут вызывать в суд для выяснения обстоятельств увольнения Сэма и выяснения его реальной доли в стартапе, потому что 4 миллиарда долларов превратили его в еще более заинтересованное лицо😐
Все новые и новые интересные детальки пазла несет нам иск Илона Маска против OpenAI.
На этот раз в материалах дела оказалась переписка COO OpenAI Брэда Лайткапa с представителями Microsoft.
Когда в 2023 Альтмана внезапно уволили, Microsoft во главе с Сатьей Наделлой готовилась переманить его и команду OpenAI. CTO компании Кевин Скотт еще тогда публично говорил, что компания наняла бы и выровняла компенсации для любого сотрудника OpenAI, который ушел бы к ним вместе с Альтманом.
Но Альтмана в должности скоро восстановили, а вот переписки с обсуждением финансовых деталей – остались. И вот какая фраза в них есть:
…чтобы выкупить доли сотрудников в рамках тендерного предложения, потребуется около 25 млрд долларов без учета пакета Суцкевера и примерно 29 млрд, если выкупать и его единицы.
То есть на момент ноября 2023 года у Ильи Суцкевера было около 4 млрд долларов доли в OpenAI. При этом подчеркивается, что 4 млрд – это только vested‑часть, а размер ещё не дозревших (unvested) опционов Суцкевера из переписки непонятен.
Короче, многих эта сумма, мягко говоря, удивила. Теперь Илью еще раз будут вызывать в суд для выяснения обстоятельств увольнения Сэма и выяснения его реальной доли в стартапе, потому что 4 миллиарда долларов превратили его в еще более заинтересованное лицо
Please open Telegram to view this post
VIEW IN TELEGRAM
1 213👍58❤24 11😁8🔥6🗿3
Есть две новости от Anthropic, и одна из них, предупреждаем, болезненная
На самом деле, они обе про одно и то же: Anthropic с разных концов затягивает гайки в политике использования их моделей для кодинга, и конкретно Claude Opus 4.5. Он сейчас негласно считается лучшим на рынке.
Так вот:
1. Anthropic отрезал xAI от Opus 4.5 в Cursor. Выяснилось, что разработчики xAI довольно активно использовали Claude для кодинга. Анропикам это не слишком понравилось, и они без церемоний просто отключили тем доступ.
Но тут, в целом, ничего нового. У них в условиях уже давно прописано, что их модели нельзя использовать для разработки конкурирующих продуктов. Так что это было вопросом времени. Разрабам xAI, конечно, соболезнуем.
2. Anthropic запретил прокидывать подписку Claude в сторонние клиенты типа OpenCode. И вот это уже по больному.
Раньше в OpenCode можно было использовать вашу купленную подписку Claude и использовать ее в тех же режимах и с теми же лимитами, что и в официальном клиенте. И это было в куууучу раз дешевле, чем напрямую покупать токены по API.
Теперь Anthropic лавочку прикрыли и оправдались тем, что подобное «портит им UX». Типа если что-то сломается у OpenCode, пользователь обвинит сервис Anthropic, а не интеграцию, и это бьет по репутации стартапа.
Звучит не очень убедительно. На самом деле страдает не репутация, а юнит-экономика + стратегия. В целом, понять Anthropic можно.
Теперь уже сочувствуем любителям OpenCode. В соцсетях ищут способ обойти ограничения, но из надежного пока ничего. F, короче
На самом деле, они обе про одно и то же: Anthropic с разных концов затягивает гайки в политике использования их моделей для кодинга, и конкретно Claude Opus 4.5. Он сейчас негласно считается лучшим на рынке.
Так вот:
1. Anthropic отрезал xAI от Opus 4.5 в Cursor. Выяснилось, что разработчики xAI довольно активно использовали Claude для кодинга. Анропикам это не слишком понравилось, и они без церемоний просто отключили тем доступ.
Но тут, в целом, ничего нового. У них в условиях уже давно прописано, что их модели нельзя использовать для разработки конкурирующих продуктов. Так что это было вопросом времени. Разрабам xAI, конечно, соболезнуем.
2. Anthropic запретил прокидывать подписку Claude в сторонние клиенты типа OpenCode. И вот это уже по больному.
Раньше в OpenCode можно было использовать вашу купленную подписку Claude и использовать ее в тех же режимах и с теми же лимитами, что и в официальном клиенте. И это было в куууучу раз дешевле, чем напрямую покупать токены по API.
Теперь Anthropic лавочку прикрыли и оправдались тем, что подобное «портит им UX». Типа если что-то сломается у OpenCode, пользователь обвинит сервис Anthropic, а не интеграцию, и это бьет по репутации стартапа.
Звучит не очень убедительно. На самом деле страдает не репутация, а юнит-экономика + стратегия. В целом, понять Anthropic можно.
Теперь уже сочувствуем любителям OpenCode. В соцсетях ищут способ обойти ограничения, но из надежного пока ничего. F, короче
👍124😁62 54❤31🤯8🫡8☃2😎1
Data Secrets
OpenAI немного переборщили с маркетингом и опозорились на весь Твиттер Помните, мы рассказывали, что GPT-5 "решила" открытую задачу по математике из списка Эрдёша? Кратко освежаем память: решить-то модель задачу решила, вот только решение было не ее. Она…
На этой неделе GPT-5.2 Pro решила уже две открытые математические задачи, которые люди не могли решить на протяжении многих лет
Речь снова пойдет про список Эрдеша. И тут сразу оговорка для тех, кто помнит октябрьскую историю (GPT-5 просто откопала ответ на задачку в старых статьях, а в OpenAI заявили, что она «нашла решение»): на этот раз все честно, автономность решения в обоих случаях подтвердил сам Теренс Тао.
Итак:
1. Первая задачка – под номером 728. Ее отдал GPT-5.2 сам Теренс. Прикол с этой задачкой в том, что исходная формулировка Эрдеша была неверной, и корректная постановка была получена только несколько месяцев назад, так что предшествующей литературы по ней вообще не было.
Обратите внимание на последнее предложение: это не умаляет результат, НО модель все еще воспроизводит известные доказательства, а не придумывает что-то нечеловеческое.
2. Вторая – № 397. Ее засабмитил Нил Сомани, а проверил Теренс.
Речь снова пойдет про список Эрдеша. И тут сразу оговорка для тех, кто помнит октябрьскую историю (GPT-5 просто откопала ответ на задачку в старых статьях, а в OpenAI заявили, что она «нашла решение»): на этот раз все честно, автономность решения в обоих случаях подтвердил сам Теренс Тао.
Итак:
1. Первая задачка – под номером 728. Ее отдал GPT-5.2 сам Теренс. Прикол с этой задачкой в том, что исходная формулировка Эрдеша была неверной, и корректная постановка была получена только несколько месяцев назад, так что предшествующей литературы по ней вообще не было.
Задача была решена более или менее автономно (после получения обратной связи по результатам первоначальной попытки), и результат (насколько нам известно) не был воспроизведен в литературе (хотя были найдены результаты, доказанные аналогичными методами).
Обратите внимание на последнее предложение: это не умаляет результат, НО модель все еще воспроизводит известные доказательства, а не придумывает что-то нечеловеческое.
2. Вторая – № 397. Ее засабмитил Нил Сомани, а проверил Теренс.
Доказательство было сгенерировано GPT 5.2 Pro и оформлено с помощью Harmonic.
Много открытых проблем просто сидят и ждут, когда кто-нибудь предложит ChatGPT решить их.
❤🔥150👍66❤37🤯16🕊7😁5🔥4🤨4🤔1🏆1🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic анонсировали Cowork: computer use агента для non-coding рабочих задач
Это буквально Claude Code для отдельной директории на вашем компьютере. Cowork сможет читать, изменять и создавать файлы в конкретной папке, к которой вы его подключите.
Например, можно попросить его создать таблицу по каким-нибудь данным или сделать саммари по набору файлов.
Все будет происходить ровно как в Claude Code: сначала агент составляет план, потом исполняет его, дергая вас перед важными изменениями.
Можно подключить ваши существующие коннекторы или, например, связать агента с Claude в Chrome для задач, которые требуют выхода в Интернет.
Пока продукт доступен в качестве Research Preview, только для подписчиков Max и только на Mac. Скачивать тут
Блогпост | Лист ожидания
Это буквально Claude Code для отдельной директории на вашем компьютере. Cowork сможет читать, изменять и создавать файлы в конкретной папке, к которой вы его подключите.
Например, можно попросить его создать таблицу по каким-нибудь данным или сделать саммари по набору файлов.
Все будет происходить ровно как в Claude Code: сначала агент составляет план, потом исполняет его, дергая вас перед важными изменениями.
Можно подключить ваши существующие коннекторы или, например, связать агента с Claude в Chrome для задач, которые требуют выхода в Интернет.
Пока продукт доступен в качестве Research Preview, только для подписчиков Max и только на Mac. Скачивать тут
Блогпост | Лист ожидания
❤77👍45🗿15🔥12🤯6🫡6🤔4😁1🦄1 1
OpenAI купили Torch
Если вы поймали мини-инфаркт в первую секунду чтения этой новости – знайте, мы тоже
Но расслабьтесь, это не тот Torch. На самом деле ничего особо интересного: это, оказывается, такой стартап в сфере здравоохранения, который строит а-ля medical memory for AI. OpenAI поглощает его для ChatGPT Health.
Если вы поймали мини-инфаркт в первую секунду чтения этой новости – знайте, мы тоже
Но расслабьтесь, это не тот Torch. На самом деле ничего особо интересного: это, оказывается, такой стартап в сфере здравоохранения, который строит а-ля medical memory for AI. OpenAI поглощает его для ChatGPT Health.
😁376❤59🔥23🤯12 9🤨2🎄1
Anthropic инвестируют полтора миллиона долларов в Python и опенсорс
Anthropic заключила двухлетнее партнерство с Python Software Foundation (PSF). В течение этого периода стартап вложит в сумме 1.5 млн долларов с упором на развитие безопасности и поддержку ключевой инфраструктуры.
В частности, пишут, что планируют создать AI‑инструменты, которые будут автоматически проверять каждый загружаемый на PyPI пакет. Сейчас такого проактивного анализа не существует, только постфактум реакция на жалобы юзеров.
На первом этапе будут собирать огромный датасет известного малвара. Может, его даже выложат в опенсорс.
Anthropic точно что-то знают о том, как заслужить общественную симпатию
pyfound.blogspot.com/2025/12/anthropic-invests-in-python.html
Anthropic заключила двухлетнее партнерство с Python Software Foundation (PSF). В течение этого периода стартап вложит в сумме 1.5 млн долларов с упором на развитие безопасности и поддержку ключевой инфраструктуры.
В частности, пишут, что планируют создать AI‑инструменты, которые будут автоматически проверять каждый загружаемый на PyPI пакет. Сейчас такого проактивного анализа не существует, только постфактум реакция на жалобы юзеров.
На первом этапе будут собирать огромный датасет известного малвара. Может, его даже выложат в опенсорс.
Anthropic точно что-то знают о том, как заслужить общественную симпатию
pyfound.blogspot.com/2025/12/anthropic-invests-in-python.html
❤333👍117🔥49😁14 6 4🐳3
Так, у нас на повестке дня очередной скандал. Из Thinking Machines Lab (стартап Миры Мурати) ушли еще двое основателей – Баррет Зоф и Люк Метц.
Баррет занимал пост CTO. Он, вроде как, ушел по собственному желанию, но некоторые источники пишут, что это произошло из-за «неэтичного поведения».
В частности, какой-то источник, «близкий к Thinking Machines», заявил Wired, что Баррет делился конфиденциальной информацией о компании с конкурентами.
И Зоф, и Метц теперь возвращаются в OpenAI (откуда их когда-то и увела Мира). В Thinking Machines место CTO теперь займет Сумит Чинтала – один из ключевых разработчиков PyTorch.
Получается, по итогам менее одного года существования стартапа из него уже ушло 3/6 создателей (пару месяцев назад Meta переманили Эндрю Таллока). Интересный тренд😐
Баррет занимал пост CTO. Он, вроде как, ушел по собственному желанию, но некоторые источники пишут, что это произошло из-за «неэтичного поведения».
В частности, какой-то источник, «близкий к Thinking Machines», заявил Wired, что Баррет делился конфиденциальной информацией о компании с конкурентами.
И Зоф, и Метц теперь возвращаются в OpenAI (откуда их когда-то и увела Мира). В Thinking Machines место CTO теперь займет Сумит Чинтала – один из ключевых разработчиков PyTorch.
Получается, по итогам менее одного года существования стартапа из него уже ушло 3/6 создателей (пару месяцев назад Meta переманили Эндрю Таллока). Интересный тренд
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
⚡ 2026 год и без AI: как внедрить нейросети и не сойти с ума
Про тренды, экономику ML и реальные кейсы AI-решений для бизнеса — в новом сезоне подкаста Selectel «Сегодня на ретро»
Число AI-решений растет, а конкретных ответов на вопросы так нет. Чтобы разделить практическую пользу и хайп, Selectel посвятил ML новый сезон подкаста «Сегодня на ретро». В нем провайдер вместе с гостями из X5 Digital, Точка Банка, Контура и других компаний обозревают тренды ИИ, бенчмарки ML-моделей и актуальные кейсы.
👀 Почему стоит посмотреть подкаст?
Selectel собрал базу реальных бизнес-проектов, советов и конкретных инфраструктурных решений, в том числе в сфере ML и AI. Он уже помог компаниям из разных индустрий выстроить эффективную IT-инфраструктуру для внедрения нейросетей, а в подкасте резюмировал этот опыт.
▶️ Смотрите выпуски на YouTube-канале Selectel — и разбирайтесь в трендах AI-решений для бизнеса на 2026 год: https://slc.tl/80cls
Реклама. АО "Селектел". erid:2W5zFJfmZf6
Про тренды, экономику ML и реальные кейсы AI-решений для бизнеса — в новом сезоне подкаста Selectel «Сегодня на ретро»
Число AI-решений растет, а конкретных ответов на вопросы так нет. Чтобы разделить практическую пользу и хайп, Selectel посвятил ML новый сезон подкаста «Сегодня на ретро». В нем провайдер вместе с гостями из X5 Digital, Точка Банка, Контура и других компаний обозревают тренды ИИ, бенчмарки ML-моделей и актуальные кейсы.
👀 Почему стоит посмотреть подкаст?
Selectel собрал базу реальных бизнес-проектов, советов и конкретных инфраструктурных решений, в том числе в сфере ML и AI. Он уже помог компаниям из разных индустрий выстроить эффективную IT-инфраструктуру для внедрения нейросетей, а в подкасте резюмировал этот опыт.
▶️ Смотрите выпуски на YouTube-канале Selectel — и разбирайтесь в трендах AI-решений для бизнеса на 2026 год: https://slc.tl/80cls
Реклама. АО "Селектел". erid:2W5zFJfmZf6
😁19🗿17❤2👍2🤯2🕊1
GPT-5.2 Codex теперь доступна в Cursor, и она может оказаться лучше Opus 4.5
Сами Cursor пишут, что модель лучше справляется с длинными задачами.
CEO Cursor написал у себя в Твиттере, что они с командой создали с помощью GPT-5.2 готовый браузер. Для этого модель без остановки работала неделю.
И да, браузер получился рабочий (не Chrome, конечно, но в целом-то!). Всего вышло около 3 миллионов строк кода, распределенного по тысячам файлов. Код открыли. Больше об эксперименте пишут тут.
По метрикам GPT-5.2 немного обгоняет Opus 4.5 на SWE bench Pro, но разрыв прям небольшой. Интересно, как будет ощущаться разница на практике.
Есть кто уже попробовал? Как вам по сравнению с Opus?
Сами Cursor пишут, что модель лучше справляется с длинными задачами.
Мы обнаружили, что модели GPT-5.2 гораздо лучше справляются с продолжительной автономной работой: следованием инструкциям, сохранением концентрации, предотвращением отклонений и точным и полным выполнением задач. Opus 4.5, как правило, останавливается раньше и использует упрощенные методы, когда это удобно.
CEO Cursor написал у себя в Твиттере, что они с командой создали с помощью GPT-5.2 готовый браузер. Для этого модель без остановки работала неделю.
И да, браузер получился рабочий (не Chrome, конечно, но в целом-то!). Всего вышло около 3 миллионов строк кода, распределенного по тысячам файлов. Код открыли. Больше об эксперименте пишут тут.
По метрикам GPT-5.2 немного обгоняет Opus 4.5 на SWE bench Pro, но разрыв прям небольшой. Интересно, как будет ощущаться разница на практике.
Есть кто уже попробовал? Как вам по сравнению с Opus?
🔥99👍37😁20 10❤9 8🤨3🤗1
OpenAI релизнули собственный сервис для перевода, и у Google почти одновременно вышли новые открытые модели TranslateGemma
Конкуренция двух лабораторий принимает какие-то абсолютно беспрецедентные обороты. По крайней мере, случайность это или нет, с точностью до дня выпускать продукты для одного и того же сценария использования – это сильно.
Итак:
➖ OpenAI выпустили полноценный собственный переводчик. Выглядит буквально как Google Translate и поддерживает 50 языков.
Из плюсов: можно менять стиль перевода от разговорного до официального. Из минусов: пока только текст. Скоро обещают добавить картинки и аудио-ввод. В общем, сыровато, но интересно. https://chatgpt.com/translate/
➖ Google выпустили TranslateGemma. Это открытое семейство, основанное на Gemma 3. Поддерживается 55 языков. Доступны размеры на 4В, 12В и 27В.
То есть возможности запуска – вплоть до локального. При этом перформить, например, модель на 4В будет как Gemma-3 12B. Мультимодальность в комплекте. Веса. Блогпост.
Для привлечения широкой аудитории релиз OpenAI, конечно, масштабнее. Но, имхо, опенсорс от Google приятнее.
Конкуренция двух лабораторий принимает какие-то абсолютно беспрецедентные обороты. По крайней мере, случайность это или нет, с точностью до дня выпускать продукты для одного и того же сценария использования – это сильно.
Итак:
Из плюсов: можно менять стиль перевода от разговорного до официального. Из минусов: пока только текст. Скоро обещают добавить картинки и аудио-ввод. В общем, сыровато, но интересно. https://chatgpt.com/translate/
То есть возможности запуска – вплоть до локального. При этом перформить, например, модель на 4В будет как Gemma-3 12B. Мультимодальность в комплекте. Веса. Блогпост.
Для привлечения широкой аудитории релиз OpenAI, конечно, масштабнее. Но, имхо, опенсорс от Google приятнее.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤144👍71🔥26😁12✍2🤨1
Data Secrets
OpenAI релизнули собственный сервис для перевода, и у Google почти одновременно вышли новые открытые модели TranslateGemma Конкуренция двух лабораторий принимает какие-то абсолютно беспрецедентные обороты. По крайней мере, случайность это или нет, с точностью…
Это вам от OpenAI за то что весь год вели себя плохо
3😁613 41🤓14🔥9 8❤6🤨4💯2👍1
Однажды Эрнест Хемингуэй поспорил, что напишет самый короткий рассказ в мире, способный растрогать любого…
До появления AI-агентов для кодинга у меня постоянно было 2-3 пет-проекта, которые я не мог закончить.
ИИ полностью изменил игру.
Сейчас у меня 15-20 незавершенных пет-проектов.
😁656❤56👍37💯15🔥4🕊4 2🤯1🤝1
Последний шанс запрыгнуть в подготовку к ШАД
Если в целях на год у вас есть профессиональный апгрейд или поступление в сильную ИИ-школу, то этот пост для вас.
Подготовка к ШАД и AI-магистратурам занимает очень много времени. Так что сейчас точно пора начать.
Быстрее и качественнее пройти путь подготовки могут помочь наши друзья из SHAD Helper. Они более 6 лет готовят людей к ШАД и хардовым магам, поступили более 120 человек, отзывы отличные.
Главная ценность курса – в комплексной подготовке по всем необходимым направлениям от преподавателей из МГУ, МФТИ, ВШЭ. Нагрузка не маленькая, но совмещать курс с работой или основной учебой реально.
Детально программу можно посмотреть здесь: тут вам и дискретка, и алгоритмы, и теорвер – словом, действительно все необходимое.
Если вы еще думаете, вот что стоит сделать 100%:
1. Посетить бесплатный вебинар 20 января. Там обсудят способы подготовки и очень подробно расскажут про курс. Можно будет задать вопросы выпускникам. Регистрация тут.
2. Пройти бесплатный тест на уровень знаний на сайте. Он с высокой точностью определит, насколько реально будет поступить в этом году.
3. Запланировать 15-минутный звонок с академическим куратором. Вы получите материалы первой недели, узнаете детали программы и сможете задать все свои вопросы.
🎁 И не забудьте при регистрации на курс воспользоваться промокодом для наших подписчиков – 30% на первоначальный взнос DS30.
Действуйте!
Реклама. ООО "Школа Высшей Математики", ИНН 9728100991, erid 2Vtzqvh87nT
Если в целях на год у вас есть профессиональный апгрейд или поступление в сильную ИИ-школу, то этот пост для вас.
Подготовка к ШАД и AI-магистратурам занимает очень много времени. Так что сейчас точно пора начать.
Быстрее и качественнее пройти путь подготовки могут помочь наши друзья из SHAD Helper. Они более 6 лет готовят людей к ШАД и хардовым магам, поступили более 120 человек, отзывы отличные.
Главная ценность курса – в комплексной подготовке по всем необходимым направлениям от преподавателей из МГУ, МФТИ, ВШЭ. Нагрузка не маленькая, но совмещать курс с работой или основной учебой реально.
Детально программу можно посмотреть здесь: тут вам и дискретка, и алгоритмы, и теорвер – словом, действительно все необходимое.
Если вы еще думаете, вот что стоит сделать 100%:
1. Посетить бесплатный вебинар 20 января. Там обсудят способы подготовки и очень подробно расскажут про курс. Можно будет задать вопросы выпускникам. Регистрация тут.
2. Пройти бесплатный тест на уровень знаний на сайте. Он с высокой точностью определит, насколько реально будет поступить в этом году.
3. Запланировать 15-минутный звонок с академическим куратором. Вы получите материалы первой недели, узнаете детали программы и сможете задать все свои вопросы.
Действуйте!
Реклама. ООО "Школа Высшей Математики", ИНН 9728100991, erid 2Vtzqvh87nT
Please open Telegram to view this post
VIEW IN TELEGRAM
😁47🗿30❤15🤨6✍4👍2 1
В Anthropic возникло занятное новое подразделение – Anthropic Labs
Это будет, по сути, продвинутая продуктовая песочница. Основная идея состоит в том, чтобы быстро тестировать сырые продуктовые идеи и экспериментировать с возможностями ИИ.
Раньше этим занимались обычные продуктовые команды, но, по словам Anthropic, теперь они уже не успевают за развитием моделей и просто не могут обрабатывать все идеи в рамках стандартного плана.
Возглавит отдел Майк Кригер, сооснователь Instagram и до недавнего времени главный по продуктам в Anthropic.
Направление, на самом деле, перспективное. Именно из таких экспериментов выросли Claude Code, MCP, свежий Cowork, Claude in Chrome и тд.
Это значит, что теперь можно ожидать еще больше маленьких и больших продуктов от Anthropic. Некоторые будут интересные, некоторые, возможно, сыроватые (не забываем, что подразделения создано именно для экспериментов и быстрых MVP-тестов).
Слишком больших ожиданий не строим, но, может, отсюда родится даже что-то прорывное – почему бы и нет.
www.anthropic.com/news/introducing-anthropic-labs
Это будет, по сути, продвинутая продуктовая песочница. Основная идея состоит в том, чтобы быстро тестировать сырые продуктовые идеи и экспериментировать с возможностями ИИ.
Раньше этим занимались обычные продуктовые команды, но, по словам Anthropic, теперь они уже не успевают за развитием моделей и просто не могут обрабатывать все идеи в рамках стандартного плана.
Возглавит отдел Майк Кригер, сооснователь Instagram и до недавнего времени главный по продуктам в Anthropic.
Направление, на самом деле, перспективное. Именно из таких экспериментов выросли Claude Code, MCP, свежий Cowork, Claude in Chrome и тд.
Это значит, что теперь можно ожидать еще больше маленьких и больших продуктов от Anthropic. Некоторые будут интересные, некоторые, возможно, сыроватые (не забываем, что подразделения создано именно для экспериментов и быстрых MVP-тестов).
Слишком больших ожиданий не строим, но, может, отсюда родится даже что-то прорывное – почему бы и нет.
www.anthropic.com/news/introducing-anthropic-labs
🔥106👍33 22❤10😁9❤🔥2🎉2👌1
Data Secrets
Не очень радостную новость вам принесли под Новый Год, но что делать: реклама в ChatGPT точно будет, и довольно скоро Об этом сообщает The Information, а в том, что касается инсайтов, они обычно не ошибаются. Ранее, если помните, запуск рекламы отложился…
Все, эра рекламы в ChatGPT официально объявляется открытой
Пост от OpenAI:
Пример, как это будет выглядеть, выше⬆️
Удивляться не стоит,бесплатный сыр только в мышеловке бесплатное общение с ИИ не могло длиться вечно, инвесторы просят прибыль. Пока что стартап хотя бы делает вид, что все будет в рамках этики современного Интернета. Но к чему это приведет в конечном счете – большой вопрос.
Пост от OpenAI:
В ближайшие недели мы планируем начать тестирование рекламы в бесплатном тарифе ChatGPT и тарифе Go <Это новый тариф за 8 долларов в месяц. Раньше он работал только в Индии, теперь развернули на всех>.
Мы заранее делимся нашими принципами подхода к рекламе, руководствуясь в первую очередь доверием пользователей и прозрачностью, стремясь сделать ИИ доступным для всех.
Что имеет наибольшее значение:
– Ответы в ChatGPT не будут зависеть от рекламы.
– Объявления всегда размещаются отдельно и имеют четкую маркировку.
– Ваши переписки недоступны для рекламодателей.
Кроме того, в тарифных планах Pro, Business и Enterprise реклама присутствовать не будет.
Пример, как это будет выглядеть, выше
Удивляться не стоит,
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁808🫡52❤26 13🔥8🤨8 7❤🔥3👍3🤯1🤩1