Говорят, что относительно прошлой версии модель стала намного более эмпатичной и чуткой, а еще ей существенно прокачали creative writing.
Показывают даже SOTA-результаты на EQ-Bench (это бенчмарк с задачками на всякие soft skills). Но с новой версией GPT-5.1 сравнения нет.
Это все круто, но главный результат, на наш взгляд: модель галлюцинирует в три раза реже, чем предыдущая версия. Вот это правда здорово.
Что касается остальных метрик – бенчмарков нет. Известно только, что модель опять выбила первое место на LMArena, и причем довольно уверено: предыдущего лидера Gemini 2.5 Pro версия Thinking обогнала на 31 балл.
Уже раскатано на всех, можно пробовать
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍93❤27😁15🔥3😎3 1
Джефф Безос основал ИИ-стартап Project Prometheus
Пока подробностей немного: компания находится в стелс моде. Известно только, что Безос уже собрал 6.2 миллиарда долларов инвестиций, часть из которых вложил сам, и что он будет занимать роль Co-Chief Executive.
Ключевая цель стартапа заявляется как «ускорение научных открытый и повышение эффективности классических производственных процессов». В компании хотят сделать ставку на ИИ, который будет учится на реальных физических экспериментах и данных.
Звучит занятно, конечно. Некоторые издания пишут, что в команде уже почти 100 опытных исследователей. И еще есть изюминка: ожидается тесная связь стартапа с Blue Origin, аэрокосмической компанией Безоса.
Пока подробностей немного: компания находится в стелс моде. Известно только, что Безос уже собрал 6.2 миллиарда долларов инвестиций, часть из которых вложил сам, и что он будет занимать роль Co-Chief Executive.
Ключевая цель стартапа заявляется как «ускорение научных открытый и повышение эффективности классических производственных процессов». В компании хотят сделать ставку на ИИ, который будет учится на реальных физических экспериментах и данных.
Звучит занятно, конечно. Некоторые издания пишут, что в команде уже почти 100 опытных исследователей. И еще есть изюминка: ожидается тесная связь стартапа с Blue Origin, аэрокосмической компанией Безоса.
1🔥83👍22❤15☃5 4😁2✍1
Топы Google недвусмысленно намекают на выход Gemini 3 (а Андрей Карпаты подливает масла в огонь в своем стиле)
Ждем релиз сегодня?
Ждем релиз сегодня?
😁236🍓47❤26🔥2👍1🗿1
Data Secrets
Топы Google недвусмысленно намекают на выход Gemini 3 (а Андрей Карпаты подливает масла в огонь в своем стиле) Ждем релиз сегодня?
Там слили тех.карту Gemini 3.0 с бенчмарками
Смотрим:
– На многих бенчмарках существенно обходит GPT-5.1 и Sonnet 4.5. Особенно выделяется Humanity's Last Exam и ARC-AGI 2.
– Крутые результаты на бенчмарках, связанных со всякими агентскими способностями, пониманием изображений, видео и интерфейсов. Это многообещающе.
– В кодинге без чудес: относительно Gemini 2.5 Pro прирост хороший, но в целом уровень Sonnet 4.5.
Ждем официальный релиз, должно быть интересно.
P.S. pdf-ку полностью можно найти в комментариях под предыдущим постом
Смотрим:
– На многих бенчмарках существенно обходит GPT-5.1 и Sonnet 4.5. Особенно выделяется Humanity's Last Exam и ARC-AGI 2.
– Крутые результаты на бенчмарках, связанных со всякими агентскими способностями, пониманием изображений, видео и интерфейсов. Это многообещающе.
– В кодинге без чудес: относительно Gemini 2.5 Pro прирост хороший, но в целом уровень Sonnet 4.5.
Ждем официальный релиз, должно быть интересно.
P.S. pdf-ку полностью можно найти в комментариях под предыдущим постом
🔥120🏆25❤18👍8😁6🤯4🤨1
Полезная информация для тех, кто поступает в ШАД в 2026
Напоминаем, что набор в ШАД и все вступительные начинаются весной. Так что если хотите успеть поступить в 2026 – уже во всю пора готовиться, времени остается немного, а материала куча.
Если хотите готовиться организованно и существенно повысить свои шансы, рекомендуем обратить внимание на курс от ShadHelper, он как раз стартует 24 ноября.
Ребята в своем ремесле лучшие, они готовят людей к ШАД и другим хардовым школам и магистратурам более 6 лет, а занятия у них ведут преподаватели из МГУ, МФТИ и ВШЭ. Сильная математическая база, много практики, персонализированные домашки – это все про них.
20 ноября, в четверг, они проведут бесплатный вебинар. Там подробнее изложат программу курса, а также расскажут про все возможные варианты подготовки к ШАД за 6 месяцев, включая самостоятельную подготовку. Сходить стоит абсолютно всем, кто думает о ШАД.
И, кстати, если вы пока не собираетесь в ШАД или магу, но хотите ощутимо подтянуть свои знания – курс зайдет и вам. В нем еще много ништяков кроме самого содержания: например, за успеваемость дают скидки. Вот лендинг со всей полезной информацией.
Для всех наших подписчиков доступен промокод на 30% на первоначальный взнос: DS30.
Напоминаем, что набор в ШАД и все вступительные начинаются весной. Так что если хотите успеть поступить в 2026 – уже во всю пора готовиться, времени остается немного, а материала куча.
Если хотите готовиться организованно и существенно повысить свои шансы, рекомендуем обратить внимание на курс от ShadHelper, он как раз стартует 24 ноября.
Ребята в своем ремесле лучшие, они готовят людей к ШАД и другим хардовым школам и магистратурам более 6 лет, а занятия у них ведут преподаватели из МГУ, МФТИ и ВШЭ. Сильная математическая база, много практики, персонализированные домашки – это все про них.
20 ноября, в четверг, они проведут бесплатный вебинар. Там подробнее изложат программу курса, а также расскажут про все возможные варианты подготовки к ШАД за 6 месяцев, включая самостоятельную подготовку. Сходить стоит абсолютно всем, кто думает о ШАД.
И, кстати, если вы пока не собираетесь в ШАД или магу, но хотите ощутимо подтянуть свои знания – курс зайдет и вам. В нем еще много ништяков кроме самого содержания: например, за успеваемость дают скидки. Вот лендинг со всей полезной информацией.
Для всех наших подписчиков доступен промокод на 30% на первоначальный взнос: DS30.
🤨45🗿21❤11🤓7👍3😁3🔥2🐳2
Data Secrets
Там слили тех.карту Gemini 3.0 с бенчмарками Смотрим: – На многих бенчмарках существенно обходит GPT-5.1 и Sonnet 4.5. Особенно выделяется Humanity's Last Exam и ARC-AGI 2. – Крутые результаты на бенчмарках, связанных со всякими агентскими способностями…
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥106❤24 18😁2⚡1👍1
Data Secrets
Маск держался на вершине LMArena целых пол дня. Поздравляем!
😁342 46🔥23❤10🤨4🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
А еще в Google появился свежий AI Mode на базе Gemini 3
Теперь это интерактивная функция (см пример на видео). Кроме текста в ответах будут доступны динамические визуальные раскладки, интерактивные инструменты, симуляции и даже мини-приложения, в которые можно потыкаться.
По черрипикам выглядит прикольно. Плюс, что-то подобное сейчас выкатывают в Google Scholar✨
Короче, нас однозначно ждет еще куча интересных продуктов на базе Gimini 3
Теперь это интерактивная функция (см пример на видео). Кроме текста в ответах будут доступны динамические визуальные раскладки, интерактивные инструменты, симуляции и даже мини-приложения, в которые можно потыкаться.
По черрипикам выглядит прикольно. Плюс, что-то подобное сейчас выкатывают в Google Scholar
Короче, нас однозначно ждет еще куча интересных продуктов на базе Gimini 3
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍90🔥53❤19😁2🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Новая ИИ-IDE Antigravity от Google: первые впечатления
Главное, почему стоит хотя бы попробовать: Antigravity пока что доступна со всем своим функционалом абсолютно бесплатно на MacOS, Windows и Linux. Дают 50 запросов каждые 5 часов. Google знают, как привлечь внимание.
Что касается наполнения:
– Есть привычный editor и тут в целом ничего нового: можно вручную писать и править код, включать автокомплит, общаться с агентом и тд. Хорошо прокачано планирование и работа с артефактами, а так тот же Cursor (только сыроватый).
– Что интересно, так это режим асинхронного программирования Inbox. Это панель оркестрации агентов. Выглядит реально как почта, в которой вы ставите задачи разным агентам и можете отслеживать результат в рамках единого окна коммуникации, за рамками основного кода.
Так можно работать даже с несколькими проектами одновременно. А задачки можно назначать как параллельно, так и упорядочить в очередь.
– Еще одна приятная фича: интеграция с Chrome. Это расширение, в котором агент начинает работать в режиме computer use. Он может запустить приложение локально, поднять сервер, автоматически пройтись по страницам, проверить наличие элементов, что-то потестить, сделать скриншоты и тд. Выглядит круче, чем в Cursor.
Что пока оставляет желать лучшего, так это интеграция с GitHub и git, а также стабильность. На macOS иногда лагает, а при входе с VPN у многих все падает в бесконечную загрузку.
https://antigravity.google/
Главное, почему стоит хотя бы попробовать: Antigravity пока что доступна со всем своим функционалом абсолютно бесплатно на MacOS, Windows и Linux. Дают 50 запросов каждые 5 часов. Google знают, как привлечь внимание.
Что касается наполнения:
– Есть привычный editor и тут в целом ничего нового: можно вручную писать и править код, включать автокомплит, общаться с агентом и тд. Хорошо прокачано планирование и работа с артефактами, а так тот же Cursor (только сыроватый).
– Что интересно, так это режим асинхронного программирования Inbox. Это панель оркестрации агентов. Выглядит реально как почта, в которой вы ставите задачи разным агентам и можете отслеживать результат в рамках единого окна коммуникации, за рамками основного кода.
Так можно работать даже с несколькими проектами одновременно. А задачки можно назначать как параллельно, так и упорядочить в очередь.
– Еще одна приятная фича: интеграция с Chrome. Это расширение, в котором агент начинает работать в режиме computer use. Он может запустить приложение локально, поднять сервер, автоматически пройтись по страницам, проверить наличие элементов, что-то потестить, сделать скриншоты и тд. Выглядит круче, чем в Cursor.
Что пока оставляет желать лучшего, так это интеграция с GitHub и git, а также стабильность. На macOS иногда лагает, а при входе с VPN у многих все падает в бесконечную загрузку.
https://antigravity.google/
❤80🔥39👍18😁6☃2
Media is too big
VIEW IN TELEGRAM
Anthropic заключили инвестиционное соглашение с Microsoft и Nvidia на 45 миллиардов долларов
Схема следующая:
– Anthropic обязуются выделить 30 миллиардов на покупку мощностей Azure, это примерно 1ГВт
– Nvidia при этом вкладывает в стартап 10 миллиардов, а Microsoft 5 миллиардов (где-то ревниво вздыхает один Альтман)
– Также в рамках соглашения Nvidia и Anthropic будут совместно разрабатывать методы оптимизации моделей и чипов, чтобы с обеих сторон увеличивать эффективность и производительность
Дженсен Хуанг назвал это сотрудничество «сбывшейся мечтой», а оценка Anthropic на фоне новостей подскочила уже до 350 миллиардов долларов. Напоминаем, что еще в сентябре они стоили всего 183 миллиарда.
Схема следующая:
– Anthropic обязуются выделить 30 миллиардов на покупку мощностей Azure, это примерно 1ГВт
– Nvidia при этом вкладывает в стартап 10 миллиардов, а Microsoft 5 миллиардов (где-то ревниво вздыхает один Альтман)
– Также в рамках соглашения Nvidia и Anthropic будут совместно разрабатывать методы оптимизации моделей и чипов, чтобы с обеих сторон увеличивать эффективность и производительность
Дженсен Хуанг назвал это сотрудничество «сбывшейся мечтой», а оценка Anthropic на фоне новостей подскочила уже до 350 миллиардов долларов. Напоминаем, что еще в сентябре они стоили всего 183 миллиарда.
1😁131👍45🔥25❤15😎10🤔4🤯1👌1👨💻1 1
Data Secrets
Ларри Эллисон (CEO Oracle) обогнал Илона Маска и стал самым богатым человеком на Земле. Все благодаря OpenAI. Они заключили с Oracle контракт (внимание!) на 300 миллиардов долларов. Он вступает в силу в 2027 году, и OpenAI придется платить в среднем 60…
И снова про ИИ-пузырь: Oracle остается в огромном минусе после заключение сделки с OpenAI
Напоминаем, что в сентябре OpenAI и Oracle заключили крупнейшную в истории облачных вычислений сделку на 300 миллиардов долларов. Контракт подразумевает расширение дата-центров Oracle на мощность 4.5 гигаватта.
И сначала акции компании круто подскочили на фоне новости, а Ларри Эдисон даже стал самым богатым человеком на земле. Но потом эйфория спала и оказалось, что на все запланированные инфраструктурные расходы у Oracle просто … не хватает денег✨
Капитализация рухнула с $615 млрд до $315 млрд, и теперь компания считается underwater, то есть стоимость её обязательств существенно превышает потенциальную прибыль.
Денежный поток Oracle уже отрицательный и, по прогнозам, будет оставаться таковым минимум 5 лет. Уже сейчас большая часть финансирования осуществляется в основном за счет долгов, а на бирже растет спрос на кредитные дефолтные свопы на облигации Oracle (это, прямо скажем, не круто).
Аналитики считают, что Oracle сделала слишком крупную ставку на ИИ и теперь рискует остаться с невостребованной инфраструктурой, если рынок перегреется. По сути, сейчас компания стала заложником успеха OpenAI.
Короче, к успеху шли.
Напоминаем, что в сентябре OpenAI и Oracle заключили крупнейшную в истории облачных вычислений сделку на 300 миллиардов долларов. Контракт подразумевает расширение дата-центров Oracle на мощность 4.5 гигаватта.
И сначала акции компании круто подскочили на фоне новости, а Ларри Эдисон даже стал самым богатым человеком на земле. Но потом эйфория спала и оказалось, что на все запланированные инфраструктурные расходы у Oracle просто … не хватает денег
Капитализация рухнула с $615 млрд до $315 млрд, и теперь компания считается underwater, то есть стоимость её обязательств существенно превышает потенциальную прибыль.
Денежный поток Oracle уже отрицательный и, по прогнозам, будет оставаться таковым минимум 5 лет. Уже сейчас большая часть финансирования осуществляется в основном за счет долгов, а на бирже растет спрос на кредитные дефолтные свопы на облигации Oracle (это, прямо скажем, не круто).
Аналитики считают, что Oracle сделала слишком крупную ставку на ИИ и теперь рискует остаться с невостребованной инфраструктурой, если рынок перегреется. По сути, сейчас компания стала заложником успеха OpenAI.
Короче, к успеху шли.
Please open Telegram to view this post
VIEW IN TELEGRAM
Видимо, они хотят хотя бы немного перебить хайп вокруг Gemini. Вот что в релизе действительно интересного:
Также для Windows появился Agent mode, с помощью которого агент может работать в терминале автономно (доступы можно настраивать).
«Претрейн и test-time не уперлись в стену» – написал Ноам Браун про релиз. Это он намекает, что масштабирование продолжается.
При этом благодаря новой фишке – «компакции» – Codex теперь может работать с огромными контекстами. Это как бы аналог краткосрочной и долгосрочной памяти. Когда лимит токенов контекстного окна близок, модель сжимает самую старую информацию, а затем вместе с этой выжимкой + последней актуальной информацией переходит в новое контекстное окно. Процесс может повторяться много раз.
Уже доступно в IDE и Codex CLI, в API завезут «soon»
openai.com/index/gpt-5-1-codex-max/
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤80🔥36👍25😁7
Media is too big
VIEW IN TELEGRAM
А это просто красиво. В эти выходные в Лас-Вегасе проходит Гран-при Формулы-1, и в преддверии гоночного викенда Google совместно с McLaren запустили там вот такую огромную рекламу на Sphere: Gemini рисует болид McLaren в разных стилях.
Google знает, как делать правильные коллаборации
Google знает, как делать правильные коллаборации
1🔥267❤55👍29👾9😁2⚡1🐳1🗿1
Все, Ян Лекун официально подтвердил, что уходит из Meta*
В посте на LinkedIn он написал, что создает стартап для продолжения исследовательской программы Advanced Machine Intelligence (AMI). Что такое AMI и чем Лекуну не угодил термин AGI, мы писали тут.
Цель стартапа – «сделать следующую большую революцию в ИИ»: создать системы, которые понимают физический мир, обладают постоянной памятью, могут рассуждать и планировать сложные действия.
Ушла эпоха.
В посте на LinkedIn он написал, что создает стартап для продолжения исследовательской программы Advanced Machine Intelligence (AMI). Что такое AMI и чем Лекуну не угодил термин AGI, мы писали тут.
Цель стартапа – «сделать следующую большую революцию в ИИ»: создать системы, которые понимают физический мир, обладают постоянной памятью, могут рассуждать и планировать сложные действия.
По моему замыслу, AMI будет иметь широкое применение в различных секторах экономики. Некоторые из них пересекаются с коммерческими интересами Meta, а многие нет. Продолжать работу AMI как независимой организации – мой способ максимизировать её масштабное влияние.
Ушла эпоха.
🤯84❤44 35👍23🔥8 5😁1🫡1
Google опять радуют: вышла новая Nano Banana Pro на базе Gemini 3
Подробностей пока нет, но модель уже доступна в Google Vertex AI как "Gemini 3 Pro Image Preview", и первые пользователи от генераций в восторге.
Пробуйте и делитесь в комментариях: https://gemini.google.com/app
UPD: подъехал официальный релиз. Разрешение до 4к, улучшенная генерация текста и текстур, можно загружать много референсов.
https://blog.google/technology/ai/nano-banana-pro/
Подробностей пока нет, но модель уже доступна в Google Vertex AI как "Gemini 3 Pro Image Preview", и первые пользователи от генераций в восторге.
Пробуйте и делитесь в комментариях: https://gemini.google.com/app
UPD: подъехал официальный релиз. Разрешение до 4к, улучшенная генерация текста и текстур, можно загружать много референсов.
https://blog.google/technology/ai/nano-banana-pro/
👍72❤20🤩8🔥2🤯2😁1