Forwarded from Denis Sexy IT 🤖
Так, вышла GPT5 – спасибо JetBrains, партнеру OpenAI который подключил ее один из первых и в продуктах которого она будет доступна в течение часа по дефолту, где я ее и тестил
Бенчмарки постить не буду, хочу начать со своего опыта использования:
– GPT5 гениальна в кодинге – я застал и трогал все главные серии моделей начиная с GPT-2, и лучше для написания кода просто не существовало до этого момента (Claude челики – сорян)
– Страницы в видео она сделала с одного промпта (и одного ответа) – вы можете ей скормить или идею, или научный пейпер, и она соберет готовую веб страницу где сразу будут все виды скинов, прописаны стили, состояния кнопок, анимации и тп, она неимоверно клево делает frontend задачи
– Это первая модель, с которой я кодил 2 часа Python проект, распилил его на части, докинул кучу новой логики, потом запустил и все заработало – такого никогда не получалось с Gemini Pro 2.5 или Sonnet 4
– Она все еще оверинженерит простые задачи (если неправильно промптить) – но ее оверинженеринг работает, в отличие от Sonnet-Opues 4, с первого раза – и работая с ней долго, можно быть уверенным, что она не сделала никаких новых «призрачных функций» которые не используются (давняя проблема вайбкодинга)
– Если с ней работать в многошаговом режиме для разработки, она прям хорошо дебажит проблемы по скриншотам – эти страницы она сделала с 1-3х ходов:
https://shir-man.com/pie-photo/
https://shir-man.com/solar/
– Модель обучена на данных до октября 2024 года – она уже знает как работают агенты на LLM, как делать запросы в API к крупным провайдерам, с ней очень быстро можно кодить любой современный АИ-софт
– Цены, модель стоит ДЕШЕВЛЕ чем Sonnet-4; но тут есть нюансы, вы можете указать в API как долго модель будет думать перед ответом или «мыслительный бюджет», от этого меняется цена результата
В общем, правда не знаю что Antropic планирует делать с таким конкурентом, они выпустили вчера Opus 4.1 и она хуже и дороже
Бенчмарки постить не буду, хочу начать со своего опыта использования:
– GPT5 гениальна в кодинге – я застал и трогал все главные серии моделей начиная с GPT-2, и лучше для написания кода просто не существовало до этого момента (Claude челики – сорян)
– Страницы в видео она сделала с одного промпта (и одного ответа) – вы можете ей скормить или идею, или научный пейпер, и она соберет готовую веб страницу где сразу будут все виды скинов, прописаны стили, состояния кнопок, анимации и тп, она неимоверно клево делает frontend задачи
– Это первая модель, с которой я кодил 2 часа Python проект, распилил его на части, докинул кучу новой логики, потом запустил и все заработало – такого никогда не получалось с Gemini Pro 2.5 или Sonnet 4
– Она все еще оверинженерит простые задачи (если неправильно промптить) – но ее оверинженеринг работает, в отличие от Sonnet-Opues 4, с первого раза – и работая с ней долго, можно быть уверенным, что она не сделала никаких новых «призрачных функций» которые не используются (давняя проблема вайбкодинга)
– Если с ней работать в многошаговом режиме для разработки, она прям хорошо дебажит проблемы по скриншотам – эти страницы она сделала с 1-3х ходов:
https://shir-man.com/pie-photo/
https://shir-man.com/solar/
– Модель обучена на данных до октября 2024 года – она уже знает как работают агенты на LLM, как делать запросы в API к крупным провайдерам, с ней очень быстро можно кодить любой современный АИ-софт
– Цены, модель стоит ДЕШЕВЛЕ чем Sonnet-4; но тут есть нюансы, вы можете указать в API как долго модель будет думать перед ответом или «мыслительный бюджет», от этого меняется цена результата
В общем, правда не знаю что Antropic планирует делать с таким конкурентом, они выпустили вчера Opus 4.1 и она хуже и дороже
Forwarded from Сиолошная
Пока слушаем про метрики и кейсы — вот сноска про доступность:
— GPT‑5 начинает появляться на сайте сегодня для всех пользователей Plus, Pro, Team и БЕСПЛАТНЫХ ПОЛЬЗОВАТЕЛЕЙ, а доступ для Enterprise и Edu станет доступен на следующей неделе.
— Пользователи Pro, Plus и Team также могут начать программировать с помощью GPT‑5 в Codex CLI, войдя в ChatGPT (не нужно будет платить отдельно за API)
— Подписчики Pro получают неограниченный доступ к GPT‑5 и доступ к GPT‑5 Pro.
— GPT-5 Pro: при оценке более 1000 экономически значимых, реальных задач на рассуждение внешние эксперты в 67,8% случаев отдавали предпочтение GPT‑5 pro, а не GPT‑5 thinking. GPT‑5 pro допускала на 22% меньше серьёзных ошибок и показала лучшие результаты в области здравоохранения, естественных наук, математики и программирования.
— Пользователи Plus могут комфортно использовать GPT‑5 в качестве модели по умолчанию для решения повседневных вопросов, используя его значительно чаще, чем пользователи бесплатной версии.
— Пользователи Team, Enterprise и Edu также могут комфортно использовать GPT‑5 в качестве модели по умолчанию для повседневной работы с щедрыми ограничениями, которые позволяют целым организациям легко использовать GPT‑5.
— Для пользователей бесплатной версии ChatGPT рассуждения будут доступны с ограничениями (ориентировочно, хватит на 2-3 дня из недели). Как только пользователи бесплатной версии достигнут лимита использования GPT‑5, они перейдут на GPT‑5 mini — более компактную, быструю и мощную модель.
— GPT‑5 начинает появляться на сайте сегодня для всех пользователей Plus, Pro, Team и БЕСПЛАТНЫХ ПОЛЬЗОВАТЕЛЕЙ, а доступ для Enterprise и Edu станет доступен на следующей неделе.
— Пользователи Pro, Plus и Team также могут начать программировать с помощью GPT‑5 в Codex CLI, войдя в ChatGPT (не нужно будет платить отдельно за API)
— Подписчики Pro получают неограниченный доступ к GPT‑5 и доступ к GPT‑5 Pro.
— GPT-5 Pro: при оценке более 1000 экономически значимых, реальных задач на рассуждение внешние эксперты в 67,8% случаев отдавали предпочтение GPT‑5 pro, а не GPT‑5 thinking. GPT‑5 pro допускала на 22% меньше серьёзных ошибок и показала лучшие результаты в области здравоохранения, естественных наук, математики и программирования.
— Пользователи Plus могут комфортно использовать GPT‑5 в качестве модели по умолчанию для решения повседневных вопросов, используя его значительно чаще, чем пользователи бесплатной версии.
— Пользователи Team, Enterprise и Edu также могут комфортно использовать GPT‑5 в качестве модели по умолчанию для повседневной работы с щедрыми ограничениями, которые позволяют целым организациям легко использовать GPT‑5.
— Для пользователей бесплатной версии ChatGPT рассуждения будут доступны с ограничениями (ориентировочно, хватит на 2-3 дня из недели). Как только пользователи бесплатной версии достигнут лимита использования GPT‑5, они перейдут на GPT‑5 mini — более компактную, быструю и мощную модель.
Forwarded from Сиолошная
Все бенчмарки можно найти вот тут во второй половине страницы: https://openai.com/index/introducing-gpt-5-for-developers/
(правда сравнения только с моделями OpenAI, но it's a good model sir)
Бенчмарков на длинный контекст аж 4 штуки (и 7 строк)
Хотел написать «и эта модель будет доступна миллиарду пользователей БЕС ПЛАТ НО», но это не совсем так — потому что тут используется GPT-5 Thinking (High), и пока не ясно, сколько запрсов к ней будет у average Joe.
(правда сравнения только с моделями OpenAI, но it's a good model sir)
Бенчмарков на длинный контекст аж 4 штуки (и 7 строк)
Хотел написать «и эта модель будет доступна миллиарду пользователей БЕС ПЛАТ НО», но это не совсем так — потому что тут используется GPT-5 Thinking (High), и пока не ясно, сколько запрсов к ней будет у average Joe.
Forwarded from эйай ньюз
Forwarded from Ask me plll!
Forwarded from vc.ru
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ-агент для программирования Jules от Google вышел из режима бета-тестирования. Теперь доступно 15 бесплатных задач в день, три из них помощник сможет делать одновременно.
Jules работает на базе Gemini 2.5 Pro, его можно подключать к GitHub, чтобы дописать проект, а также запускать с телефона
vc.ru/ai/2144383
Jules работает на базе Gemini 2.5 Pro, его можно подключать к GitHub, чтобы дописать проект, а также запускать с телефона
vc.ru/ai/2144383
Forwarded from vc.ru
Nebius Аркадия Воложа отчиталась за второй квартал 2025 года: выручка выросла на 625% год к году и составила $105,1 млн, скорректированный чистый убыток — $91,5 млн.
На фоне публикации отчётности акции Nebius Group на Nasdaq растут на 22%
vc.ru/ai/2144794
На фоне публикации отчётности акции Nebius Group на Nasdaq растут на 22%
vc.ru/ai/2144794
Forwarded from vc.ru
Anthropic добавила в Claude Code инструмент Security Review для проверки кода на безопасность. Claude анализирует проект, объясняет ошибки и исправляет уязвимости.
Инструмент также есть в открытом доступе на GitHub
vc.ru/ai/2144856
Инструмент также есть в открытом доступе на GitHub
vc.ru/ai/2144856
Forwarded from Denis Sexy IT 🤖
ChatGPT апп радикально решил проблему многих моделей в приложении – их теперь или одна, или одна с фигней в приписке 🌝
Ставлю что откатят и дадут выбор моделей
Ставлю что откатят и дадут выбор моделей
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Cерафимодальный AI
This media is not supported in your browser
VIEW IN TELEGRAM
выдали доступ, интересное решение
❤1