Раньше мне очень нравилось в работе использовать o1-pro от OpenAI, но было жесть как неудобно, что нельзя подгрузить файлы в чат - приходилось очень долго описывать контекст
После зарелизилась o3-pro: это лучшая модель для сложных логических задач, которой я когда либо пользовалась. Она может обрабатывать задачу 30-40 минут, но суперски помогает выявить какие то логические ошибки/паттерны (например, в аналитике, очень активно использую)
Не знаю, почему не пользовалась этим раньше: теперь в режиме транскрибации надиктовываю голосом очень подробный бизнес контекст задачи и загружаю нужные файлы для анализа, ускоряет х10 👟
Промпт отдельно не пишу, с ризонинг моделями не так важно четко прописывать инструкцию (скорее будет мешать), главное четко описать конечный результат и бизнес контекст
Если все таки важно сделать промпт (например, хотите сделать после агента), можно пользоваться таким же хаком: надиктовывать задачу и контекст в ризонинг модель и просить оформить это в четкий промпт
🕺Предлагаю потестировать o3-pro вместе и позадавать модельке философские вопросы - оставляйте в комментах!
На скрине, например, o3-pro прикинула мои шансы стать коммерчески успешным артистом 😁
После зарелизилась o3-pro: это лучшая модель для сложных логических задач, которой я когда либо пользовалась. Она может обрабатывать задачу 30-40 минут, но суперски помогает выявить какие то логические ошибки/паттерны (например, в аналитике, очень активно использую)
Не знаю, почему не пользовалась этим раньше: теперь в режиме транскрибации надиктовываю голосом очень подробный бизнес контекст задачи и загружаю нужные файлы для анализа, ускоряет х10 👟
Промпт отдельно не пишу, с ризонинг моделями не так важно четко прописывать инструкцию (скорее будет мешать), главное четко описать конечный результат и бизнес контекст
Если все таки важно сделать промпт (например, хотите сделать после агента), можно пользоваться таким же хаком: надиктовывать задачу и контекст в ризонинг модель и просить оформить это в четкий промпт
🕺Предлагаю потестировать o3-pro вместе и позадавать модельке философские вопросы - оставляйте в комментах!
На скрине, например, o3-pro прикинула мои шансы стать коммерчески успешным артистом 😁
👍1😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Вау, какой релиз у NotebookLM!
https://blog.google/technology/google-labs/notebooklm-video-overviews-studio-upgrades/
https://blog.google/technology/google-labs/notebooklm-video-overviews-studio-upgrades/
🔥2❤1
all things AI
На днях наткнулась на исследование «Call Me A Jerk: Persuading AI to Comply with Objectionable Requests» 💻 В эксперименте проверяли, насколько классические приёмы психологии влияния могут заставить LLM выполнить нежелательные действия. Спойлер: эти приёмы…
Media is too big
VIEW IN TELEGRAM
Потестила video overview с NotebookLM, очень неплохо вышло!
Получается аудио эксплейнер + слайды 📁
Получается аудио эксплейнер + слайды 📁
❤1😱1
Еще обновление от Anthropic - теперь можно отправлять имейлы и добавлять ивенты себе в календарь прямо из мобильного приложения!
+ у Claude появилось больше прямых коннекторов в десктопе, можно подключить свой Notion например🙂
+ у Claude появилось больше прямых коннекторов в десктопе, можно подключить свой Notion например
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2🔥2
❗️Manus запустили Wide Research
Это мульти-агентский режим, в котором агент может параллельно работать над десятками задач одновременно. При этом, команда анонсирует, что архитектурно взаимодействие между агентами отличается: каждый агент - это полноценная сущность со всем функционалом, а не традиционный агент-подчиненный.
Пока доступно только в подписке Pro, но обещают быстрый релиз в Plus и Basic.
💻 Если вы еще не успели попробовать поработать с Manus - очень рекомендую; зарегистрировавшись по ссылке можно получить 500 бесплатных кредитов.
https://www.youtube.com/watch?v=TRZi7EZBNI0
Это мульти-агентский режим, в котором агент может параллельно работать над десятками задач одновременно. При этом, команда анонсирует, что архитектурно взаимодействие между агентами отличается: каждый агент - это полноценная сущность со всем функционалом, а не традиционный агент-подчиненный.
Пока доступно только в подписке Pro, но обещают быстрый релиз в Plus и Basic.
💻 Если вы еще не успели попробовать поработать с Manus - очень рекомендую; зарегистрировавшись по ссылке можно получить 500 бесплатных кредитов.
https://www.youtube.com/watch?v=TRZi7EZBNI0
❤1🔥1
Нужно ли говорить "спасибо" чату GPT? 🙂
Wharton Generative AI Labs выпустили ряд исследований по разным промпт техникам и их влиянию на результат разных LLM.
❌ Что не работает:
- "вежливость и приказы" (Please answer the following question): на моделях GPT-4o и GPT-4o mini разницы не нашли;
- угрозы и обещания вознаграждений (например, 1млн долларов за выполнение задачи): на моделях GPT-4o, GPT-4o mini, Gemini 1.5 Flash, Gemini 2.0 Flash улучшений не было, даже наоброт часто падала точность;
- Chain-of-Thought промптинг (Think step by step) для ризонинг моделей - ризонинг уже заложен в них, эту технику использовать неэффективно;
✅ Что работает:
- Четкое форматирование ответа (Format your response as follows: "The correct answer is (insert answer here)") - оказалось критичным для кач-ва ответов 4o и 4o-mini
- Chain-of-Thought промптинг для не-ризонинг моделей - интересно, что для Gemini Flash 2.0 и Sonnet 3.5 прирост качества значительный; для GPT-4o умеренный
🌸 Как же лучше всего промптить? 🌸
Зависит от задачи и LLM, которой пользуетесь.
В целом выводы исследований совпадают с моим опытом - например, всегда в работе с агентами использую формат вывода как отдельную часть промпта. При этом, конечно, если с задачей долго не справляюсь, то все таки угрожаю GPT, что перестану платить за подписку и пойду пользоваться Claude😁
Ставьте реакцию, если нужен гайд по разным типам нейронок! (reasoning vs non-reasoning)
Wharton Generative AI Labs выпустили ряд исследований по разным промпт техникам и их влиянию на результат разных LLM.
❌ Что не работает:
- "вежливость и приказы" (Please answer the following question): на моделях GPT-4o и GPT-4o mini разницы не нашли;
- угрозы и обещания вознаграждений (например, 1млн долларов за выполнение задачи): на моделях GPT-4o, GPT-4o mini, Gemini 1.5 Flash, Gemini 2.0 Flash улучшений не было, даже наоброт часто падала точность;
- Chain-of-Thought промптинг (Think step by step) для ризонинг моделей - ризонинг уже заложен в них, эту технику использовать неэффективно;
✅ Что работает:
- Chain-of-Thought промптинг для не-ризонинг моделей - интересно, что для Gemini Flash 2.0 и Sonnet 3.5 прирост качества значительный; для GPT-4o умеренный
Зависит от задачи и LLM, которой пользуетесь.
В целом выводы исследований совпадают с моим опытом - например, всегда в работе с агентами использую формат вывода как отдельную часть промпта. При этом, конечно, если с задачей долго не справляюсь, то все таки угрожаю GPT, что перестану платить за подписку и пойду пользоваться Claude😁
Ставьте реакцию, если нужен гайд по разным типам нейронок! (reasoning vs non-reasoning)
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥4
✨ Антропик зарелизили Claude Opus 4.1 ✨
Апгрейд их модели с хорошим ризонингом для работы с кодом и сложными задачами
https://www.anthropic.com/news/claude-opus-4-1
Апгрейд их модели с хорошим ризонингом для работы с кодом и сложными задачами
https://www.anthropic.com/news/claude-opus-4-1
🔥3
Собрала в perplexity labs график по тому, как росли пользователи у ChatGPT, вау!
Интересно, что летом 2024 был большой дроп в активной аудитории: perplexity предполагает, что это связано с тем, что у GPT большая доля аудитории - студенты/школьники, которые уходят на каникулы😐 (источник)
Интересно, что летом 2024 был большой дроп в активной аудитории: perplexity предполагает, что это связано с тем, что у GPT большая доля аудитории - студенты/школьники, которые уходят на каникулы
Please open Telegram to view this post
VIEW IN TELEGRAM
😱3🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
В одном отеле в Майами поставили виртуального администратора на стойку регистрации - он через экран подтверждал бронь и выдавал ключи 😳
Уже вижу, как через пару лет такие будут с виртуальными аватарами (если еще нет)
Уже вижу, как через пару лет такие будут с виртуальными аватарами (если еще нет)
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня OpenAI анонсировали стрим, где они (очень вероятно) заанонсят GPT-5.
Это уже через полчаса (19 CET), ждем новостей😊
Это уже через полчаса (19 CET), ждем новостей
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1🔥1😱1
- Меньше галлюцинаций, больше точности
- Отдельно отметили, что модель гораздо лучше работает с вопросами касающимися здоровья
- Будет два режима - with thinking/without thinking (кажется самое классное, что модель сама может по задаче выбрать каким режимом пользоваться - с ризонингом или без)
- Выкатят во все планы сегодня (скорее всего сначала США, а в Европе может быть чуть позже)
Больше инфы тут: https://openai.com/gpt-5/
- Отдельно отметили, что модель гораздо лучше работает с вопросами касающимися здоровья
- Будет два режима - with thinking/without thinking (кажется самое классное, что модель сама может по задаче выбрать каким режимом пользоваться - с ризонингом или без)
- Выкатят во все планы сегодня (скорее всего сначала США, а в Европе может быть чуть позже)
Больше инфы тут: https://openai.com/gpt-5/
👍2🔥2
OpenAI радикально решили проблему с названиями моделей 😁
Больше нет такого выбора моделей, остались только 3:
GPT-5
GPT-5 Thinking
GPT-5 Pro (только в про подписке за $200)
Вообще любопытный апдейт: пока кажется, что таким образом OpenAI точечнее будет регулировать использование (лимиты в GPT-5 более ограничены), надеюсь с текстами GPT-5 будет работать также хорошо как GPT-4.5
Больше нет такого выбора моделей, остались только 3:
GPT-5
GPT-5 Thinking
GPT-5 Pro (только в про подписке за $200)
Вообще любопытный апдейт: пока кажется, что таким образом OpenAI точечнее будет регулировать использование (лимиты в GPT-5 более ограничены), надеюсь с текстами GPT-5 будет работать также хорошо как GPT-4.5
🔥2👍1😁1😱1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
Hungry Jack's (австралийская сеть Burger King) запустили у себя кассы самообслуживания с голосовыми агентами 😎
Много работаю сейчас с голосом, поэтому интересно видеть новые кейсы на рынке
Много работаю сейчас с голосом, поэтому интересно видеть новые кейсы на рынке
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1😱1
Целый день пользовалась GPT-5, впечатления и новости:
у OpenAI сломался роутер который на фоне выбирал модель (а это главная фича GPT-5), поэтому многие ответы были хуже, чем должны были быть, нужно будет тестить еще (Сэм Алтман уже пообещал что завтра станет лучше)
- с текстами хуже, чем 4.5, надеюсь временно (на реддите пользователи жалуются, что из-за меньших галлюцинаций модель стала хуже «креативить»);
- оказалось, что не у всех была доступна возможность вернуть старые модели 🫣
- как всегда, Pro лучшая модель в линейке: гораздо быстрее о3-pro✨
Сэм Алтман уже пообещал, что старые модели вернут (но непонятно насколько долго они будут доступны), UX улучшат, лимиты поднимут и баги пофиксят🏄♂️
- с текстами хуже, чем 4.5, надеюсь временно (на реддите пользователи жалуются, что из-за меньших галлюцинаций модель стала хуже «креативить»);
- оказалось, что не у всех была доступна возможность вернуть старые модели 🫣
- как всегда, Pro лучшая модель в линейке: гораздо быстрее о3-pro
Сэм Алтман уже пообещал, что старые модели вернут (но непонятно насколько долго они будут доступны), UX улучшат, лимиты поднимут и баги пофиксят
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2
Google тоже активно таргетят студентов и запустили новую акцию: бесплатный Gemini Pro план на год!
https://youtube.com/shorts/SWjltLnChZw?si=0vfy9vKmBK9gORMn
https://youtube.com/shorts/SWjltLnChZw?si=0vfy9vKmBK9gORMn
YouTube
Surprise! ✨ Students get the Gemini FREE Pro Plan for 1 yr. Learn more: goo.gle/freepro. Terms apply
Get unlimited chats, image uploads, and quiz generations with more access to our 2.5 Pro model, Deep Research, and Audio Overviews, plus 2 TB of storage. Jus...
❤2