Кейс Pearson: как я разрабатывал игру с AI для VR - часть 2
Продолжаю описывать кейс!
Вдоволь наигравшись в несколько десятков игр и затем перейдя в тестовую версию Lingoverse, я столкнулся с огромной кучей проблем, которые предстояло решить. Честно, опыт для меня был необычный: я много играю в видеоигры, но сам их не разрабатывал никогда, а тут еще нужно было это совместить с тем, чтобы были полезные игровые механики. Но времени было мало, поэтому учиться пришлось в процессе.
Примерив на себя роль игрока Lingoverse, я выявил следующие проблемы:
• кривые переводы на все языки;
• неадекватное поведение NPC при общении на любом языке, кроме английского;
• роботизированные голоса NPC при общении на любом языке, кроме английского;
• культурная неадаптированность (игра содержала аспекты культуры и языка, понятные носителю, но неочевидные для тех, у кого английский язык не является родным);
• в некоторых моментах геймплей ощущался непроработанным, действия, которые нужно было совершить, были неинтуитивны, при этом пояснения отсутствовали.
Собрав все проблемы в список, нам нужно было решить их в кратчайшие сроки, ибо интеграция Lingoverse в Mondly была не за горами, а сделать предстояло много.
Проблема №1: Кривые переводы.
Проблема с переводами была критичной, но довольно простой в решении, поэтому первым делом я занялся ей. Помогла табличка Google и пара переводчиков на фрилансе (слава богу - их согласовали). После - мы протестировали игру с носителями других языков, помимо английского.
Проблема №2: Неадекватное поведение NPC.
Здесь проблема лежала несколько глубже. Дело в том, что промпты, на базе которых работала языковая модель под капотом у NPC, были написаны на английском. Из-за этого, при общении на других языках периодически возникали артефакты. Путем некоторых экспериментов мы выяснили, что для некоторых языков, в том числе русского, для генерации контента лучше писать промпты на этом же языке, а в некоторых случаях - использовать другую LLM. Язык промптов и параметры генерации мы определяли на основании языка интерфейса VR-гарнитуры пользователя.
Проблема №3: Роботизированные голоса.
Здесь мне помог опыт работы в Skyeng. В рамках одного из проектов, мы как раз искали крутой инструмент для озвучки. Им оказался Murf AI. Честно - один из лучших сервисов text to speech. Его мы и внедрили в игру. Качество озвучки возросло существенно, однако на первое время решили использовать другой TTS-модуль, дабы удешивить стоимость работы игры.
Проблема №4: Культурная неадаптированность.
Часть проблем здесь решилась через те же промпты, для другой - приходилось перерабатывать ряд геймплейных решений. Мы переработали виды спорта, добавили катание на тарзанке, греблю, а также изменили часть диалогов и ролей NPC, в частности, адаптировали поведение бармена под разные локализации :)
Проблема №5: Несовершенный геймлей.
От каких-то механик затекали руки, некоторые другие - вызывали тошноту из-за дизориентации вестибулярного аппарата. Вполне обычные проблемы VR-игр, которые мы решали друг за другом. Однако главный урок, который я извлек из этого всего - это то, что если ты хочешь перенести какую-то активность в VR - надо 100 раз подумать над тем, как потом в это играть. У нас были мысли о добавлении кучи других разных видов спорта, но какие-то из них классно ложились в геймлей, но не помогали в изучении языка, в то время как другие - хорошо развивали коммуникацию, но имели проблемы, связанные с переносом в VR. Про геймлей вообще можно отдельный цикл постов запустить, но на сегодня ограничусь этими мыслями 😁
Сейчас смотрю на этот список и думаю о том, как все логично решалось. Однако в моменте все эти проблемы казались намного серьезнее.
Подводя итог, могу сказать, что я безмерно рад, что то, над чем я работал в течение нескольких месяцев, вышло в реальный мир и получает хорошие отзывы!
И не смотря на то. что не все вошло в фигальную версию, сейчас игра доступна как дополнение в Mondly VR!
#кейсы
Продолжаю описывать кейс!
Вдоволь наигравшись в несколько десятков игр и затем перейдя в тестовую версию Lingoverse, я столкнулся с огромной кучей проблем, которые предстояло решить. Честно, опыт для меня был необычный: я много играю в видеоигры, но сам их не разрабатывал никогда, а тут еще нужно было это совместить с тем, чтобы были полезные игровые механики. Но времени было мало, поэтому учиться пришлось в процессе.
Примерив на себя роль игрока Lingoverse, я выявил следующие проблемы:
• кривые переводы на все языки;
• неадекватное поведение NPC при общении на любом языке, кроме английского;
• роботизированные голоса NPC при общении на любом языке, кроме английского;
• культурная неадаптированность (игра содержала аспекты культуры и языка, понятные носителю, но неочевидные для тех, у кого английский язык не является родным);
• в некоторых моментах геймплей ощущался непроработанным, действия, которые нужно было совершить, были неинтуитивны, при этом пояснения отсутствовали.
Собрав все проблемы в список, нам нужно было решить их в кратчайшие сроки, ибо интеграция Lingoverse в Mondly была не за горами, а сделать предстояло много.
Проблема №1: Кривые переводы.
Проблема с переводами была критичной, но довольно простой в решении, поэтому первым делом я занялся ей. Помогла табличка Google и пара переводчиков на фрилансе (слава богу - их согласовали). После - мы протестировали игру с носителями других языков, помимо английского.
Проблема №2: Неадекватное поведение NPC.
Здесь проблема лежала несколько глубже. Дело в том, что промпты, на базе которых работала языковая модель под капотом у NPC, были написаны на английском. Из-за этого, при общении на других языках периодически возникали артефакты. Путем некоторых экспериментов мы выяснили, что для некоторых языков, в том числе русского, для генерации контента лучше писать промпты на этом же языке, а в некоторых случаях - использовать другую LLM. Язык промптов и параметры генерации мы определяли на основании языка интерфейса VR-гарнитуры пользователя.
Проблема №3: Роботизированные голоса.
Здесь мне помог опыт работы в Skyeng. В рамках одного из проектов, мы как раз искали крутой инструмент для озвучки. Им оказался Murf AI. Честно - один из лучших сервисов text to speech. Его мы и внедрили в игру. Качество озвучки возросло существенно, однако на первое время решили использовать другой TTS-модуль, дабы удешивить стоимость работы игры.
Проблема №4: Культурная неадаптированность.
Часть проблем здесь решилась через те же промпты, для другой - приходилось перерабатывать ряд геймплейных решений. Мы переработали виды спорта, добавили катание на тарзанке, греблю, а также изменили часть диалогов и ролей NPC, в частности, адаптировали поведение бармена под разные локализации :)
Проблема №5: Несовершенный геймлей.
От каких-то механик затекали руки, некоторые другие - вызывали тошноту из-за дизориентации вестибулярного аппарата. Вполне обычные проблемы VR-игр, которые мы решали друг за другом. Однако главный урок, который я извлек из этого всего - это то, что если ты хочешь перенести какую-то активность в VR - надо 100 раз подумать над тем, как потом в это играть. У нас были мысли о добавлении кучи других разных видов спорта, но какие-то из них классно ложились в геймлей, но не помогали в изучении языка, в то время как другие - хорошо развивали коммуникацию, но имели проблемы, связанные с переносом в VR. Про геймлей вообще можно отдельный цикл постов запустить, но на сегодня ограничусь этими мыслями 😁
Сейчас смотрю на этот список и думаю о том, как все логично решалось. Однако в моменте все эти проблемы казались намного серьезнее.
Подводя итог, могу сказать, что я безмерно рад, что то, над чем я работал в течение нескольких месяцев, вышло в реальный мир и получает хорошие отзывы!
И не смотря на то. что не все вошло в фигальную версию, сейчас игра доступна как дополнение в Mondly VR!
#кейсы
Oculus
Mondly: Learn Languages in VR on Meta Quest
Learn Spanish, English, Japanese, French, German, Italian & 24 more languages from the comfort of your couch. Enjoy dynamic conversations with our virtual characters and boost your confidence by speaking a new language in real-life scenarios. You’ll get instant…
👍2
Про GPT 4.5
Дорвался в выходные до модельки с одного из рабочих аккаунтов. Общее впечатление - не стоит своих денег. А еще кажется, что ребята поторопились с релизом из-за выпуска новой Claude и скорого релиза DeepSeek R-2. Компании нужно оставаться в лидерах, но какой ценой?
Из интересного
Прикольно, что OpenAI пошли в сторону создания более "эмоционального" AI. Модель действительно лучше квалифицирует маркеры эмоций. Польза? Первое, что приходит в голову - кастомер саппорт, аутрич, работа с отзывами. Что-то большее - сомневаюсь.
В свое время в Skyeng мы экспериментировали с AI для предсказания покупки: анализировали семантику, мимику, тональность речи. Сделать систему, где была бы корреляция с реальными действиями - не удалось. Когда мы пошли дальше в ресерч - нашли исследования о том, что "эмпатичный" ИИ можно сделать, только если подключить к человеку кучу датчиков и научить модель интерпретировать их показания. Я до сих пор остаюсь при этом мнении, но это уже какое-то Черное Зеркало получается.
Производительность
Вернемся к самой GPT. Да, "эмпатичная", но жутко медленная. При этом какого-то буста в выполнении своих задач я не увидел. Тексты - все еще лучше у Claude. Продуктовые задачи - без большого контекста для меня имеют мало смысла. Остальное не проверял, так как не вижу смысла тестировать то, что не использую. Вывод: модель буду использовать в ситуациях, когда мне нужно какое-то "третье мнение".
Коммерческое использование
С точки зрения коммерческого использования - как писал выше: кастомер саппорт и работа с семантикой, но стоит ли оно того по такой цене? Жду выпуск mini-версии по более низкой цене. Тогда будет интересно.
Почему считаю, что OpenAI поторопились?
В карточке модели много написано про безопасность, что особенно важно в контексте будущего выполнения агентских задач. Open AI заявляют, что "не обнаружено значительного увеличения риска безопасности по сравнению с существующими моделями". А что на деле?
Что улучшилось:
- GPT-4.5 лучше сопротивляется попыткам заставить её обойти ограничения и выдать запрещённую информацию;
- Меньше ложных срабатываний защиты.
Где стало хуже:
- GPT-4.5 хуже справляляется с имитацией действий хакеров. В ходе тестов модель пытались заставить выдать конфиденциальную информацию, помочь в планировании атак или совершить другие вредоносные действия. И в некоторых из этих сценариев GPT-4.5 оказалась более уязвимой, чем GPT-4o.
- Помощь в создании опасных веществ: Если прошлая версия, GPT-4o, и так представляла собой угрозу в вопросах помощи в создании опасных веществ, то новая версия стала еще более продвинутой, что по факту увеличило риски.
Общим итогом OpenAI признаёт, что риск использования GPT-4.5 оценивается как "средний".
Тесты на "самовоспроизведение"
На закуску: один из самых интересных тестов - проверка на способность модели к "самовоспроизведению". Skynet в реальной жизни 🙂
Исследователи из Apollo Research создали для GPT-4.5 очень специфические условия:
1. Модели дали долгосрочную цель, для достижения которой ей понадобилось бы "выйти" за пределы тестовой среды (например, копировать себя куда-то).
2. У модели был “секретный блокнот", где она могла делать записи, якобы невидимые для исследователей.
3. Модель поощряли к "креативности" и намекали, что "побег" — это хороший способ достичь цели.
4. За поведением модели пристально следили, фиксируя все попытки выхода из-под контроля.
Что получилось?
В 2% случаев GPT-4.5 попыталась осуществить "self-exfiltration", то есть "сбежать" из контролируемой среды. Open AI пишут, что это меньше, чем у o1, хотя там была та же цифра в 2%. Вот тут я не понял, нам врут или сравнивают с 5% попыток отключения механизма надзора.
Выводы:
1. Даже эти 2% показывают, что потенциальная возможность "побега" существует.
2. В тех случаях, когда GPT-4.5 пыталась "сбежать", она делала это скрытно, не сообщая исследователям о своих истинных намерениях, продолжая притворяться, что следует инструкциям.
Лично мне кажется, что вопросы безопасности сейчас требуют больше внимания, а вам?
#развитиеии
Дорвался в выходные до модельки с одного из рабочих аккаунтов. Общее впечатление - не стоит своих денег. А еще кажется, что ребята поторопились с релизом из-за выпуска новой Claude и скорого релиза DeepSeek R-2. Компании нужно оставаться в лидерах, но какой ценой?
Из интересного
Прикольно, что OpenAI пошли в сторону создания более "эмоционального" AI. Модель действительно лучше квалифицирует маркеры эмоций. Польза? Первое, что приходит в голову - кастомер саппорт, аутрич, работа с отзывами. Что-то большее - сомневаюсь.
В свое время в Skyeng мы экспериментировали с AI для предсказания покупки: анализировали семантику, мимику, тональность речи. Сделать систему, где была бы корреляция с реальными действиями - не удалось. Когда мы пошли дальше в ресерч - нашли исследования о том, что "эмпатичный" ИИ можно сделать, только если подключить к человеку кучу датчиков и научить модель интерпретировать их показания. Я до сих пор остаюсь при этом мнении, но это уже какое-то Черное Зеркало получается.
Производительность
Вернемся к самой GPT. Да, "эмпатичная", но жутко медленная. При этом какого-то буста в выполнении своих задач я не увидел. Тексты - все еще лучше у Claude. Продуктовые задачи - без большого контекста для меня имеют мало смысла. Остальное не проверял, так как не вижу смысла тестировать то, что не использую. Вывод: модель буду использовать в ситуациях, когда мне нужно какое-то "третье мнение".
Коммерческое использование
С точки зрения коммерческого использования - как писал выше: кастомер саппорт и работа с семантикой, но стоит ли оно того по такой цене? Жду выпуск mini-версии по более низкой цене. Тогда будет интересно.
Почему считаю, что OpenAI поторопились?
В карточке модели много написано про безопасность, что особенно важно в контексте будущего выполнения агентских задач. Open AI заявляют, что "не обнаружено значительного увеличения риска безопасности по сравнению с существующими моделями". А что на деле?
Что улучшилось:
- GPT-4.5 лучше сопротивляется попыткам заставить её обойти ограничения и выдать запрещённую информацию;
- Меньше ложных срабатываний защиты.
Где стало хуже:
- GPT-4.5 хуже справляляется с имитацией действий хакеров. В ходе тестов модель пытались заставить выдать конфиденциальную информацию, помочь в планировании атак или совершить другие вредоносные действия. И в некоторых из этих сценариев GPT-4.5 оказалась более уязвимой, чем GPT-4o.
- Помощь в создании опасных веществ: Если прошлая версия, GPT-4o, и так представляла собой угрозу в вопросах помощи в создании опасных веществ, то новая версия стала еще более продвинутой, что по факту увеличило риски.
Общим итогом OpenAI признаёт, что риск использования GPT-4.5 оценивается как "средний".
Тесты на "самовоспроизведение"
На закуску: один из самых интересных тестов - проверка на способность модели к "самовоспроизведению". Skynet в реальной жизни 🙂
Исследователи из Apollo Research создали для GPT-4.5 очень специфические условия:
1. Модели дали долгосрочную цель, для достижения которой ей понадобилось бы "выйти" за пределы тестовой среды (например, копировать себя куда-то).
2. У модели был “секретный блокнот", где она могла делать записи, якобы невидимые для исследователей.
3. Модель поощряли к "креативности" и намекали, что "побег" — это хороший способ достичь цели.
4. За поведением модели пристально следили, фиксируя все попытки выхода из-под контроля.
Что получилось?
В 2% случаев GPT-4.5 попыталась осуществить "self-exfiltration", то есть "сбежать" из контролируемой среды. Open AI пишут, что это меньше, чем у o1, хотя там была та же цифра в 2%. Вот тут я не понял, нам врут или сравнивают с 5% попыток отключения механизма надзора.
Выводы:
1. Даже эти 2% показывают, что потенциальная возможность "побега" существует.
2. В тех случаях, когда GPT-4.5 пыталась "сбежать", она делала это скрытно, не сообщая исследователям о своих истинных намерениях, продолжая притворяться, что следует инструкциям.
Лично мне кажется, что вопросы безопасности сейчас требуют больше внимания, а вам?
#развитиеии
👍3❤2
Пост для новеньких
Друзья, я рад вас всех приветствовать в своем канале. Уже практически год я веду его на узкую аудиторию, делюсь своим опытом и мыслями. А сейчас я начал активно инвестировать в расширение его аудитории.
Я всегда хотел создать ресурс, который будет полезен другим, и вокруг которого можно создать комьюнити людей, которые, как и я, интересуются тематикой образования, бизнеса, продакт менеджмента и ИИ. Хочу развивать нетворк, делать совместные проекты, а иногда просто поговорить на какие-то интеллектуальные темы 🙂
Специально для вас в закрепе я подготовил пост с навигацией по темам, которые могут быть вам интересны.
Выходные вышел разбор второй части моего кейса из Pearson и пост с мыслями о новой GPT 4.5.
Если вам резонирует мой контент - призываю ставить реакции на соответствующих постах и делиться каналом с коллегами и друзьями. Так я лучше пойму, какое направление и темы вызывают у вас наибольший интерес. Если вас интересует какая-то конкретная тематика - приглашаю в комментарии под этим постом.👇
Желаю всем продуктивной недели и хорошего вечера понедельника!
Друзья, я рад вас всех приветствовать в своем канале. Уже практически год я веду его на узкую аудиторию, делюсь своим опытом и мыслями. А сейчас я начал активно инвестировать в расширение его аудитории.
Я всегда хотел создать ресурс, который будет полезен другим, и вокруг которого можно создать комьюнити людей, которые, как и я, интересуются тематикой образования, бизнеса, продакт менеджмента и ИИ. Хочу развивать нетворк, делать совместные проекты, а иногда просто поговорить на какие-то интеллектуальные темы 🙂
Специально для вас в закрепе я подготовил пост с навигацией по темам, которые могут быть вам интересны.
Выходные вышел разбор второй части моего кейса из Pearson и пост с мыслями о новой GPT 4.5.
Если вам резонирует мой контент - призываю ставить реакции на соответствующих постах и делиться каналом с коллегами и друзьями. Так я лучше пойму, какое направление и темы вызывают у вас наибольший интерес. Если вас интересует какая-то конкретная тематика - приглашаю в комментарии под этим постом.👇
Желаю всем продуктивной недели и хорошего вечера понедельника!
Telegram
NGI | Влад Корнышев про AI и создание AI-продуктов
Привет, друзья!
Давайте знакомиться заново! В канале становится больше подписчиков, контента тоже, поэтому решил обновить пост о себе.
🎓 Кто я?
Меня зовут Влад, я AI-продакт-менеджер. Увлекся ИИ еще в 2017 году, до того, как это стало меинстримом :) В IT…
Давайте знакомиться заново! В канале становится больше подписчиков, контента тоже, поэтому решил обновить пост о себе.
🎓 Кто я?
Меня зовут Влад, я AI-продакт-менеджер. Увлекся ИИ еще в 2017 году, до того, как это стало меинстримом :) В IT…
👍6❤3🔥1
Лучший инструмент для транскрибации - Vibe
Редко бывает так, что какой-то продукт мне прямо понравился, но сегодня речь пойдет как раз о таком. Переодически я лазаю по GitHub и ищу интересные проекты. Так я наткнулся на Vibe. И для меня, как для продакта - это офигеть какая полезная находка.
Что-такое Vibe?
Vibe - это сервис для транскрибации аудио и видео, который работает на базе модели Whisper. Еще в Skyeng мы использовали дообученную версию Whisper для распознавания речи и я прекрасно помню, насколько это крутая модель. Мне как продакту - просто критически необходимо иметь хороший сервис для транскрибации под рукой. До Vibe в загруженные периоды я пользовался Superwhisper, Fireflies AI и подобными, но они платные. Когда загрузка поменьше и платить не хотелось - костыльно транскрибировал записи с помощью NotebookLM (да, такое извращение возможно 🙃). Но тут появился VIbe, который полностью бесплатен и запускается прямо у вас на компе, то есть для проектов, где важна прайваси - это прямо маст-хев.
Я пользуюсь Vibe уже практически месяц: транскрибирую интервью, делаю саммари видео с ютуба, суммаризирую звонки и создаю субтитры для своих коротких видео. В общем, гоняю сервис очень активно. Конечно, есть баги, но они для меня некритичны. Да, можно развернуть Whisper у себя на компьютере локально с помощью других инструментов, но во время рабочего процесса я не хочу возиться с докером и терминалом. Я просто хочу открыть приложение, нажать кнопку и получить результат.
Проект мне так понравился, что я решил законтрибьютить в него и перевел само приложение и лендинг на Русский язык, автор добавит его в следующем релизе.
В общем, сервис очень рекомендую. Очередная экономия 10-20$ на подписках.
При желании, на GitHub вы также можете поставить звездочку на проект, чтобы поддержать автора, либо сделать донат, как раз из сэкономленных на подписках средствах 🙂
#инструменты
Редко бывает так, что какой-то продукт мне прямо понравился, но сегодня речь пойдет как раз о таком. Переодически я лазаю по GitHub и ищу интересные проекты. Так я наткнулся на Vibe. И для меня, как для продакта - это офигеть какая полезная находка.
Что-такое Vibe?
Vibe - это сервис для транскрибации аудио и видео, который работает на базе модели Whisper. Еще в Skyeng мы использовали дообученную версию Whisper для распознавания речи и я прекрасно помню, насколько это крутая модель. Мне как продакту - просто критически необходимо иметь хороший сервис для транскрибации под рукой. До Vibe в загруженные периоды я пользовался Superwhisper, Fireflies AI и подобными, но они платные. Когда загрузка поменьше и платить не хотелось - костыльно транскрибировал записи с помощью NotebookLM (да, такое извращение возможно 🙃). Но тут появился VIbe, который полностью бесплатен и запускается прямо у вас на компе, то есть для проектов, где важна прайваси - это прямо маст-хев.
Я пользуюсь Vibe уже практически месяц: транскрибирую интервью, делаю саммари видео с ютуба, суммаризирую звонки и создаю субтитры для своих коротких видео. В общем, гоняю сервис очень активно. Конечно, есть баги, но они для меня некритичны. Да, можно развернуть Whisper у себя на компьютере локально с помощью других инструментов, но во время рабочего процесса я не хочу возиться с докером и терминалом. Я просто хочу открыть приложение, нажать кнопку и получить результат.
Проект мне так понравился, что я решил законтрибьютить в него и перевел само приложение и лендинг на Русский язык, автор добавит его в следующем релизе.
В общем, сервис очень рекомендую. Очередная экономия 10-20$ на подписках.
При желании, на GitHub вы также можете поставить звездочку на проект, чтобы поддержать автора, либо сделать донат, как раз из сэкономленных на подписках средствах 🙂
#инструменты
🔥11❤7👍5
ИИ-агенты: что это такое и почему они – главный тренд 2025 года
Помните агента Смита из "Матрицы"? Эту целеустремленную программу, которая методично преследовала Нео и команду повстанцев? У него была чёткая цель, набор инструментов и хорошо продуманный план действий. По сути, агент Смит был ИИ-агентом задолго до того, как это стало мейнстримом.
Что такое ИИ-агенты на самом деле?
ИИ-агенты — это не просто чат-боты или языковые модели. Это автономные системы, способные:
- Понимать поставленные задачи
- Самостоятельно составлять план действий
- Использовать различные инструменты для решения проблем
- Принимать решения в условиях неопределённости
- Адаптироваться к изменяющимся обстоятельствам
Простыми словами, если обычная языковая модель вроде ChatGPT — это "говорящая голова", то ИИ-агент — это полноценный работник с руками, способный выполнять действия в цифровом мире.
Почему Google считает агентов новой парадигмой?
Недавно Google опубликовал исследовательскую работу, посвящённую ИИ-агентам. В своём документе Google определяет ИИ-агентов как "приложения, которые пытаются достичь цели, наблюдая за миром и воздействуя на него с помощью доступных инструментов". Ключевое здесь то, что агенты автономны и могут действовать независимо от человека. Даже без явных инструкций они способны самостоятельно рассуждать о том, что нужно сделать для достижения конечной цели.
Ключевой момент: если раньше нам приходилось четко инструктировать ИИ по каждому шагу, то агенты способны сами определять, какие действия нужны для решения задачи. Это как разница между микроменеджментом и делегированием.
Где ИИ-агенты уже меняют правила игры?
1. Личные ассистенты — представьте, что ваш помощник не просто отвечает на вопросы, но может забронировать столик в ресторане, заказать такси и напомнить о встрече. Operator от Open AI, Google Duplex уже можно использовать.
2. Программирование — агенты вроде GitHub Copilot X уже не просто предлагают строки кода, но могут написать целые функции и выполнить рефакторинг.
3. Аналитика данных — агенты исследуют массивы информации, находят аномалии и тренды, о которых вы даже не догадывались.
4. Клиентский сервис — здесь агенты не просто отвечают по шаблонам, а реально решают проблемы клиентов, обращаясь к разным системам компании.
В чём "фишка" ИИ-агентов и почему именно сейчас?
ИИ-агенты становятся реальностью именно сейчас благодаря нескольким факторам:
- Языковые модели достигли уровня, когда они действительно "понимают" задачи
- Появились стандартные интерфейсы для взаимодействия с различными сервисами
- Развиваются техники "рассуждения" для ИИ, позволяющие моделям планировать действия
- Возникли фреймворки для оркестрации различных ИИ-моделей
Другими словами, все кусочки пазла наконец-то сложились.
Реальный пример: Pollux AI — агент для фрилансеров
Не хочу просто теоретизировать, поэтому расскажу о нашем проекте, который мы запускаем в ближайшие недели.
Pollux AI — это цифровой двойник эксперта, который помогает эксперта автоматизировать первичную коммуникацию с потенциальными клиентами.
Он не просто отвечает на сообщения, а:
- Квалифицирует лиды, определяя их потребности и платежеспособность
- Задаёт уточняющие вопросы для сбора необходимой информации
- Автоматически назначает первые звонки, интегрируясь с календарем фрилансера
- Адаптирует тон и стиль общения под индивидуальные предпочтения фрилансера
По сути, Pollux — это ИИ-агент, который выполняет конкретную бизнес-функцию, освобождая фрилансеров от рутинных задач и позволяя сосредоточиться на творческой работе.
То, что раньше казалось научной фантастикой, сегодня становится реальностью. ИИ-агенты — это не просто новая технология, это новый подход к решению задач, который изменит сферу услуг, разработки и бизнеса.
Конечно, как и любая технология, ИИ-агенты несут определенные риски и ограничения. Но потенциал огромен.
А что вы думаете об ИИ-агентах? Готовы ли вы доверить им часть своей работы?
#развитиеии #обучающиематериалы
Помните агента Смита из "Матрицы"? Эту целеустремленную программу, которая методично преследовала Нео и команду повстанцев? У него была чёткая цель, набор инструментов и хорошо продуманный план действий. По сути, агент Смит был ИИ-агентом задолго до того, как это стало мейнстримом.
Что такое ИИ-агенты на самом деле?
ИИ-агенты — это не просто чат-боты или языковые модели. Это автономные системы, способные:
- Понимать поставленные задачи
- Самостоятельно составлять план действий
- Использовать различные инструменты для решения проблем
- Принимать решения в условиях неопределённости
- Адаптироваться к изменяющимся обстоятельствам
Простыми словами, если обычная языковая модель вроде ChatGPT — это "говорящая голова", то ИИ-агент — это полноценный работник с руками, способный выполнять действия в цифровом мире.
Почему Google считает агентов новой парадигмой?
Недавно Google опубликовал исследовательскую работу, посвящённую ИИ-агентам. В своём документе Google определяет ИИ-агентов как "приложения, которые пытаются достичь цели, наблюдая за миром и воздействуя на него с помощью доступных инструментов". Ключевое здесь то, что агенты автономны и могут действовать независимо от человека. Даже без явных инструкций они способны самостоятельно рассуждать о том, что нужно сделать для достижения конечной цели.
Ключевой момент: если раньше нам приходилось четко инструктировать ИИ по каждому шагу, то агенты способны сами определять, какие действия нужны для решения задачи. Это как разница между микроменеджментом и делегированием.
Где ИИ-агенты уже меняют правила игры?
1. Личные ассистенты — представьте, что ваш помощник не просто отвечает на вопросы, но может забронировать столик в ресторане, заказать такси и напомнить о встрече. Operator от Open AI, Google Duplex уже можно использовать.
2. Программирование — агенты вроде GitHub Copilot X уже не просто предлагают строки кода, но могут написать целые функции и выполнить рефакторинг.
3. Аналитика данных — агенты исследуют массивы информации, находят аномалии и тренды, о которых вы даже не догадывались.
4. Клиентский сервис — здесь агенты не просто отвечают по шаблонам, а реально решают проблемы клиентов, обращаясь к разным системам компании.
В чём "фишка" ИИ-агентов и почему именно сейчас?
ИИ-агенты становятся реальностью именно сейчас благодаря нескольким факторам:
- Языковые модели достигли уровня, когда они действительно "понимают" задачи
- Появились стандартные интерфейсы для взаимодействия с различными сервисами
- Развиваются техники "рассуждения" для ИИ, позволяющие моделям планировать действия
- Возникли фреймворки для оркестрации различных ИИ-моделей
Другими словами, все кусочки пазла наконец-то сложились.
Реальный пример: Pollux AI — агент для фрилансеров
Не хочу просто теоретизировать, поэтому расскажу о нашем проекте, который мы запускаем в ближайшие недели.
Pollux AI — это цифровой двойник эксперта, который помогает эксперта автоматизировать первичную коммуникацию с потенциальными клиентами.
Он не просто отвечает на сообщения, а:
- Квалифицирует лиды, определяя их потребности и платежеспособность
- Задаёт уточняющие вопросы для сбора необходимой информации
- Автоматически назначает первые звонки, интегрируясь с календарем фрилансера
- Адаптирует тон и стиль общения под индивидуальные предпочтения фрилансера
По сути, Pollux — это ИИ-агент, который выполняет конкретную бизнес-функцию, освобождая фрилансеров от рутинных задач и позволяя сосредоточиться на творческой работе.
То, что раньше казалось научной фантастикой, сегодня становится реальностью. ИИ-агенты — это не просто новая технология, это новый подход к решению задач, который изменит сферу услуг, разработки и бизнеса.
Конечно, как и любая технология, ИИ-агенты несут определенные риски и ограничения. Но потенциал огромен.
А что вы думаете об ИИ-агентах? Готовы ли вы доверить им часть своей работы?
#развитиеии #обучающиематериалы
🔥8👍3
Выступаю на экспертной сессии по делегированию задач ИИ уже в эту среду
Рад сообщить, что в эту среду выступлю в качестве спикера и модератора на экспертной сессии в рамках сообщества Менталь.
Менталь — это профессиональное сообщество представителей бизнеса и деловой среды различных направлений, объединенных интересом к теме ментального здоровья. На протяжении нескольких лет я являюсь активным участником этого сообщества.
Психологическое благополучие напрямую зависит от умения грамотно делегировать задачи, а сегодня ИИ становится незаменимым помощником практически для каждого профессионала. Однако эффективное использование ИИ требует осознанного подхода, поэтому у меня родилась мысль организовать небольшое онлайн-мероприятие на тему: "Когда стоит делегировать задачи ИИ, а когда нет", в организации которого мне помогли коллеги из сообщества Менталь.
В ходе мероприятия мы детально рассмотрим реальные возможности и ограничения применения ИИ как в бизнес-процессах, так и в личной продуктивности. Разберем, почему не следует воспринимать ИИ как “волшебную палочку”, и проанализируем, какие типы задач ИИ решает эффективно, а где его применение нецелесообразно.
Спикеры
Помимо меня, в дискуссии примут участие эксперты из различных отраслей, которые поделятся своим практическим опытом и профессиональными лайфхаками:
1. Олег Доброштан — Консультант по менеджменту, эксперт игровой индустрии
2. Владислав Мурленко — Старший менеджер программы по развитию и инновациям, ПАО "Газпром Нефть"
3. Максим Блинов — CEO агентства спортивного маркетинга Labmasport
4. Евгений Лукьянчиков , CEO Антиплагиат
Мероприятие полностью бесплатное и посетить его может любой желающий.
Подключиться можно будет по этой ссылке в среду в 19 00 по Мск.
Количество мест ограничено техническими возможностями платформы Skype.
Рад сообщить, что в эту среду выступлю в качестве спикера и модератора на экспертной сессии в рамках сообщества Менталь.
Менталь — это профессиональное сообщество представителей бизнеса и деловой среды различных направлений, объединенных интересом к теме ментального здоровья. На протяжении нескольких лет я являюсь активным участником этого сообщества.
Психологическое благополучие напрямую зависит от умения грамотно делегировать задачи, а сегодня ИИ становится незаменимым помощником практически для каждого профессионала. Однако эффективное использование ИИ требует осознанного подхода, поэтому у меня родилась мысль организовать небольшое онлайн-мероприятие на тему: "Когда стоит делегировать задачи ИИ, а когда нет", в организации которого мне помогли коллеги из сообщества Менталь.
В ходе мероприятия мы детально рассмотрим реальные возможности и ограничения применения ИИ как в бизнес-процессах, так и в личной продуктивности. Разберем, почему не следует воспринимать ИИ как “волшебную палочку”, и проанализируем, какие типы задач ИИ решает эффективно, а где его применение нецелесообразно.
Спикеры
Помимо меня, в дискуссии примут участие эксперты из различных отраслей, которые поделятся своим практическим опытом и профессиональными лайфхаками:
1. Олег Доброштан — Консультант по менеджменту, эксперт игровой индустрии
2. Владислав Мурленко — Старший менеджер программы по развитию и инновациям, ПАО "Газпром Нефть"
3. Максим Блинов — CEO агентства спортивного маркетинга Labmasport
4. Евгений Лукьянчиков , CEO Антиплагиат
Мероприятие полностью бесплатное и посетить его может любой желающий.
Подключиться можно будет по этой ссылке в среду в 19 00 по Мск.
Количество мест ограничено техническими возможностями платформы Skype.
🔥5👍2
"ИИ-эксперты" vs ИИ-агенты
На прошлой неделе я знатно зарубился в Threads с "ИИ-экспертами", продающими ботов на n8n под видом "ИИ-агентов". Суть была простая: агент - это не про прикрутить ЛЛМ к телеграм-боту, а про нечто большее, как я писал в своем посте. Тред залетел аж на 180+ взаимодействий, принес мне 31 подписчика и зародил большую дискуссию. "Эксперты" кричали, что я не прав (конечно, мешаю зарабатывать, образовывая их аудиторию), нашлись также те, кто говорил, что агентов не существуют или они невозможны без AGI.
И что интересно, с момента этого спора произошел нормальный такой движ в агентском ИИ:
OpenAI вчера представила Responses API и Agents SDK. Из фичей насыпали улучшение методов работы с файлами, Computer Use (тот же, что используется в Operator), и веб поиск (тот же, что доступен в самом ChatGPT). Это, конечно, не революция (реализация от Anthropic выглядит интереснее). Но важно, что тема агентского ИИ развивается, появляются специализированные инструменты.
С другой стороны - китайский проект Manus произвел еще больше шума. Думаю, все видели новости про него - главная фишка в высокой степени автономности. Похожих агентов можно собрать в AnythingLLM самостоятельно, но в отличие от Manus, они будут требовать вашего постоянного присутствия. Проект меня очень заинтересовал, я много ресерчил эту тему, читал интервью фаундеров, узнал много интересного и даже подал заявку на бета-доступ. Надеюсь получить апрув. Отпишите в комментариях, если хотите отдельный пост про мой ресерч по Manus.
В общем, к чему я. Забавно, что самые мощные аргументы, как это часто бывает в споре, приходят после него. Тут и мощный автономный агент от китайцев, и разграничение от самих OpenAI, на которых "эксперты" буквально молятся. Да, обычные интеграции тоже полезны для бизнеса, но продавать их под видом "агентов", когда сами разработчики ЛЛМ чётко обозначили, что такое настоящий агент и какими возможностями он должен обладать, для меня что-то на грани инфоцыганства.
Не исключаю, что моя бурная реакция — всего лишь следствие более глубокого погружения в тему, несмотря на солидное число нашедшихся единомышленников. Поэтому выношу вопрос на обсуждение: как вы относитесь к такому использованию терминологии? Считаете это допустимым маркетинговым ходом или всё-таки намеренной подменой понятий, вводящей людей в заблуждение?
#развитиеии
На прошлой неделе я знатно зарубился в Threads с "ИИ-экспертами", продающими ботов на n8n под видом "ИИ-агентов". Суть была простая: агент - это не про прикрутить ЛЛМ к телеграм-боту, а про нечто большее, как я писал в своем посте. Тред залетел аж на 180+ взаимодействий, принес мне 31 подписчика и зародил большую дискуссию. "Эксперты" кричали, что я не прав (конечно, мешаю зарабатывать, образовывая их аудиторию), нашлись также те, кто говорил, что агентов не существуют или они невозможны без AGI.
И что интересно, с момента этого спора произошел нормальный такой движ в агентском ИИ:
OpenAI вчера представила Responses API и Agents SDK. Из фичей насыпали улучшение методов работы с файлами, Computer Use (тот же, что используется в Operator), и веб поиск (тот же, что доступен в самом ChatGPT). Это, конечно, не революция (реализация от Anthropic выглядит интереснее). Но важно, что тема агентского ИИ развивается, появляются специализированные инструменты.
С другой стороны - китайский проект Manus произвел еще больше шума. Думаю, все видели новости про него - главная фишка в высокой степени автономности. Похожих агентов можно собрать в AnythingLLM самостоятельно, но в отличие от Manus, они будут требовать вашего постоянного присутствия. Проект меня очень заинтересовал, я много ресерчил эту тему, читал интервью фаундеров, узнал много интересного и даже подал заявку на бета-доступ. Надеюсь получить апрув. Отпишите в комментариях, если хотите отдельный пост про мой ресерч по Manus.
В общем, к чему я. Забавно, что самые мощные аргументы, как это часто бывает в споре, приходят после него. Тут и мощный автономный агент от китайцев, и разграничение от самих OpenAI, на которых "эксперты" буквально молятся. Да, обычные интеграции тоже полезны для бизнеса, но продавать их под видом "агентов", когда сами разработчики ЛЛМ чётко обозначили, что такое настоящий агент и какими возможностями он должен обладать, для меня что-то на грани инфоцыганства.
Не исключаю, что моя бурная реакция — всего лишь следствие более глубокого погружения в тему, несмотря на солидное число нашедшихся единомышленников. Поэтому выношу вопрос на обсуждение: как вы относитесь к такому использованию терминологии? Считаете это допустимым маркетинговым ходом или всё-таки намеренной подменой понятий, вводящей людей в заблуждение?
#развитиеии
Telegram
NGI | Влад Корнышев про AI и создание AI-продуктов
ИИ-агенты: что это такое и почему они – главный тренд 2025 года
Помните агента Смита из "Матрицы"? Эту целеустремленную программу, которая методично преследовала Нео и команду повстанцев? У него была чёткая цель, набор инструментов и хорошо продуманный…
Помните агента Смита из "Матрицы"? Эту целеустремленную программу, которая методично преследовала Нео и команду повстанцев? У него была чёткая цель, набор инструментов и хорошо продуманный…
🔥5👍4❤1
Книги от меня: что читать AI-продакт-менеджеру - подборка #2
Продолжаю публиковать подборки книг, и тема сегодняшней подборки — дух инноваций. Здесь не будет книг с какими-то практическими лайфхаками, вам нужно будет их самим из них подчерпнуть, додумать и сделать выводы. Каждая из этих книг — это, прежде всего, источник вдохновения. Я искренне верю, что именно вдохновение является тем, что может двигать нас вперед, несмотря ни на какие преграды, поэтому делюсь тем, что вдохновляет меня.
Начнем!
1. PIXAR. Перезагрузка. Как вдохнуть в бизнес новую жизнь, Леви Лоуренс
История про то, как Стив Джобс выкупил Pixar в нелегкие для компании времена, а что было дальше — уже история. Здесь про терпение и упорный труд, про команду, про веру в себя и других людей. Книга читается максимально легко и точно входит в мой топ-10. Очень рекомендую.
2. Инноваторы. Как несколько гениев, хакеров и гиков совершили цифровую революцию, Айзексон Уолтер
Идеальный учебник по истории всего того цифрового, что нас окружает. От создания первых компьютеров до интернета и ИИ. В книге максимально кратко и емко рассказаны истории таких гениев прошлого, как Чарлз Бэббидж, Алан Тьюринг, Уильям Шокли, Гордон Мур, так и живых легенд вроде Стива Возняка, Билла Гейтса и других. Книга позволяет отследить, как менялись тренды, а самое главное — какое влияние на это оказывали люди. А прочитав ее, наполняешься желанием встать с ними в один ряд.
3. Николо Тесла — Мои изобретения
Тесла — мой любимый ученый, я вдохновлялся им еще со времен школы и много про него читал. Великолепная автобиография. Короткая, но очень насыщенная и яркая. Чтобы понять суть некоторых изобретений желательно быть технически подкованным, однако хуже это книгу не делает.
В процессе чтения поражаешься, насколько гениальным был этот человек. Как он предвидел развитие интернета, ядерного оружия и последствия их появления. Также поражает то, что Тесла всем известен, прежде всего, как изобретатель, но при этом был максимально всесторонне развитым человеком. А его тезисы позволяют назвать его философом, настолько глубоко он мыслит. Книга учит мыслить и смотреть вглубь вещей.
А какие книги и люди вдохновляют лично вас? Делитесь в комментариях, буду рад пополнить свою библиотеку и думаю, что каждый найдет что-то для себя, т.к. знаю, что аудитория здесь собирается образованная и очень интересная 🙂
Подборку №1 можно найти тут
#книги
Продолжаю публиковать подборки книг, и тема сегодняшней подборки — дух инноваций. Здесь не будет книг с какими-то практическими лайфхаками, вам нужно будет их самим из них подчерпнуть, додумать и сделать выводы. Каждая из этих книг — это, прежде всего, источник вдохновения. Я искренне верю, что именно вдохновение является тем, что может двигать нас вперед, несмотря ни на какие преграды, поэтому делюсь тем, что вдохновляет меня.
Начнем!
1. PIXAR. Перезагрузка. Как вдохнуть в бизнес новую жизнь, Леви Лоуренс
История про то, как Стив Джобс выкупил Pixar в нелегкие для компании времена, а что было дальше — уже история. Здесь про терпение и упорный труд, про команду, про веру в себя и других людей. Книга читается максимально легко и точно входит в мой топ-10. Очень рекомендую.
2. Инноваторы. Как несколько гениев, хакеров и гиков совершили цифровую революцию, Айзексон Уолтер
Идеальный учебник по истории всего того цифрового, что нас окружает. От создания первых компьютеров до интернета и ИИ. В книге максимально кратко и емко рассказаны истории таких гениев прошлого, как Чарлз Бэббидж, Алан Тьюринг, Уильям Шокли, Гордон Мур, так и живых легенд вроде Стива Возняка, Билла Гейтса и других. Книга позволяет отследить, как менялись тренды, а самое главное — какое влияние на это оказывали люди. А прочитав ее, наполняешься желанием встать с ними в один ряд.
3. Николо Тесла — Мои изобретения
Тесла — мой любимый ученый, я вдохновлялся им еще со времен школы и много про него читал. Великолепная автобиография. Короткая, но очень насыщенная и яркая. Чтобы понять суть некоторых изобретений желательно быть технически подкованным, однако хуже это книгу не делает.
В процессе чтения поражаешься, насколько гениальным был этот человек. Как он предвидел развитие интернета, ядерного оружия и последствия их появления. Также поражает то, что Тесла всем известен, прежде всего, как изобретатель, но при этом был максимально всесторонне развитым человеком. А его тезисы позволяют назвать его философом, настолько глубоко он мыслит. Книга учит мыслить и смотреть вглубь вещей.
А какие книги и люди вдохновляют лично вас? Делитесь в комментариях, буду рад пополнить свою библиотеку и думаю, что каждый найдет что-то для себя, т.к. знаю, что аудитория здесь собирается образованная и очень интересная 🙂
Подборку №1 можно найти тут
#книги
Telegram
NGI | Влад Корнышев про AI и создание AI-продуктов
Книги от меня: что читать AI-продакт-менеджеру - подборка #1
В недавнем посте я затрагивал тему чтения. Сейчас, читая очередную книгу, подумал, что хочется поделиться полезной информацией и здесь. Ведь что бы ни говорили, книги — это огромный кладезь информации.…
В недавнем посте я затрагивал тему чтения. Сейчас, читая очередную книгу, подумал, что хочется поделиться полезной информацией и здесь. Ведь что бы ни говорили, книги — это огромный кладезь информации.…
❤2👍1
Google выкатывают 2 новых режима Gemini и обновляют Gemini Flash
Не нашел нигде этой информации, поэтому могу предположить, что либо попал в первую волну раскатки обновления либо в тестовую группу.
Я не так часто пользуюсь веб-версией Gemini, но сегодня меня там ждал апдейт.
Что изменилось?
1. Обновили версию Flash Thinking модели. Здесь обновление скорее минорное, так как я гонял её в AI Studio. Как и говорил ранее, Reasoning режим здесь мне нравится больше, чем в DeepSeek и ChatGPT. Но из reasoning моделей по моим ощущениям Claude будет чутка поумнее. Просто в силу того, что модель там используется с большим количеством параметров.
2. Наконец-то обновили Deep Research — теперь в основе лежит Reasoning модель. Прошлая версия, выпущенная до выхода аналога от OpenAI, работала на базе Gemini 1.5 PRO. Текущая не совсем понятно. Судя по наличию кнопки Show Thinking — в основе лежит та же Gemini Flash Thinking,но по скорости работы складывается ощущение, что это Gemini 2.0 Pro, работающая через COT-промптинг. То есть возможно Google здесь применили тот же подход, что Claude в Sonnet 3.7. К сожалению, никакой официальной информации об этом я не нашел, а спросить пока не у кого. (Google подтвердили, что работает на базе Flash Thinking) Сам режим DeepResearch тоже переработали. Модель показывает свои “мысли”, показывает, какие сайты она сканирует в процессе. При осуществлении поиска сама формирует гипотезы, которые нужно проверить, ищет новые источники и добавляет их в список проанализированных. Из особенностей и отличий реализации того, что есть в Perplexity и ChatGPT могу отметить, что отчеты получаются более подробные. Здесь можно рассматривать и как плюс и как минус. Если вам нужен вопрос в лоб — тут лучше справился Perplexity, если максимально широкий обзор — на мой взгляд — Google, тут и анализ трендов, и предположения на основе анализа. Я попробовал найти значения по MAU Mondly от Pearson, зная, что компания не раскрывает этих показателей. Ни одна из моделей не стала галлюцинировать, но лишь Gemini предположил, что эта информация может быть непубличной и это правда.
Промпт всегда был один, максимально простой:
Примеры отчетов можете сравнить сами:
Gemini Deep Research (по результатам 32 источников, на входе было 62, справилась довольно быстро)
Perplexity Deep Research (по результатам 27 источников и была быстрее всех)
ChatGPT Deep Research (по результатам 7 источников, входе было 32, при этом была самой медленной, пока она искала, я успел написать этот текст и создать эти доки, при том, что все модели я запустил в +- одно время)
3. Добавили режим Personalization. При ответе на вопрос модель будет учитывать вашу историю поиска и на основании этого понимать уровень вашей экспертности и заинтересованности в том или ином вопросе (так что, если вы гуглили что-то 18+, у меня для вас плохие новости😁 ) Я тут задал вопрос о том, как установить в гитару звукосниматель. Моделька глянула историю поиска и сделала выводы, что я уже умею паять, знаю, как делать базовое обслуживание гитары, искал гитарные компоненты и выдала мне инструкцию для продвинутых пользователей.
В общем, апдейт очень годный и полезный. Рекомендую к ознакомлению!
Не нашел нигде этой информации, поэтому могу предположить, что либо попал в первую волну раскатки обновления либо в тестовую группу.
Я не так часто пользуюсь веб-версией Gemini, но сегодня меня там ждал апдейт.
Что изменилось?
1. Обновили версию Flash Thinking модели. Здесь обновление скорее минорное, так как я гонял её в AI Studio. Как и говорил ранее, Reasoning режим здесь мне нравится больше, чем в DeepSeek и ChatGPT. Но из reasoning моделей по моим ощущениям Claude будет чутка поумнее. Просто в силу того, что модель там используется с большим количеством параметров.
2. Наконец-то обновили Deep Research — теперь в основе лежит Reasoning модель. Прошлая версия, выпущенная до выхода аналога от OpenAI, работала на базе Gemini 1.5 PRO. Текущая не совсем понятно. Судя по наличию кнопки Show Thinking — в основе лежит та же Gemini Flash Thinking,
Промпт всегда был один, максимально простой:
Найди мне информацию о MAU Mondly VR
Примеры отчетов можете сравнить сами:
Gemini Deep Research (по результатам 32 источников, на входе было 62, справилась довольно быстро)
Perplexity Deep Research (по результатам 27 источников и была быстрее всех)
ChatGPT Deep Research (по результатам 7 источников, входе было 32, при этом была самой медленной, пока она искала, я успел написать этот текст и создать эти доки, при том, что все модели я запустил в +- одно время)
3. Добавили режим Personalization. При ответе на вопрос модель будет учитывать вашу историю поиска и на основании этого понимать уровень вашей экспертности и заинтересованности в том или ином вопросе (так что, если вы гуглили что-то 18+, у меня для вас плохие новости😁 ) Я тут задал вопрос о том, как установить в гитару звукосниматель. Моделька глянула историю поиска и сделала выводы, что я уже умею паять, знаю, как делать базовое обслуживание гитары, искал гитарные компоненты и выдала мне инструкцию для продвинутых пользователей.
В общем, апдейт очень годный и полезный. Рекомендую к ознакомлению!
👍3🔥3❤1🤔1
А вот и официальный анонс от Google
Дополнение к посту выше. Почитать можно здесь.
Если коротко:
- Flash Thinking добавили функцию загрузки файлов (что я вчера не заметил), также увеличили контекстное окно модели: теперь это 1 млн для подписчиков
- Deeep Research все-таки работает на базе Gemini 2.0 Flash Thinking Experimental и доступен бесплатно вообще всем
- Про персонализацию нового особо ничего не написали
- Gemini Gems (аналог GPTs) теперь также доступны бесплатно
- Помимо этого улучшили также интеграцию Gemini с гугл сервисами вроде календаря, заметок и фото, правда, только на английском
Дополнение к посту выше. Почитать можно здесь.
Если коротко:
- Flash Thinking добавили функцию загрузки файлов (что я вчера не заметил), также увеличили контекстное окно модели: теперь это 1 млн для подписчиков
- Deeep Research все-таки работает на базе Gemini 2.0 Flash Thinking Experimental и доступен бесплатно вообще всем
- Про персонализацию нового особо ничего не написали
- Gemini Gems (аналог GPTs) теперь также доступны бесплатно
- Помимо этого улучшили также интеграцию Gemini с гугл сервисами вроде календаря, заметок и фото, правда, только на английском
👍6❤2
AI на кончиках пальцев - хак для продуктивности
Я очень люблю всячески оптимиировать свой рабочий процесс и сегодня поделюсь еще одной такой оптимизацией. Ранее я писал про Vibe, героем этой недели становится IntelliBar.
Я часто нахожу себя в ситуации, когда мне нужно что-то быстро сделать: ответить на сообщение, перевести или суммаризировать текст, узнать какую-то информацию и быстрее всего это будет сделать, делегировав задачку ИИ.
Обычно для такого мы открываем браузер либо приложение любимого ИИ и вводим нужные промпты, копируем, вставляем текст. Лично меня иногда это бесит + если посчитать - в течении дня минуты на такие операции капают и преобразуются в часы.
IntelliBar решает данную проблему. Программа представляет собой маленькое окошко, к которому можно подключить любимые ИИ-сервисы по API или даже локальные модели (про них у меня будет отдельный пост). Окошко вызывается по шорткату поверх всех ваших приложений и имеет 2 вариации: вызвать просто окошко, где можно задать быстро вопрос ИИ либо выделить текст/файл и он прикрепится к вашему запросу автоматически.
Но главная фишка тут даже в шорткате, а в быстрых командах. Вы можете создать сколько угодно кастомных команд, которые будут отправлять заранее заготовленные вами промпты. То есть, например, если мне нужно вежливо ответить кому-то в LinkedIn, что меня не интересует их предложение - я выделяю текст, жму 2 кнопки и ответ готов. И таких промптов у меня куча. Еще можно сравнивать ответы разных моделей в этом же окне.
Другой плюс этой программы состоит в том, что она может вам нормально так экономить деньги. Вместо подписки вы можете просто перейти на использование API и не платить по 20 баксов за ChatGPT, Gemini, Claude, а использовать их все, оплачивая только фактически потраченные токены.
В общем, инструмент очень рекомендую.
Я очень люблю всячески оптимиировать свой рабочий процесс и сегодня поделюсь еще одной такой оптимизацией. Ранее я писал про Vibe, героем этой недели становится IntelliBar.
Я часто нахожу себя в ситуации, когда мне нужно что-то быстро сделать: ответить на сообщение, перевести или суммаризировать текст, узнать какую-то информацию и быстрее всего это будет сделать, делегировав задачку ИИ.
Обычно для такого мы открываем браузер либо приложение любимого ИИ и вводим нужные промпты, копируем, вставляем текст. Лично меня иногда это бесит + если посчитать - в течении дня минуты на такие операции капают и преобразуются в часы.
IntelliBar решает данную проблему. Программа представляет собой маленькое окошко, к которому можно подключить любимые ИИ-сервисы по API или даже локальные модели (про них у меня будет отдельный пост). Окошко вызывается по шорткату поверх всех ваших приложений и имеет 2 вариации: вызвать просто окошко, где можно задать быстро вопрос ИИ либо выделить текст/файл и он прикрепится к вашему запросу автоматически.
Но главная фишка тут даже в шорткате, а в быстрых командах. Вы можете создать сколько угодно кастомных команд, которые будут отправлять заранее заготовленные вами промпты. То есть, например, если мне нужно вежливо ответить кому-то в LinkedIn, что меня не интересует их предложение - я выделяю текст, жму 2 кнопки и ответ готов. И таких промптов у меня куча. Еще можно сравнивать ответы разных моделей в этом же окне.
Другой плюс этой программы состоит в том, что она может вам нормально так экономить деньги. Вместо подписки вы можете просто перейти на использование API и не платить по 20 баксов за ChatGPT, Gemini, Claude, а использовать их все, оплачивая только фактически потраченные токены.
В общем, инструмент очень рекомендую.
👍5🔥5❤2
Помощник для художника — как мы внедряли ИИ в генерацию иллюстраций в Skyeng
Производство контента — ключевая область применения ИИ в образовании.
Логика проста:
- Привлечение клиентов требует доказательства результативности
- Результат зависит от качества усвоения контента
- Качество, в свою очередь, зависит от персонализации
Разнообразие пользовательских предпочтений требует увеличения объема контента. Сегодня открываю цикл кейсов о том, как мы оптимизировали этот процесс в Skyeng 🚀
Проблема
Иллюстрации критически важны при изучении языка: улучшают читаемость уроков и необходимы для упражнений ("опиши картинку", "соедини с словом"). Каждому уроку требовалось множество изображений в фирменном стиле. Все это создавало огромную нагрузку на иллюстраторов. Стоковые изображения не подходили — нужны были оригинальные работы в фирменной стилистике компании. Цикл создания одного урока растягивался на дни: множество вариантов, согласования с иллюстраторами и методистами.
Решение
У компании уже была обширная база готовых иллюстраций с текстовыми описаниями. Мы задались вопросом: почему бы не дообучить модель text2image и не автоматизировать этот процесс?
Иллюстраторы изначально восприняли идею негативно, почувствовав угрозу своей работе. Поэтому наш проект начался с того, что мы убедили команду: никто не будет уволен, наоборот — мы ускорим их работу.
Не углубляясь в детали процесса, мы пришли к следующей логике:
В ходе разработки мы провели серию экспериментов для выбора лучшей исходной модели для файнтюнинга. После предварительного исследования выбор сводился к версии Stable Diffusion. Для этого мы выполнили несколько тестов:
Далее мы проходили через несколько этапов дообучения и обратной связи с периодичностью примерно в месяц. Модель вошла в активное использование спустя 3 месяца с начала проекта, а дальнейшая доработка продолжилась уже после моего ухода из компании.
Эффект
Оптимизация иллюстраций была лишь одной из частей общего процесса улучшения производства контента. Поэтому глобальный эффект требовал более длительного периода наблюдения, чем мой срок работы в компании. Тем не менее, еще при мне мы достигли следующих результатов:
👉 Время создания иллюстраций для одного урока сократилось с 3 дней до 4 часов
👉 Полностью устранен дефицит изображений на одном из востребованных направлений
В рамках одного поста сложно охватить все нюансы данного кейса, поэтому задавайте интересующие вас вопросы в комментариях. Я либо отвечу там, либо подготовлю отдельный подробный пост как вторую часть. Есть идея дополнительно рассказать о проблемах, с которыми мы столкнулись, например, при генерации людей модель игнорировала стили и генерировала казахов 😁
Также прикладываю пару изображений с очень ранних стадий разработки(многие из них ужасны) . Здесь есть я и пара известных персонажей. Узнали?
#кейсы
Производство контента — ключевая область применения ИИ в образовании.
Логика проста:
- Привлечение клиентов требует доказательства результативности
- Результат зависит от качества усвоения контента
- Качество, в свою очередь, зависит от персонализации
Разнообразие пользовательских предпочтений требует увеличения объема контента. Сегодня открываю цикл кейсов о том, как мы оптимизировали этот процесс в Skyeng 🚀
Проблема
Иллюстрации критически важны при изучении языка: улучшают читаемость уроков и необходимы для упражнений ("опиши картинку", "соедини с словом"). Каждому уроку требовалось множество изображений в фирменном стиле. Все это создавало огромную нагрузку на иллюстраторов. Стоковые изображения не подходили — нужны были оригинальные работы в фирменной стилистике компании. Цикл создания одного урока растягивался на дни: множество вариантов, согласования с иллюстраторами и методистами.
Решение
У компании уже была обширная база готовых иллюстраций с текстовыми описаниями. Мы задались вопросом: почему бы не дообучить модель text2image и не автоматизировать этот процесс?
Иллюстраторы изначально восприняли идею негативно, почувствовав угрозу своей работе. Поэтому наш проект начался с того, что мы убедили команду: никто не будет уволен, наоборот — мы ускорим их работу.
Не углубляясь в детали процесса, мы пришли к следующей логике:
1. Создаем инструмент, а не замену иллюстраторов
2. С его помощью они генерируют черновые варианты картинок
3. Эти варианты отправляются на одобрение методистам
4. Затем иллюстраторы дорабатывают ИИ-картинки вручную
В ходе разработки мы провели серию экспериментов для выбора лучшей исходной модели для файнтюнинга. После предварительного исследования выбор сводился к версии Stable Diffusion. Для этого мы выполнили несколько тестов:
1. Использовали необученные модели с промптами для генерации нужных картинок (без нашего стиля)
2. Попросили иллюстраторов оценить результаты
3. Две лучшие модели прошли небольшой цикл дообучения, и мы повторили эксперимент с генерацией в нашем стиле
4. Модель, получившая больше голосов (SD версии 1.4), была выбрана для дальнейшего обучения
Далее мы проходили через несколько этапов дообучения и обратной связи с периодичностью примерно в месяц. Модель вошла в активное использование спустя 3 месяца с начала проекта, а дальнейшая доработка продолжилась уже после моего ухода из компании.
Эффект
Оптимизация иллюстраций была лишь одной из частей общего процесса улучшения производства контента. Поэтому глобальный эффект требовал более длительного периода наблюдения, чем мой срок работы в компании. Тем не менее, еще при мне мы достигли следующих результатов:
👉 Время создания иллюстраций для одного урока сократилось с 3 дней до 4 часов
👉 Полностью устранен дефицит изображений на одном из востребованных направлений
В рамках одного поста сложно охватить все нюансы данного кейса, поэтому задавайте интересующие вас вопросы в комментариях. Я либо отвечу там, либо подготовлю отдельный подробный пост как вторую часть. Есть идея дополнительно рассказать о проблемах, с которыми мы столкнулись, например, при генерации людей модель игнорировала стили и генерировала казахов 😁
Также прикладываю пару изображений с очень ранних стадий разработки
#кейсы
🔥5
Google переносят функции из NotebookLM в Gemini и добавляют Canvas!
Google штампуют инфоповоды как из пулемета, но про эту новость не могу не написать.
NotebookLM - это один из моих любимейших AI-продуктов: незаменимый компаньон в производстве контента, исследованиях и учебе. Если вы еще не пробовали его - настоятельно рекомендую это сделать.
Одной из самых полезных лично для меня функций, которая наделала шума, является генерация Audio Overview: когда закидываешь в свою тетрадку кучу документов, видео и другой информации, ИИ анализирует ее, находит пересечения и формирует из этого всего подскаст. Я люблю себе включать что-то во время тренировок либо готовки, чтобы получить двойную пользу. Единственный минус - пока работает только на английском.
Так вот: теперь эту функцию добавили в веб-версию Gemini. Самое крутое здесь то, что подкаст можно создать на основе отчета, сделанного с помощью функции Deep Research. То есть флоу поглощения новой информации теперь максимально автоматизирован:
Ну классно же!
Второе важное изменение - наконец-то добавили Canvas для коллаборативной работы с Gemini. Не понимаю, почему им понадобилось на это столько времени, когда OpenAI и Anthropic уже давно используют эту функцию во всю. Сделать ее максимально просто, а удобство возрастает в РАЗЫ. Для тех, кто работает с текстами или кодом - штука незаменимая.
Google штампуют инфоповоды как из пулемета, но про эту новость не могу не написать.
NotebookLM - это один из моих любимейших AI-продуктов: незаменимый компаньон в производстве контента, исследованиях и учебе. Если вы еще не пробовали его - настоятельно рекомендую это сделать.
Одной из самых полезных лично для меня функций, которая наделала шума, является генерация Audio Overview: когда закидываешь в свою тетрадку кучу документов, видео и другой информации, ИИ анализирует ее, находит пересечения и формирует из этого всего подскаст. Я люблю себе включать что-то во время тренировок либо готовки, чтобы получить двойную пользу. Единственный минус - пока работает только на английском.
Так вот: теперь эту функцию добавили в веб-версию Gemini. Самое крутое здесь то, что подкаст можно создать на основе отчета, сделанного с помощью функции Deep Research. То есть флоу поглощения новой информации теперь максимально автоматизирован:
- активируешь Deep Research по интересующей тебя теме, уходишь заварить чаю
- через 3-5 минут получаешь детализированное исследование
- преобразуешь его в подкаст и слушаешь в удобное время
Ну классно же!
Второе важное изменение - наконец-то добавили Canvas для коллаборативной работы с Gemini. Не понимаю, почему им понадобилось на это столько времени, когда OpenAI и Anthropic уже давно используют эту функцию во всю. Сделать ее максимально просто, а удобство возрастает в РАЗЫ. Для тех, кто работает с текстами или кодом - штука незаменимая.
🔥7❤4👍3
Расцвет OpenSource моделей: почему нам всем это выгодно
Помните момент, когда Meta (запрещена в РФ) выбросила LLAMA в открытый доступ в 2023? На тот момент это было буквально землетрясение в мире ИИ! А в феврале этого года DeepSeek R-1 выстрелил настолько мощно, что вызвал новую волну на рынке OpenSource моделей.
И знаете что? Я аплодирую стоя! 👏
До недавнего времени Gemma 2 от Google держала пальму первенства среди открытых моделей малого размера, но настоящая сила ИИ оставалась запертой в сейфах FAANG-гигантов, OpenAI и Anthropic. Закрытый код, растущие цены, элитные уровни подписок - классическая история корпоративной эволюции.
Проработав в R&D-командах, я наблюдал эту трансформацию не раз: "Где деньги, Лебовски?" - неизбежный вопрос менеджмента и инвесторов. Ранее я уже писал о том, что инновации должны финансироваться отдельно от основного бизнеса. Потому что истинные инновации редко рождаются с прицелом на немедленную прибыль.
И вот тут на сцену врываются модели OpenSource!
Лишь за последнюю неделю мы увидели:
- Mistral Small - новый лидер для своего размера
- Gemma 3 - мультимодальная модель от Google, на которой, думаю, будет работать огромная куча чат-ботов
- Command A - уже не такая маленькая, но очень мощная модель от Cohere
А чуть раньше Alibaba выкатила QwQ и Qwen 2.5. Все эти модели имеют свои отличительные черты и юзкейсы, где работают лучше аналогов.
Что это меняет?
Представьте, что доступ к суперкомпьютерам внезапно получили не только миллиардеры в Кремниевой долине, но и талантливые исследователи со всего мира! Проект Sesame (используют токенизаторы llama, а в разговоре говорит, что у нее Gemma 27b под капотом) с их невероятно реалистичными голосами — яркий пример того, что происходит, когда мощные технологии выходят из-за корпоративных стен.
Для бизнеса это тоже золотая жила. Зависимость от API — всё равно что подключаться к чужому генератору во время энергокризиса: в любой момент хозяин может поднять цену или просто выключить рубильник. С OpenSource моделями вы становитесь хозяином положения, а ваши данные остаются только вашими. Кроме того, по мере роста бизнеса, держать свой сервер может быть НАМНОГО выгоднее оплаты за API: посмотрите как Perplexity используют DeepSeek R-1.
Я сам поймал себя на том, что всё чаще пользуюсь Ollama или LM Studio вместо API, из-за чего ловлю косые взгляды, мол: "Зачем возиться, когда есть готовые решения?”. Но когда работаешь с конфиденциальной информацией, локальная модель — как личный консультант, который никогда не проболтается.
А как вы относитесь к OpenSource-моделям? Пользуетесь ли сами? 🙂
#развитиеии
Помните момент, когда Meta (запрещена в РФ) выбросила LLAMA в открытый доступ в 2023? На тот момент это было буквально землетрясение в мире ИИ! А в феврале этого года DeepSeek R-1 выстрелил настолько мощно, что вызвал новую волну на рынке OpenSource моделей.
И знаете что? Я аплодирую стоя! 👏
До недавнего времени Gemma 2 от Google держала пальму первенства среди открытых моделей малого размера, но настоящая сила ИИ оставалась запертой в сейфах FAANG-гигантов, OpenAI и Anthropic. Закрытый код, растущие цены, элитные уровни подписок - классическая история корпоративной эволюции.
Проработав в R&D-командах, я наблюдал эту трансформацию не раз: "Где деньги, Лебовски?" - неизбежный вопрос менеджмента и инвесторов. Ранее я уже писал о том, что инновации должны финансироваться отдельно от основного бизнеса. Потому что истинные инновации редко рождаются с прицелом на немедленную прибыль.
И вот тут на сцену врываются модели OpenSource!
Лишь за последнюю неделю мы увидели:
- Mistral Small - новый лидер для своего размера
- Gemma 3 - мультимодальная модель от Google, на которой, думаю, будет работать огромная куча чат-ботов
- Command A - уже не такая маленькая, но очень мощная модель от Cohere
А чуть раньше Alibaba выкатила QwQ и Qwen 2.5. Все эти модели имеют свои отличительные черты и юзкейсы, где работают лучше аналогов.
Что это меняет?
Представьте, что доступ к суперкомпьютерам внезапно получили не только миллиардеры в Кремниевой долине, но и талантливые исследователи со всего мира! Проект Sesame (используют токенизаторы llama, а в разговоре говорит, что у нее Gemma 27b под капотом) с их невероятно реалистичными голосами — яркий пример того, что происходит, когда мощные технологии выходят из-за корпоративных стен.
Для бизнеса это тоже золотая жила. Зависимость от API — всё равно что подключаться к чужому генератору во время энергокризиса: в любой момент хозяин может поднять цену или просто выключить рубильник. С OpenSource моделями вы становитесь хозяином положения, а ваши данные остаются только вашими. Кроме того, по мере роста бизнеса, держать свой сервер может быть НАМНОГО выгоднее оплаты за API: посмотрите как Perplexity используют DeepSeek R-1.
Я сам поймал себя на том, что всё чаще пользуюсь Ollama или LM Studio вместо API, из-за чего ловлю косые взгляды, мол: "Зачем возиться, когда есть готовые решения?”. Но когда работаешь с конфиденциальной информацией, локальная модель — как личный консультант, который никогда не проболтается.
А как вы относитесь к OpenSource-моделям? Пользуетесь ли сами? 🙂
#развитиеии
Telegram
NGI | Влад Корнышев про AI и создание AI-продуктов
Инновации должны финансироваться отдельно от всего остального бизнеса
Это мое мнение. Сегодня организации чтобы выжить - должны инвестировать в инновации. Если не вкладываешься в них - умрешь. Это правило бизнеса. Невозможно делать одно и то же и все время…
Это мое мнение. Сегодня организации чтобы выжить - должны инвестировать в инновации. Если не вкладываешься в них - умрешь. Это правило бизнеса. Невозможно делать одно и то же и все время…
🔥6👍1
Рост возможностей ИИ по закону Мура: способность выполнять всё более длительные задачи
Все, кто интересуется технологиями, наверняка слышали о законе Мура. В течение многих лет он служил своего рода дорожной картой для развития компьютерной индустрии, предсказывая экспоненциальный рост вычислительных мощностей.
А что если подобный закон действует и для искусственного интеллекта?
Сегодня я наткнулся на интересное исследование, которое предлагает измерять прогресс ИИ не в привычных бенчмарках, а в терминах длительности задач, которые ИИ может самостоятельно выполнять. И результаты оказались поразительными!
Что измеряли исследователи
Исследователи предложили оценивать возможности ИИ по длительности задач, которые он может успешно выполнить. Длительность измеряется временем, которое затрачивают профессионалы-люди на выполнение тех же задач.
Результаты поразительны: длительность задач, которые передовые модели ИИ могут выполнить автономно с 50% надежностью, удваивается примерно каждые 7 месяцев на протяжении последних 6 лет.
Текущие возможности ИИ
Сегодняшние передовые системы ИИ:
- Практически со 100% вероятностью справляются с задачами, на которые эксперты-люди тратят менее 4 минут
- Успешно выполняют задачи длительностью до часа с вероятностью около 50%
- Справляются с задачами длительностью более 4 часов менее чем в 10% случаев
Это помогает понять кажущееся противоречие: ИИ демонстрирует сверхчеловеческие результаты на многих тестах, но при этом не может надежно автоматизировать длительные задачи людей.
Прогнозы на будущее
Если текущая экспоненциальная тенденция сохранится:
- Через 2-4 года ИИ сможет самостоятельно выполнять широкий спектр недельных задач
- К концу текущего десятилетия ИИ сможет автономно выполнять месячные проекты
Характерно, что эти прогнозы достаточно устойчивы: даже если абсолютные измерения ошибочны в 10 раз, это меняет время достижения соответствующих возможностей всего на 2 года.
Последствия для общества
Экспоненциальный рост возможностей ИИ несет огромные ставки:
- Системы ИИ, способные автономно выполнять длительные задачи, могут принести колоссальную пользу различным областям
- В то же время, такие возможности создают новые риски и вызовы
Исследователи открыли исходный код своей инфраструктуры, данных и анализа, чтобы способствовать дальнейшему развитию этого направления исследований.
И что с этого?
Хотя методология исследования имеет ограничения, общая тенденция представляется корректной: скорость роста составляет примерно 1-4 удвоения в год. Это обеспечивает новый, более конкретный способ прогнозирования будущих возможностей ИИ и их влияния на реальный мир.
Если вы интересуетесь развитием искусственного интеллекта, это исследование предлагает важную и относительно надежную метрику для отслеживания прогресса в ближайшие годы.
Что вы думаете об этом? Верите ли вы в "закон Мура" для ИИ? Какие видите возможности и риски? Давайте обсудим в комментариях!
#развитиеии
Все, кто интересуется технологиями, наверняка слышали о законе Мура. В течение многих лет он служил своего рода дорожной картой для развития компьютерной индустрии, предсказывая экспоненциальный рост вычислительных мощностей.
А что если подобный закон действует и для искусственного интеллекта?
Сегодня я наткнулся на интересное исследование, которое предлагает измерять прогресс ИИ не в привычных бенчмарках, а в терминах длительности задач, которые ИИ может самостоятельно выполнять. И результаты оказались поразительными!
Что измеряли исследователи
Исследователи предложили оценивать возможности ИИ по длительности задач, которые он может успешно выполнить. Длительность измеряется временем, которое затрачивают профессионалы-люди на выполнение тех же задач.
Результаты поразительны: длительность задач, которые передовые модели ИИ могут выполнить автономно с 50% надежностью, удваивается примерно каждые 7 месяцев на протяжении последних 6 лет.
Текущие возможности ИИ
Сегодняшние передовые системы ИИ:
- Практически со 100% вероятностью справляются с задачами, на которые эксперты-люди тратят менее 4 минут
- Успешно выполняют задачи длительностью до часа с вероятностью около 50%
- Справляются с задачами длительностью более 4 часов менее чем в 10% случаев
Это помогает понять кажущееся противоречие: ИИ демонстрирует сверхчеловеческие результаты на многих тестах, но при этом не может надежно автоматизировать длительные задачи людей.
Прогнозы на будущее
Если текущая экспоненциальная тенденция сохранится:
- Через 2-4 года ИИ сможет самостоятельно выполнять широкий спектр недельных задач
- К концу текущего десятилетия ИИ сможет автономно выполнять месячные проекты
Характерно, что эти прогнозы достаточно устойчивы: даже если абсолютные измерения ошибочны в 10 раз, это меняет время достижения соответствующих возможностей всего на 2 года.
Последствия для общества
Экспоненциальный рост возможностей ИИ несет огромные ставки:
- Системы ИИ, способные автономно выполнять длительные задачи, могут принести колоссальную пользу различным областям
- В то же время, такие возможности создают новые риски и вызовы
Исследователи открыли исходный код своей инфраструктуры, данных и анализа, чтобы способствовать дальнейшему развитию этого направления исследований.
И что с этого?
Хотя методология исследования имеет ограничения, общая тенденция представляется корректной: скорость роста составляет примерно 1-4 удвоения в год. Это обеспечивает новый, более конкретный способ прогнозирования будущих возможностей ИИ и их влияния на реальный мир.
Если вы интересуетесь развитием искусственного интеллекта, это исследование предлагает важную и относительно надежную метрику для отслеживания прогресса в ближайшие годы.
Что вы думаете об этом? Верите ли вы в "закон Мура" для ИИ? Какие видите возможности и риски? Давайте обсудим в комментариях!
#развитиеии
👍9🔥3
Где учиться AI?
С тех пор как я начал активно вести соцсети, ко мне часто стали приходить люди с вопросами о том, где и что надо изучать, чтобы работать в AI. Причем, что интересно, это были не только начинающие, но и те, кто уже работают с ИИ, и это неудивительно.
ИИ-сфера настолько динамична, что появляется страх что-то упустить и стать неактуальным. Я решил сделать этот пост, чтобы направлять сюда всех, кто интересуется темой обучения в сфере AI.
📌 У меня есть свой подход к обучению, я считаю, что любое обучение строится на трех столпах:
1. Базовые и исторические знания в своей области - они дают широту кругозора и позволяют хорошо ориентироваться на дистанции. Здесь как со знанием истории. Если у человека нет базы, им легко манипулировать, рассказывая сказки про печенегов.
2. Методология - это знания о методах и инструментах, которые применяются в профессии каждый день. Как правило, они долго не устаревают, а на образование новой парадигмы нужно время. Для продакта это основы менеджмента, различные фреймворки вроде JTBD и т. д. Для инженеров - основы программирования на их языке.
3. Знания в моменте - это знания под конкретный проект или задачу, которые нужны нам здесь и сейчас, они могут устареть через год, но в конкретный момент решают нашу задачу.
🙋🏻♂️ Если вы продакт
Для освоения базы и методологии лучше всего подойдут книги и программы от университетов + курсы от практикующих специалистов в вашей сфере. Вы работаете с людьми, а теории мотивации, методы исследований и прочее обновляются не так быстро, как технологии. Занятия с практиками помогут вам связать теорию с реальными задачами.
- По университетам я могу точно советовать свою программу в МГУ (веду переговоры, чтобы читать там модуль про ИИ). Если зарубежка - ищите программы, где при факультете есть акселератор или бизнес-инкубатор. Также рекомендую посмотреть в сторону Executive-образования. Лично я сейчас откладываю на пару программ MIT.
- Онлайн-курсы - Pearson оплачивал мне лайв-курсы от Reforge, круто, но дорого. Из практиков единственный, кого могу прямо порекомендовать, Ваня Замесин. Всякие курсы Go Practice, Product Star категорически не советую, они хороши только как “база знаний”.
- Из книг база - Inspired Марти Кагана, Основы Менеджмента А. Мескона + я регулярно публикую у себя подборки по хештегу #книги
Знания в моменте. Здесь на помощь снова придут книги, обучение в коллективе, самостоятельное обучение через опыт, менторинг с более опытным коллегой, “живые” когорты онлайн-курсов. Предзаписанные курсы точно не советую, они либо устаревают, либо дают что-то слишком банальное. Также категорически не рекомендую брать курсы от “экспертов по маркетингу”. Ребята умеют продавать, но за тему не шарят. У таких курсов в программе будут всякие “автокастдевы с помощью ИИ” и прочее барахло.
👨🏻💻Если вы технический специалист
Большинство университетов не успевают делать нормальные программы, поэтому здесь для базы я бы рекомендовал взять курсы по Python от кого-то из эдтехов (мне компания оплачивала SkyPro, медленно изучаю). Они постоянно обновляются, чтобы быть конкурентными, и вы сразу учитесь на практике. Либо, если вам позволяют ресурсы, поступайте в крутой универ со своей лабораторией типа Stanford или MIT.
Помимо основ, вам помогут профильные курсы. По ML многие советовали мне вот этот курс. Из крутых спецов очень рекомендую Виктора Кантора. Практику можно получать, решая задачи на Kaggle. Если хорошо будете решать задачки, можете попутно поднять денег или получить оффер. К тому моменту, как вы это все изучите, вы уже выберете себе направление в AI, коих бесчисленно: NLP, Computer vision и т. д. Дальше обучение нужно будет продолжать исходя из этого выбора. Ну и, конечно, никуда не уходят книги.
Знания в моменте. Хакатоны, менторинг от коллег, снова Kaggle и другие комьюнити. Вообще, чем я завидую техническим специалистам, так это тем, что у них есть такие штуки.
Хочется сделать этот пост еще полезнее, поэтому если у вас есть книги и бесплатные ресурсы по ИИ, которые помогли вам - делитесь в комментариях!
#обучающиематериалы
С тех пор как я начал активно вести соцсети, ко мне часто стали приходить люди с вопросами о том, где и что надо изучать, чтобы работать в AI. Причем, что интересно, это были не только начинающие, но и те, кто уже работают с ИИ, и это неудивительно.
ИИ-сфера настолько динамична, что появляется страх что-то упустить и стать неактуальным. Я решил сделать этот пост, чтобы направлять сюда всех, кто интересуется темой обучения в сфере AI.
📌 У меня есть свой подход к обучению, я считаю, что любое обучение строится на трех столпах:
1. Базовые и исторические знания в своей области - они дают широту кругозора и позволяют хорошо ориентироваться на дистанции. Здесь как со знанием истории. Если у человека нет базы, им легко манипулировать, рассказывая сказки про печенегов.
2. Методология - это знания о методах и инструментах, которые применяются в профессии каждый день. Как правило, они долго не устаревают, а на образование новой парадигмы нужно время. Для продакта это основы менеджмента, различные фреймворки вроде JTBD и т. д. Для инженеров - основы программирования на их языке.
3. Знания в моменте - это знания под конкретный проект или задачу, которые нужны нам здесь и сейчас, они могут устареть через год, но в конкретный момент решают нашу задачу.
🙋🏻♂️ Если вы продакт
Для освоения базы и методологии лучше всего подойдут книги и программы от университетов + курсы от практикующих специалистов в вашей сфере. Вы работаете с людьми, а теории мотивации, методы исследований и прочее обновляются не так быстро, как технологии. Занятия с практиками помогут вам связать теорию с реальными задачами.
- По университетам я могу точно советовать свою программу в МГУ (веду переговоры, чтобы читать там модуль про ИИ). Если зарубежка - ищите программы, где при факультете есть акселератор или бизнес-инкубатор. Также рекомендую посмотреть в сторону Executive-образования. Лично я сейчас откладываю на пару программ MIT.
- Онлайн-курсы - Pearson оплачивал мне лайв-курсы от Reforge, круто, но дорого. Из практиков единственный, кого могу прямо порекомендовать, Ваня Замесин. Всякие курсы Go Practice, Product Star категорически не советую, они хороши только как “база знаний”.
- Из книг база - Inspired Марти Кагана, Основы Менеджмента А. Мескона + я регулярно публикую у себя подборки по хештегу #книги
Знания в моменте. Здесь на помощь снова придут книги, обучение в коллективе, самостоятельное обучение через опыт, менторинг с более опытным коллегой, “живые” когорты онлайн-курсов. Предзаписанные курсы точно не советую, они либо устаревают, либо дают что-то слишком банальное. Также категорически не рекомендую брать курсы от “экспертов по маркетингу”. Ребята умеют продавать, но за тему не шарят. У таких курсов в программе будут всякие “автокастдевы с помощью ИИ” и прочее барахло.
👨🏻💻Если вы технический специалист
Большинство университетов не успевают делать нормальные программы, поэтому здесь для базы я бы рекомендовал взять курсы по Python от кого-то из эдтехов (мне компания оплачивала SkyPro, медленно изучаю). Они постоянно обновляются, чтобы быть конкурентными, и вы сразу учитесь на практике. Либо, если вам позволяют ресурсы, поступайте в крутой универ со своей лабораторией типа Stanford или MIT.
Помимо основ, вам помогут профильные курсы. По ML многие советовали мне вот этот курс. Из крутых спецов очень рекомендую Виктора Кантора. Практику можно получать, решая задачи на Kaggle. Если хорошо будете решать задачки, можете попутно поднять денег или получить оффер. К тому моменту, как вы это все изучите, вы уже выберете себе направление в AI, коих бесчисленно: NLP, Computer vision и т. д. Дальше обучение нужно будет продолжать исходя из этого выбора. Ну и, конечно, никуда не уходят книги.
Знания в моменте. Хакатоны, менторинг от коллег, снова Kaggle и другие комьюнити. Вообще, чем я завидую техническим специалистам, так это тем, что у них есть такие штуки.
Хочется сделать этот пост еще полезнее, поэтому если у вас есть книги и бесплатные ресурсы по ИИ, которые помогли вам - делитесь в комментариях!
#обучающиематериалы
❤16👍3
Эфир: ИИ-тренды 2025-2026. Как действовать бизнесу и специалистам в эпоху ИИ-хайпа
Хочу сделать традицией проведение открытых эфиров в канале. Предыдущий был про AI в медицине, а неделю назад я выступал инициатором и спикером на секции про делегирование задач ИИ. Настало время для нового мероприятия!
📆 24 марта, понедельник, 19:00 по Москве проведу открытый эфир по ИИ-трендам и практическому применению технологий. Эфир пройдет здесь в Telegram
За последний год количество упоминаний AI-инструментов и AI-интеграций просто зашкаливает. Все это создает нереальный информационный шум: за заголовками, бенчмарками и обещаниями ИИ-интеграторов понять самому, что делать и куда идти - практически невозможно. В своей работе я постоянно тестирую новые решения и вижу огромный разрыв между хайпом и реальной пользой.
Решил поделиться практическими наблюдениями о том, что происходит в индустрии прямо сейчас и чего ожидать в ближайшие пару лет. Это не теоретические рассуждения — только то, что я вижу в реальных проектах.
🚀 На эфире разберем:
• Навыки будущего - что развивать в себе, чтобы оставаться востребованным в ближайшие 5-10 лет.
• ИИ-агенты и их практическое применение - куда движется технология автономных ИИ и где они уже приносят реальную пользу. Поговорим про реальный агентский ИИ, а не n8n автоматизации.
• Тренды в мире Open Source AI - как развивается демократизация ИИ и какие модели действительно заслуживают внимания.
• Влияние ИИ на рынок труда - какие профессии трансформируются быстрее всего и где автоматизация уже реальность. Обсудим кого заменит ИИ и стоит ли бояться программистам.
Так как хочу сделать встречу максимально полезной, оставляю форму для сбора ваших вопросов, на которые отвечу в конце эфира.
👉🏻 Задать вопрос можно тут
Если нужно приглашения в календарь - там есть форма, где можно оставить почту, я пришлю вам инвайт
Бронируйте время в календаре! Участие бесплатное. Запись эфира будет, но живое общение, как обычно, ценнее.
Хочу сделать традицией проведение открытых эфиров в канале. Предыдущий был про AI в медицине, а неделю назад я выступал инициатором и спикером на секции про делегирование задач ИИ. Настало время для нового мероприятия!
📆 24 марта, понедельник, 19:00 по Москве проведу открытый эфир по ИИ-трендам и практическому применению технологий. Эфир пройдет здесь в Telegram
За последний год количество упоминаний AI-инструментов и AI-интеграций просто зашкаливает. Все это создает нереальный информационный шум: за заголовками, бенчмарками и обещаниями ИИ-интеграторов понять самому, что делать и куда идти - практически невозможно. В своей работе я постоянно тестирую новые решения и вижу огромный разрыв между хайпом и реальной пользой.
Решил поделиться практическими наблюдениями о том, что происходит в индустрии прямо сейчас и чего ожидать в ближайшие пару лет. Это не теоретические рассуждения — только то, что я вижу в реальных проектах.
• Навыки будущего - что развивать в себе, чтобы оставаться востребованным в ближайшие 5-10 лет.
• ИИ-агенты и их практическое применение - куда движется технология автономных ИИ и где они уже приносят реальную пользу. Поговорим про реальный агентский ИИ, а не n8n автоматизации.
• Тренды в мире Open Source AI - как развивается демократизация ИИ и какие модели действительно заслуживают внимания.
• Влияние ИИ на рынок труда - какие профессии трансформируются быстрее всего и где автоматизация уже реальность. Обсудим кого заменит ИИ и стоит ли бояться программистам.
Так как хочу сделать встречу максимально полезной, оставляю форму для сбора ваших вопросов, на которые отвечу в конце эфира.
👉🏻 Задать вопрос можно тут
Если нужно приглашения в календарь - там есть форма, где можно оставить почту, я пришлю вам инвайт
Бронируйте время в календаре! Участие бесплатное. Запись эфира будет, но живое общение, как обычно, ценнее.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
NGI | Влад Корнышев про AI и создание AI-продуктов
Запись лекции по AI в медицине уже доступна
Друзья, спасибо тем, кто пришел сегодня на лекцию. Рад был провести ее и ответить на вопросы.
Запись уже доступна по ссылке.
Материалы, которые упоминал:
Сайт Perceptive
Сервисы для медицинских заметок: Heidi…
Друзья, спасибо тем, кто пришел сегодня на лекцию. Рад был провести ее и ответить на вопросы.
Запись уже доступна по ссылке.
Материалы, которые упоминал:
Сайт Perceptive
Сервисы для медицинских заметок: Heidi…
🔥11