Veo 3: мой опыт
Наверно, все уже видели огромное количество роликов, сгенерированных в этой нейросети. Их так много, что Google начал пессимизировать ИИ-контент на YouTube, чтобы вся площадка не превратилась в сборник юмористических сгенерированных роликов про бабушек, у которых дома живет бегемот.
Но одно дело 100 раз увидеть готовый контент, а другое — попробовать продукт самому. Вот о моем небольшом опыте и поговорим.
Сразу озвучу три основных тезиса:
- Veo 3 – лучшая нейросеть для генерации видео на сегодняшний день, и обходит ближайших конкурентов (KlingAI и Hedra) на пару шагов;
- Дорогая. Адекватный пакет стоит 200$ в месяц (130$, если покупаешь на год). За эти деньги получаешь ограниченное количество генераций;
- Классные ролики, которые мы видим в интернете, – большая работа как в самой нейросети: промптинг, итерации, обход ограничений, так и в постпродакшене: добавление звуков, текста, эффектов, да и просто монтаж.
Мои видео получились не идеальными. Но это и хорошо: говорить об ограничениях нейросетей не менее интересно, чем об их возможностях.
Первая генерация была самой интересной: загрузил фотографию с Elements 2025 и решил оживить ее простым промптом: «Мужчина достает геймпад и начинает играть в гонки на огромном экране».
Опыт показал: качество и детализация промпта в генерации видео играет еще большую роль, чем при генерации изображений и простых текстов. Так как это не просто изображение, а небольшой сюжет, – поле для фантазий у ИИ огромное. Нужно детально прописывать все, что ты хочешь видеть: начиная от мимики и жестов, заканчивая полным описанием мельчайших действий и звуков.
Veo сама «считала сюжет» фотографии, предположила, что идет какое-то выступление с презентаций, и, что логично, спикер должен озвучивать тезисы со слайдов. Озвучила хорошо, липсинк тоже на высоте.
Но «предположить» нейросеть может не все. Например, когда ты в одной руке держишь кликер, а в другой микрофон, то, чтобы достать геймпад, – тебе нужно куда-то положить то, что у тебя в руках. Вот такие мелочи нужно прописывать в промпте. В начале положил кликер и микрофон на стол – потом достал геймпад.
Звук игры нейросеть добавила самостоятельно, а вот добавить звуки зала не догадалась – опять же возвращаемся к необходимости прописывать детали в промпте или добавлять их на постпродакшене.
Так же видео наглядно показывает слабые места нейросети – сильно вращать глазами и головой не следует: появляются артефакты, да и просто лицо меняется.
Второй интересный опыт – анимация логотипа. Здесь я дал нейросети свободу действий и попросил анимировать логотип как у киностудий (без конкретики). Не знаю уж, насколько результат «как у киностудий», но сама анимация выглядит логично. Однозначно уже сейчас можно использовать в e-learning и делать графики, схемы и другие поясняющие элементы видео более живыми и привлекательными буквально за минуту.
Прочие наблюдения:
- Русскую речь генерирует хорошо, но делает это не всегда. Зачастую просто получаешь видео вообще без звука (около 30% генераций русской речи проходят удачно);
- Есть шаблонные действия, которые нейросеть генерирует отлично. Например, прогулки по оживленным улицам, поездки на машине по живописным местам, переходы камеры на красивых локациях и прочие футажи (сразу понятно, на каком контенте преимущественно обучалась нейросеть).
- Veo все еще борется с физикой и логикой. Предметы могут появляться и исчезать из ниоткуда, тени иногда ложатся нелогично, а взаимодействие между объектами часто выглядит как глюк. Проблемы решаются подробным промптингом и итерациями.
Как итог:
Пока о создании голливудского блокбастера в один клик речь не идет, но вот по качеству видео и «актерской игре» Veo 3 уже уверенно обходит сериалы в духе «Простушка Клава из деревни н. Лопухи приезжает в Москву, где становится уборщицей у миллионера, с которым встречается лицемерная Анжела из-за его денег и строит Клаве козни».
Veo 3 — это не «нажал кнопку — получил шедевр». Это сложный инструмент, требующий навыков и насмотренности.
Наверно, все уже видели огромное количество роликов, сгенерированных в этой нейросети. Их так много, что Google начал пессимизировать ИИ-контент на YouTube, чтобы вся площадка не превратилась в сборник юмористических сгенерированных роликов про бабушек, у которых дома живет бегемот.
Но одно дело 100 раз увидеть готовый контент, а другое — попробовать продукт самому. Вот о моем небольшом опыте и поговорим.
Сразу озвучу три основных тезиса:
- Veo 3 – лучшая нейросеть для генерации видео на сегодняшний день, и обходит ближайших конкурентов (KlingAI и Hedra) на пару шагов;
- Дорогая. Адекватный пакет стоит 200$ в месяц (130$, если покупаешь на год). За эти деньги получаешь ограниченное количество генераций;
- Классные ролики, которые мы видим в интернете, – большая работа как в самой нейросети: промптинг, итерации, обход ограничений, так и в постпродакшене: добавление звуков, текста, эффектов, да и просто монтаж.
Мои видео получились не идеальными. Но это и хорошо: говорить об ограничениях нейросетей не менее интересно, чем об их возможностях.
Первая генерация была самой интересной: загрузил фотографию с Elements 2025 и решил оживить ее простым промптом: «Мужчина достает геймпад и начинает играть в гонки на огромном экране».
Опыт показал: качество и детализация промпта в генерации видео играет еще большую роль, чем при генерации изображений и простых текстов. Так как это не просто изображение, а небольшой сюжет, – поле для фантазий у ИИ огромное. Нужно детально прописывать все, что ты хочешь видеть: начиная от мимики и жестов, заканчивая полным описанием мельчайших действий и звуков.
Veo сама «считала сюжет» фотографии, предположила, что идет какое-то выступление с презентаций, и, что логично, спикер должен озвучивать тезисы со слайдов. Озвучила хорошо, липсинк тоже на высоте.
Но «предположить» нейросеть может не все. Например, когда ты в одной руке держишь кликер, а в другой микрофон, то, чтобы достать геймпад, – тебе нужно куда-то положить то, что у тебя в руках. Вот такие мелочи нужно прописывать в промпте. В начале положил кликер и микрофон на стол – потом достал геймпад.
Звук игры нейросеть добавила самостоятельно, а вот добавить звуки зала не догадалась – опять же возвращаемся к необходимости прописывать детали в промпте или добавлять их на постпродакшене.
Так же видео наглядно показывает слабые места нейросети – сильно вращать глазами и головой не следует: появляются артефакты, да и просто лицо меняется.
Второй интересный опыт – анимация логотипа. Здесь я дал нейросети свободу действий и попросил анимировать логотип как у киностудий (без конкретики). Не знаю уж, насколько результат «как у киностудий», но сама анимация выглядит логично. Однозначно уже сейчас можно использовать в e-learning и делать графики, схемы и другие поясняющие элементы видео более живыми и привлекательными буквально за минуту.
Прочие наблюдения:
- Русскую речь генерирует хорошо, но делает это не всегда. Зачастую просто получаешь видео вообще без звука (около 30% генераций русской речи проходят удачно);
- Есть шаблонные действия, которые нейросеть генерирует отлично. Например, прогулки по оживленным улицам, поездки на машине по живописным местам, переходы камеры на красивых локациях и прочие футажи (сразу понятно, на каком контенте преимущественно обучалась нейросеть).
- Veo все еще борется с физикой и логикой. Предметы могут появляться и исчезать из ниоткуда, тени иногда ложатся нелогично, а взаимодействие между объектами часто выглядит как глюк. Проблемы решаются подробным промптингом и итерациями.
Как итог:
Пока о создании голливудского блокбастера в один клик речь не идет, но вот по качеству видео и «актерской игре» Veo 3 уже уверенно обходит сериалы в духе «Простушка Клава из деревни н. Лопухи приезжает в Москву, где становится уборщицей у миллионера, с которым встречается лицемерная Анжела из-за его денег и строит Клаве козни».
Veo 3 — это не «нажал кнопку — получил шедевр». Это сложный инструмент, требующий навыков и насмотренности.
❤10👍10🔥5
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
ИИгры: а что там с ИИ в геймдеве?
Если мы хотим понять будущее технологий, стоит смотреть не только вперед, но и по сторонам. Инновации из геймдева — механики вовлечения, симуляции, интерактивные сценарии — давно и успешно перекочевали в e-learning.
Давайте посмотрим, как игроделы используют языковые модели в своих продуктах.
1. Социальные симуляторы и «живые» миры
ИИ оживляет целые сообщества NPC, с которыми можно взаимодействовать.
- Vaudeville: Детективная игра, в которой вы расследуете убийства, общаясь с персонажами через голос или текст. Диалоги генерируются в реальном времени, делая каждое прохождение уникальным. Уже в раннем доступе на Steam.
- Ememe: Симулятор жизни с ИИ-персонажами, напоминающий «Шоу Трумана» в цифровом мире. Вы создаете и наблюдаете за их автономной жизнью в виртуальном городке. NPC общаются, строят отношения и принимают решения на основе своих характеров. Поддерживается загрузка собственных 3D-моделей.
- NVIDIA ACE inZOI: Технологическая демонстрация от NVIDIA. Их технология ACE создает автономных персонажей, которые способны воспринимать окружение, общаться с игроком и друг с другом и принимать решения на основе своих целей и воспоминаний.
- Город с ИИ-прохожими: Пока это просто отдельная игровая механика, а не полноценная игра, но она отлично иллюстрирует вектор развития. Представьте себе виртуальный город, где вы можете подойти к любому прохожему и завести осмысленный разговор на любую тему. Каждый NPC обладает своей уникальной личностью, памятью и мнением, генерируемыми ИИ в режиме реального времени. Это следующий шаг к созданию по-настоящему живых, «дышащих» игровых вселенных.
2. Иммерсивные механики
Отдельные механики, показывающие, как ИИ может углубить погружение.
- Stellar Cafe: VR-игра для Meta Quest 3, где ИИ-роботы с поддержкой LLM ведут живые, открытые диалоги, запоминают игроков и реагируют на команды на естественном языке.
- RPG с ИИ-NPC: Пока концепт, а не готовый продукт. Представьте себе Skyrim, где каждый персонаж не заученно повторяет фразы, а может поддержать полноценный разговор на любую тему и динамически реагировать на ваши действия. Звучит фантастически, но работы в этом направлении уже ведутся.
3. Сгенерированные приключения
Здесь ИИ выступает в роли ведущего или соавтора истории, создавая уникальный сюжет каждый раз.
- AI Dungeon: Классика жанра. Текстовое D&D-приключение, где ИИ — это ваш личный мастер игры. Вы можете делать практически все что угодно, а нейросеть в реальном времени генерирует мир и реакции на ваши действия. Полная свобода в жанрах фэнтези, научной фантастики или хоррора.
- Hidden Door: Нарративная ролевая платформа, где игроки вместе с LLM создают миры и истории в стиле настольных RPG. Сценарий развивается динамически, а персонажи «живут» за счёт генеративного ИИ.
4. На стыке геймдева и обучения
- Gandalf Game: Остроумный игровой взгляд на prompt-инжиниринг. Ваша цель — заставить Гендальфа (роль которого играет ИИ) раскрыть секретный пароль. Игра состоит из 7 уровней сложности, на каждом из которых обойти защиту ИИ становится все сложнее. Отличный способ научиться формулировать запросы!
Как видно, пока это в основном эксперименты, концепты или отдельные игровые механики (не буду врать, ожидал что геймдев намного активнее возьмется за технологию). Но именно в них кроется главная ценность — смелые идеи и новые подходы к взаимодействию.
Уверен, многие из этих находок можно и нужно перерабатывать для e-learning.
Если мы хотим понять будущее технологий, стоит смотреть не только вперед, но и по сторонам. Инновации из геймдева — механики вовлечения, симуляции, интерактивные сценарии — давно и успешно перекочевали в e-learning.
Давайте посмотрим, как игроделы используют языковые модели в своих продуктах.
1. Социальные симуляторы и «живые» миры
ИИ оживляет целые сообщества NPC, с которыми можно взаимодействовать.
- Vaudeville: Детективная игра, в которой вы расследуете убийства, общаясь с персонажами через голос или текст. Диалоги генерируются в реальном времени, делая каждое прохождение уникальным. Уже в раннем доступе на Steam.
- Ememe: Симулятор жизни с ИИ-персонажами, напоминающий «Шоу Трумана» в цифровом мире. Вы создаете и наблюдаете за их автономной жизнью в виртуальном городке. NPC общаются, строят отношения и принимают решения на основе своих характеров. Поддерживается загрузка собственных 3D-моделей.
- NVIDIA ACE inZOI: Технологическая демонстрация от NVIDIA. Их технология ACE создает автономных персонажей, которые способны воспринимать окружение, общаться с игроком и друг с другом и принимать решения на основе своих целей и воспоминаний.
- Город с ИИ-прохожими: Пока это просто отдельная игровая механика, а не полноценная игра, но она отлично иллюстрирует вектор развития. Представьте себе виртуальный город, где вы можете подойти к любому прохожему и завести осмысленный разговор на любую тему. Каждый NPC обладает своей уникальной личностью, памятью и мнением, генерируемыми ИИ в режиме реального времени. Это следующий шаг к созданию по-настоящему живых, «дышащих» игровых вселенных.
2. Иммерсивные механики
Отдельные механики, показывающие, как ИИ может углубить погружение.
- Stellar Cafe: VR-игра для Meta Quest 3, где ИИ-роботы с поддержкой LLM ведут живые, открытые диалоги, запоминают игроков и реагируют на команды на естественном языке.
- RPG с ИИ-NPC: Пока концепт, а не готовый продукт. Представьте себе Skyrim, где каждый персонаж не заученно повторяет фразы, а может поддержать полноценный разговор на любую тему и динамически реагировать на ваши действия. Звучит фантастически, но работы в этом направлении уже ведутся.
3. Сгенерированные приключения
Здесь ИИ выступает в роли ведущего или соавтора истории, создавая уникальный сюжет каждый раз.
- AI Dungeon: Классика жанра. Текстовое D&D-приключение, где ИИ — это ваш личный мастер игры. Вы можете делать практически все что угодно, а нейросеть в реальном времени генерирует мир и реакции на ваши действия. Полная свобода в жанрах фэнтези, научной фантастики или хоррора.
- Hidden Door: Нарративная ролевая платформа, где игроки вместе с LLM создают миры и истории в стиле настольных RPG. Сценарий развивается динамически, а персонажи «живут» за счёт генеративного ИИ.
4. На стыке геймдева и обучения
- Gandalf Game: Остроумный игровой взгляд на prompt-инжиниринг. Ваша цель — заставить Гендальфа (роль которого играет ИИ) раскрыть секретный пароль. Игра состоит из 7 уровней сложности, на каждом из которых обойти защиту ИИ становится все сложнее. Отличный способ научиться формулировать запросы!
Как видно, пока это в основном эксперименты, концепты или отдельные игровые механики (не буду врать, ожидал что геймдев намного активнее возьмется за технологию). Но именно в них кроется главная ценность — смелые идеи и новые подходы к взаимодействию.
Уверен, многие из этих находок можно и нужно перерабатывать для e-learning.
👍7❤4🔥3🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
Хороший, но недостаточно: экономит ли ИИ время?
Очень часто попадаются юмористические ролики про то, как ИИ «экономит» время.
В посте расскажу про свой кейс «экономии» времени с ИИ, который отлично иллюстрирует те минусы инструмента, которые мешают автоматизации процессов.
👉Коротко о задаче:
Дано:
Есть «поток сознания» в голове (много неструктурированной информации) и пару десятков картинок, иллюстрирующих этот поток.
Задача:
Структурировать информацию и расписать её в таблице (600+ ячеек).
Осмысленно заполнить 600 ячеек — задача не быстрая.
ChatGPT отлично умеет структурировать информацию, а ещё умеет «видеть» картинки.
Логичное решение — объяснить ИИ, какая именно таблица мне нужна, какие поля в ней должны быть, как нужно их заполнять, закинуть весь «поток сознания» с картинками — и пусть структурирует и расписывает.
С первой же итерации результат получился неплохим. Всю огромную таблицу я, естественно, не читал. Пробежался по части таблицы, увидел общие недочёты и попросил ИИ их исправить (после каждой итерации перечитывать весь объём очень долго).
Несколько подобных итераций — и ChatGPT скидывает готовый Excel-файл с листами и удобным форматированием.
Круто? ДА НЕ ТО СЛОВО! Гигантская таблица меньше чем за полдня работы, да ещё мы успели «обсудить», что в таблице может быть не так и что требует улучшений. ChatGPT нашёл логическую ошибку в «потоке сознания» и внёс десяток идей по улучшению таблицы. Большая часть идей — откровенно дебильная, но 2 взял в работу — и это очень ценно.
Начал смотреть таблицу подробнее:
Часть столбцов и строк ИИ сделал практически идеально — проверил, немного подправил, и всё готово. В других было большое количество ошибок, поэтому проще и быстрее просто удалить «плохие столбцы» и заполнить их с нуля (ошибки и неточности разные, парой промптов не получится исправить).
В итоге не факт, что с ИИ у меня вообще получилось сделать работу быстрее.
Результат одновременно кажется и фантастическим, и совершенно бесполезным (не считая 2 классных советов, это было очень полезно). С одной стороны, то, что мы можем закинуть куда-то страницы текста с картинками и получить структурированную таблицу, — просто магия. С другой стороны, допущенные ошибки в составлении таблицы делают её совершенно бесполезной.
У классной таблицы высокая ценность, таблица с ошибками — не нужна и даром (при этом таблица далась совершенно не даром: на составление промпта, итерации, да и просто на то, чтобы перенести десяток страниц текста из головы на бумагу, ушло несколько часов).
С автоматизацией процессов всё ещё сложнее. Там не получится посмотреть работу и что-то доделать руками (иначе какая это автоматизация?). ИИ сделал работу плохо — значит, с этим и будем жить. Работа с промптами и применение современных методов работы с ИИ улучшают качество ответов принципиально, но получится ли «дотянуть» ответ до нужного качества и сколько это будет стоить — большой вопрос.
Упрощая: доверили бы вы задачу студенту-стажёру без контроля результата? Если да — такие задачи совершенно точно можно автоматизировать с ИИ.
Этот кейс хорошо иллюстрирует два тезиса:
🔹нас, скорее всего, не заменят машины, но вот тех, кто не использует ИИ в работе, весьма вероятно заменят те, кто использует (те, кто не пользуется - останутся без 2 классных советов);
🔹ИИ не снимает с вас ответственности за вычитку и контроль качества, а часто даже увеличивает её.
P.S. ИИ — это невероятно мощный инструмент. Но его эффективность всегда упирается вопрос: «Насколько хорошо я умею ставить ему задачи?».
Очень часто попадаются юмористические ролики про то, как ИИ «экономит» время.
В посте расскажу про свой кейс «экономии» времени с ИИ, который отлично иллюстрирует те минусы инструмента, которые мешают автоматизации процессов.
👉Коротко о задаче:
Дано:
Есть «поток сознания» в голове (много неструктурированной информации) и пару десятков картинок, иллюстрирующих этот поток.
Задача:
Структурировать информацию и расписать её в таблице (600+ ячеек).
Осмысленно заполнить 600 ячеек — задача не быстрая.
ChatGPT отлично умеет структурировать информацию, а ещё умеет «видеть» картинки.
Логичное решение — объяснить ИИ, какая именно таблица мне нужна, какие поля в ней должны быть, как нужно их заполнять, закинуть весь «поток сознания» с картинками — и пусть структурирует и расписывает.
С первой же итерации результат получился неплохим. Всю огромную таблицу я, естественно, не читал. Пробежался по части таблицы, увидел общие недочёты и попросил ИИ их исправить (после каждой итерации перечитывать весь объём очень долго).
Несколько подобных итераций — и ChatGPT скидывает готовый Excel-файл с листами и удобным форматированием.
Круто? ДА НЕ ТО СЛОВО! Гигантская таблица меньше чем за полдня работы, да ещё мы успели «обсудить», что в таблице может быть не так и что требует улучшений. ChatGPT нашёл логическую ошибку в «потоке сознания» и внёс десяток идей по улучшению таблицы. Большая часть идей — откровенно дебильная, но 2 взял в работу — и это очень ценно.
Начал смотреть таблицу подробнее:
Часть столбцов и строк ИИ сделал практически идеально — проверил, немного подправил, и всё готово. В других было большое количество ошибок, поэтому проще и быстрее просто удалить «плохие столбцы» и заполнить их с нуля (ошибки и неточности разные, парой промптов не получится исправить).
В итоге не факт, что с ИИ у меня вообще получилось сделать работу быстрее.
Результат одновременно кажется и фантастическим, и совершенно бесполезным (не считая 2 классных советов, это было очень полезно). С одной стороны, то, что мы можем закинуть куда-то страницы текста с картинками и получить структурированную таблицу, — просто магия. С другой стороны, допущенные ошибки в составлении таблицы делают её совершенно бесполезной.
У классной таблицы высокая ценность, таблица с ошибками — не нужна и даром (при этом таблица далась совершенно не даром: на составление промпта, итерации, да и просто на то, чтобы перенести десяток страниц текста из головы на бумагу, ушло несколько часов).
С автоматизацией процессов всё ещё сложнее. Там не получится посмотреть работу и что-то доделать руками (иначе какая это автоматизация?). ИИ сделал работу плохо — значит, с этим и будем жить. Работа с промптами и применение современных методов работы с ИИ улучшают качество ответов принципиально, но получится ли «дотянуть» ответ до нужного качества и сколько это будет стоить — большой вопрос.
Упрощая: доверили бы вы задачу студенту-стажёру без контроля результата? Если да — такие задачи совершенно точно можно автоматизировать с ИИ.
Этот кейс хорошо иллюстрирует два тезиса:
🔹нас, скорее всего, не заменят машины, но вот тех, кто не использует ИИ в работе, весьма вероятно заменят те, кто использует (те, кто не пользуется - останутся без 2 классных советов);
🔹ИИ не снимает с вас ответственности за вычитку и контроль качества, а часто даже увеличивает её.
P.S. ИИ — это невероятно мощный инструмент. Но его эффективность всегда упирается вопрос: «Насколько хорошо я умею ставить ему задачи?».
❤4👍4🔥4😁2
Друзья, у меня для вас новости!
Уже в четвёртый раз выступаю на Learning Elements. В этот раз конференция будет онлайн и полностью про ИИ в обучении.
Планирую рассказать (и надеюсь расскажу 😁) об «умном обучении»: как встроить ИИ в электронные курсы так, чтобы он не просто проверял знания, а помогал формировать реальные умения и вовлекал в процесс. Покажу примеры из практики и разберу простые способы, как интегрировать ИИ в e-learning (да и про сложные способы расскажу).
👉Много классных спикеров и интересных тем (вот тут программа).
👉А еще практикумы.
Например, у Владимира Казакова будет практикум по вайбкодингу. Как мне кажется, тема суперактуальная для всех, кто разрабатывает курсы (да и не только).
Буду рад видеть вас на конференции (она уже на следующей неделе)! Думаю, получится живой разговор о том, как ИИ уже меняет e-learning.
Уже в четвёртый раз выступаю на Learning Elements. В этот раз конференция будет онлайн и полностью про ИИ в обучении.
Планирую рассказать (и надеюсь расскажу 😁) об «умном обучении»: как встроить ИИ в электронные курсы так, чтобы он не просто проверял знания, а помогал формировать реальные умения и вовлекал в процесс. Покажу примеры из практики и разберу простые способы, как интегрировать ИИ в e-learning (да и про сложные способы расскажу).
👉Много классных спикеров и интересных тем (вот тут программа).
👉А еще практикумы.
Например, у Владимира Казакова будет практикум по вайбкодингу. Как мне кажется, тема суперактуальная для всех, кто разрабатывает курсы (да и не только).
Буду рад видеть вас на конференции (она уже на следующей неделе)! Думаю, получится живой разговор о том, как ИИ уже меняет e-learning.
👍6❤3🔥2👏1
Мультиагентный подход в ИИ: как виртуальная команда экспертов решает сложные задачи
Представьте, что вам поручили создать с нуля отдел обучения в компании.
Какой путь выбрать? Нанять универсальных специалистов или команду узких экспертов?
Первый путь — быстрый и простой. Второй — дает более высокое качество, но сложнее в управлении.
Это не HR-задача, а современный тренд в искусственном интеллекте — мультиагентные системы.
Почему один бот часто ошибается и «галлюцинирует», а команда из нескольких ИИ справляется с самыми сложными задачами? Как работает виртуальный «оркестратор» и почему за этим подходом — будущее?
Ответы в СТАТЬЕ.
Представьте, что вам поручили создать с нуля отдел обучения в компании.
Какой путь выбрать? Нанять универсальных специалистов или команду узких экспертов?
Первый путь — быстрый и простой. Второй — дает более высокое качество, но сложнее в управлении.
Это не HR-задача, а современный тренд в искусственном интеллекте — мультиагентные системы.
Почему один бот часто ошибается и «галлюцинирует», а команда из нескольких ИИ справляется с самыми сложными задачами? Как работает виртуальный «оркестратор» и почему за этим подходом — будущее?
Ответы в СТАТЬЕ.
❤7👍5🔥3
Дебаты
Уже года 4 не участвовал в дебатах, хотя сам формат мне интересен (даже несколько раз проводил подобные мероприятия).
Как это работает: берется спорная тема и две команды. Одна команда отстаивает позицию «ЗА», другая «ПРОТИВ».
Но суть не в ссоре, а в интеллектуальной игре. Часто команды защищают позицию, с которой не согласны или согласны не полностью. Это и есть главный вызов — постараться увидеть любую проблему с разных сторон.
В чем польза для зрителей?
Дебаты — это возможность за короткое время услышать аргументы обеих сторон по сложному вопросу. Вместо одной точки зрения вы получаете сбалансированную картину, которая позволяет посмотреть на проблему объемнее, понимая сильные и слабые стороны каждой позиции.
И вот отличный повод посмотреть на дебатывживую онлайн!
В этот четверг, участвую в онлайн-батле «Готовые курсы VS разработка» (формат очень похож на дебаты), который проводит сообщество Digital Learning.
Нам с Иваном Булавкиным (начальник центра дистанционных образовательных технологий ПАО «РЖД») предстоит отстоять позицию, что создание своего контента — стратегически вернее и выгоднее, чем покупка готовых решений.
Присоединяйтесь, чтобы услышать железные (со стороны Ивана уж точно, а с моей надеюсь 😁) аргументы и составить свое мнение.
(или просто поддержать)
----------
🗓 25 сентября 11:00 по мск, онлайн, бесплатно.
✍️Регистрация: КЛИК
ℹ️ А вот тут больше информации: КЛИК
Уже года 4 не участвовал в дебатах, хотя сам формат мне интересен (даже несколько раз проводил подобные мероприятия).
Как это работает: берется спорная тема и две команды. Одна команда отстаивает позицию «ЗА», другая «ПРОТИВ».
Но суть не в ссоре, а в интеллектуальной игре. Часто команды защищают позицию, с которой не согласны или согласны не полностью. Это и есть главный вызов — постараться увидеть любую проблему с разных сторон.
В чем польза для зрителей?
Дебаты — это возможность за короткое время услышать аргументы обеих сторон по сложному вопросу. Вместо одной точки зрения вы получаете сбалансированную картину, которая позволяет посмотреть на проблему объемнее, понимая сильные и слабые стороны каждой позиции.
И вот отличный повод посмотреть на дебаты
В этот четверг, участвую в онлайн-батле «Готовые курсы VS разработка» (формат очень похож на дебаты), который проводит сообщество Digital Learning.
Нам с Иваном Булавкиным (начальник центра дистанционных образовательных технологий ПАО «РЖД») предстоит отстоять позицию, что создание своего контента — стратегически вернее и выгоднее, чем покупка готовых решений.
Присоединяйтесь, чтобы услышать железные (со стороны Ивана уж точно, а с моей надеюсь 😁) аргументы и составить свое мнение.
(или просто поддержать)
----------
🗓 25 сентября 11:00 по мск, онлайн, бесплатно.
✍️Регистрация: КЛИК
ℹ️ А вот тут больше информации: КЛИК
👍7🔥6🤔1
Учебники скучные? Google придумал, как их оживить
Learn Your Way — новый инструмент от Google для учителей школ, который преобразует обычные учебники (например, в формате PDF) в интерактивные и (совсем немного) персонализированные учебные материалы. Разумеется, все это делает ИИ (ну а куда уж без него?).
Как это работает?
1. Загружаем в сервис главу учебника, по которой хотим составить урок.
2. Выбираем параметры для персонализации:
• Возраст ученика (класс)
Выбор влияет на язык повествования: чем младше школьник – тем проще язык.
• Интересы ученика
Некоторые темы/блоки/определения будут объясняться, основываясь на интересах ученика.
Например, эволюцию человека дополнительно объясняют на примере эволюции теннисного спорта.
3. Готово. У нас есть электронный курс.
Звучит весьма обычно на сегодняшний день, в чем фишка?
1. Урок собирается сразу в 3 форматах:
• Интерактивный лендинг
E-learning специалиста тут, скорее всего, не удивишь. Текст, картинки, примеры с иллюстрациями, вопросы на понимание блоков. Но есть и интересные механики: тесты в конце каждой главы, в них при неправильном ответе можно попросить подсказку, а потом еще посмотреть «области роста в тексте» (однозначно опробую на практике обе фишки).
• Слайды и повествование
Здесь материал подается в виде слайдов с озвучкой. Как будто смотришь вебинар.
Важно! Это не тот же лендинг, просто озвученный и упакованный в слайды. Методология полностью пересобрана под другой формат: другие задания, упражнения, другой стиль повествования.
• Аудиоурок
И нет, это не просто убрали «слайды» из «слайдов и повествования». Здесь несколько действующих лиц, которые общаются между собой и ведут интересную беседу.
Итого: 3 формата – 3 разные методологии. Очень классный подход.
2) К каждому уроку собирается MindMap.
Удобный инструмент для структурирования информации в голове, школьнику легче «разложить все по полочкам», выделить главное и запомнить визуальную картину урока. А еще он интерактивный, можно «потыкать» блоки карты, что способствует вовлечению.
3) Самое главное – все сделано качественно.
ИИшка четко следует загруженному материалу, при этом делает его более структурированным, добавляет релевантные примеры и немного подстраивает материал под ученика.
Иными словами, ИИ не пишет урок с нуля и не выдумывает учебные материалы, а просто улучшает существующие: адаптирует под возраст и интересы, делает более интерактивными и дает возможность учиться так, как удобно/нравится школьнику.
Какие результаты?
Для тестирования инструмента Google взяла 60 учащихся в возрасте от 15 до 18 лет и разделила их на две группы. Одним дали 40 минут на чтение учебника, вторым дали интерактивный курс, основанный на материалах учебника.
Ребята, занимающиеся по электронному курсу, набрали на 9% больше баллов в тестировании после курса и на 11% больше баллов в повторном тестировании, которое проводилось через 3-5 дней после изучения материала.
Сами школьники оценили интерактивные материалы более высоко, чем электронные учебники (ну кто бы сомневался).
Исследование Google доказывает, что дело не только в содержании, но и в форме. Персонализация и адаптация формата под ученика — даже на базовом уровне — дают реальное улучшение результатов. Это шаг от образования «для всех одинакового» к образованию, которое (немного) учитывает индивидуальность.
Вот ТУТ можно посмотреть примеры уроков.
ЗДЕСЬ подробнее о исследовании.
Learn Your Way — новый инструмент от Google для учителей школ, который преобразует обычные учебники (например, в формате PDF) в интерактивные и (совсем немного) персонализированные учебные материалы. Разумеется, все это делает ИИ (ну а куда уж без него?).
Как это работает?
1. Загружаем в сервис главу учебника, по которой хотим составить урок.
2. Выбираем параметры для персонализации:
• Возраст ученика (класс)
Выбор влияет на язык повествования: чем младше школьник – тем проще язык.
• Интересы ученика
Некоторые темы/блоки/определения будут объясняться, основываясь на интересах ученика.
Например, эволюцию человека дополнительно объясняют на примере эволюции теннисного спорта.
3. Готово. У нас есть электронный курс.
Звучит весьма обычно на сегодняшний день, в чем фишка?
1. Урок собирается сразу в 3 форматах:
• Интерактивный лендинг
E-learning специалиста тут, скорее всего, не удивишь. Текст, картинки, примеры с иллюстрациями, вопросы на понимание блоков. Но есть и интересные механики: тесты в конце каждой главы, в них при неправильном ответе можно попросить подсказку, а потом еще посмотреть «области роста в тексте» (однозначно опробую на практике обе фишки).
• Слайды и повествование
Здесь материал подается в виде слайдов с озвучкой. Как будто смотришь вебинар.
Важно! Это не тот же лендинг, просто озвученный и упакованный в слайды. Методология полностью пересобрана под другой формат: другие задания, упражнения, другой стиль повествования.
• Аудиоурок
И нет, это не просто убрали «слайды» из «слайдов и повествования». Здесь несколько действующих лиц, которые общаются между собой и ведут интересную беседу.
Итого: 3 формата – 3 разные методологии. Очень классный подход.
2) К каждому уроку собирается MindMap.
Удобный инструмент для структурирования информации в голове, школьнику легче «разложить все по полочкам», выделить главное и запомнить визуальную картину урока. А еще он интерактивный, можно «потыкать» блоки карты, что способствует вовлечению.
3) Самое главное – все сделано качественно.
ИИшка четко следует загруженному материалу, при этом делает его более структурированным, добавляет релевантные примеры и немного подстраивает материал под ученика.
Иными словами, ИИ не пишет урок с нуля и не выдумывает учебные материалы, а просто улучшает существующие: адаптирует под возраст и интересы, делает более интерактивными и дает возможность учиться так, как удобно/нравится школьнику.
Какие результаты?
Для тестирования инструмента Google взяла 60 учащихся в возрасте от 15 до 18 лет и разделила их на две группы. Одним дали 40 минут на чтение учебника, вторым дали интерактивный курс, основанный на материалах учебника.
Ребята, занимающиеся по электронному курсу, набрали на 9% больше баллов в тестировании после курса и на 11% больше баллов в повторном тестировании, которое проводилось через 3-5 дней после изучения материала.
Сами школьники оценили интерактивные материалы более высоко, чем электронные учебники (ну кто бы сомневался).
Исследование Google доказывает, что дело не только в содержании, но и в форме. Персонализация и адаптация формата под ученика — даже на базовом уровне — дают реальное улучшение результатов. Это шаг от образования «для всех одинакового» к образованию, которое (немного) учитывает индивидуальность.
Вот ТУТ можно посмотреть примеры уроков.
ЗДЕСЬ подробнее о исследовании.
👍12❤4🔥4
Media is too big
VIEW IN TELEGRAM
Диалоговые тренажеры с ИИ: от первого MVP к комплексной симуляции
2,5 года назад мы создали наш первый MVP диалогового тренажера с ИИ в Articulate Storyline. Тогда сотрудник в роли продавца подбирал тарифы мобильной связи, а в конце получал обратную связь от «глупой» по современным меркам GPT-3.5. Результат был сырым, но очень показательным. Подробный (даже с перебором) разбор того пилотного проекта можно посмотреть ТУТ.
Новый демо-проект, использует современные модели и подходы, выводя идею на новый уровень.
Что сделали сейчас?
Это демонстрационный кейс для банковской сферы (все данные клиентов, банк и ПО вымышлены). Его цель — показать, на что уже способны диалоговые тренажеры с ИИ.
Ключевые фишки проекта:
1. Полный цикл работы оператора.
Сотрудник колл-центра не просто общается, а выполняет задачи в симуляции «реального» банковского ПО. Он проверяет счета, блокирует и перевыпускает карты, сбрасывает пароли, и.т.д. — все как в реальности.
2. Живой голосовой диалог.
Взаимодействие с клиентом происходит голосом. ИИ не просто генерирует текст, а проговаривает его, реагируя на слова и вектор беседы оператора.
3. Взаимосвязь действий и диалога.
Это самая интересная часть системы. При необходимости, можно настроить изменение диалога и поведения клиента в зависимости от совершенных в системе действий, например:
- Если оператор в ПО отправляет клиенту SMS-уведомление, ИИ-клиент его «получает» и тут же упоминает в разговоре.
- Ошибка в проведенной операции (например, ошибочная блокировка карты) сразу меняет контекст беседы: клиент расстраивается, реагирует с недовольством или задает уточняющие вопросы.
- Конечно, возможны и более сложные сценарии, когда клиент «перезванивает через неделю» и продолжает диалог (например, чтобы наглядно продемонстрировать к чему привели ошибки в разговоре, или просто как продолжение сложного.
4. Комплексная оценка.
Система может фиксировать и оценивать не только то, что сказал оператор, но и что он сделал в интерфейсе, и насколько слаженно прошли оба эти процесса.
За счет такого подхода процесс становится максимально иммерсивыным и позволяет не только получать знания, но и формировать умения, при этом в безопасной среде и без стресса для сотрудника (особенно для новичка).
Что под капотом?
В основе лежат технологии OpenAI: современная языковая модель, преобразование речи в текст и обратно.
Готовый тренажер, при необходимости, упаковывается в SCORM и загружается в любую LMS (статистика передается в LMS точно так же, как в обычном курсе).
(тему о том, что для сложных data-driven проектов будущего нужен xAPI, а не SCORM, оставим на потом)
Сколько это стоит?
Ценообразование в таких проектах — тема отдельного большого разговора.
Если коротко: цена одного диалога зависит от используемых моделей ИИ, его длительности и объема контекстных инструкций для ИИ-персонажа. Чем «умнее» модель, дольше разговор и больше контекст – тем дороже.
В этом конкретном демо-кейсе один диалог обходится примерно в 5 рублей.
Если готовы к небольшим компромиссам – можно снизить цену в 2-3 раза, но все зависит от кейса.
Такой подход создает уникальный гибридный формат обучения. Он находится ровно посередине между стандартным SCORM-курсом, который дает знания, и дорогостоящим тренингом с живым тренером, который дает практику.
Тренажер не заменяет полноценного наставника, но создает безопасную и максимально приближенную к реальности среду, где можно без риска совершать ошибки, отрабатывать сложные сценарии и формировать устойчивые умения, сочетающие в себе и коммуникацию, и работу с цифровыми инструментами.
-----
Это вымышленный кейс.
А о том, как ИИ реально помогает развивать тысячи сотрудников, расскажет руководитель центра по развитию персонала региональной сети и федеральных площадок ПАО «МегаФон» Татьяна Гуськова на конференции Digital Learning 2025!
Когда: 20 ноября 2025 года
Где: Москва, гостиница Аэростар
P.S. Я тоже приеду! Буду рад пообщаться со всеми лично.
2,5 года назад мы создали наш первый MVP диалогового тренажера с ИИ в Articulate Storyline. Тогда сотрудник в роли продавца подбирал тарифы мобильной связи, а в конце получал обратную связь от «глупой» по современным меркам GPT-3.5. Результат был сырым, но очень показательным. Подробный (даже с перебором) разбор того пилотного проекта можно посмотреть ТУТ.
Новый демо-проект, использует современные модели и подходы, выводя идею на новый уровень.
Что сделали сейчас?
Это демонстрационный кейс для банковской сферы (все данные клиентов, банк и ПО вымышлены). Его цель — показать, на что уже способны диалоговые тренажеры с ИИ.
Ключевые фишки проекта:
1. Полный цикл работы оператора.
Сотрудник колл-центра не просто общается, а выполняет задачи в симуляции «реального» банковского ПО. Он проверяет счета, блокирует и перевыпускает карты, сбрасывает пароли, и.т.д. — все как в реальности.
2. Живой голосовой диалог.
Взаимодействие с клиентом происходит голосом. ИИ не просто генерирует текст, а проговаривает его, реагируя на слова и вектор беседы оператора.
3. Взаимосвязь действий и диалога.
Это самая интересная часть системы. При необходимости, можно настроить изменение диалога и поведения клиента в зависимости от совершенных в системе действий, например:
- Если оператор в ПО отправляет клиенту SMS-уведомление, ИИ-клиент его «получает» и тут же упоминает в разговоре.
- Ошибка в проведенной операции (например, ошибочная блокировка карты) сразу меняет контекст беседы: клиент расстраивается, реагирует с недовольством или задает уточняющие вопросы.
- Конечно, возможны и более сложные сценарии, когда клиент «перезванивает через неделю» и продолжает диалог (например, чтобы наглядно продемонстрировать к чему привели ошибки в разговоре, или просто как продолжение сложного.
4. Комплексная оценка.
Система может фиксировать и оценивать не только то, что сказал оператор, но и что он сделал в интерфейсе, и насколько слаженно прошли оба эти процесса.
За счет такого подхода процесс становится максимально иммерсивыным и позволяет не только получать знания, но и формировать умения, при этом в безопасной среде и без стресса для сотрудника (особенно для новичка).
Что под капотом?
В основе лежат технологии OpenAI: современная языковая модель, преобразование речи в текст и обратно.
Готовый тренажер, при необходимости, упаковывается в SCORM и загружается в любую LMS (статистика передается в LMS точно так же, как в обычном курсе).
(тему о том, что для сложных data-driven проектов будущего нужен xAPI, а не SCORM, оставим на потом)
Сколько это стоит?
Ценообразование в таких проектах — тема отдельного большого разговора.
Если коротко: цена одного диалога зависит от используемых моделей ИИ, его длительности и объема контекстных инструкций для ИИ-персонажа. Чем «умнее» модель, дольше разговор и больше контекст – тем дороже.
В этом конкретном демо-кейсе один диалог обходится примерно в 5 рублей.
Если готовы к небольшим компромиссам – можно снизить цену в 2-3 раза, но все зависит от кейса.
Такой подход создает уникальный гибридный формат обучения. Он находится ровно посередине между стандартным SCORM-курсом, который дает знания, и дорогостоящим тренингом с живым тренером, который дает практику.
Тренажер не заменяет полноценного наставника, но создает безопасную и максимально приближенную к реальности среду, где можно без риска совершать ошибки, отрабатывать сложные сценарии и формировать устойчивые умения, сочетающие в себе и коммуникацию, и работу с цифровыми инструментами.
-----
Это вымышленный кейс.
А о том, как ИИ реально помогает развивать тысячи сотрудников, расскажет руководитель центра по развитию персонала региональной сети и федеральных площадок ПАО «МегаФон» Татьяна Гуськова на конференции Digital Learning 2025!
Когда: 20 ноября 2025 года
Где: Москва, гостиница Аэростар
P.S. Я тоже приеду! Буду рад пообщаться со всеми лично.
🔥14👍7❤5