Тут про e-learning – Telegram
Тут про e-learning
396 subscribers
49 photos
62 videos
39 links
Канал для разработчиков электронных курсов:
- ИИ
- Насмотренность
- Конструкторы курсов
- Геймификация
Download Telegram
ИИгры: а что там с ИИ в геймдеве?

Если мы хотим понять будущее технологий, стоит смотреть не только вперед, но и по сторонам. Инновации из геймдева — механики вовлечения, симуляции, интерактивные сценарии — давно и успешно перекочевали в e-learning.

Давайте посмотрим, как игроделы используют языковые модели в своих продуктах.

1. Социальные симуляторы и «живые» миры
ИИ оживляет целые сообщества NPC, с которыми можно взаимодействовать.
- Vaudeville: Детективная игра, в которой вы расследуете убийства, общаясь с персонажами через голос или текст. Диалоги генерируются в реальном времени, делая каждое прохождение уникальным. Уже в раннем доступе на Steam.
- Ememe: Симулятор жизни с ИИ-персонажами, напоминающий «Шоу Трумана» в цифровом мире. Вы создаете и наблюдаете за их автономной жизнью в виртуальном городке. NPC общаются, строят отношения и принимают решения на основе своих характеров. Поддерживается загрузка собственных 3D-моделей.
- NVIDIA ACE inZOI: Технологическая демонстрация от NVIDIA. Их технология ACE создает автономных персонажей, которые способны воспринимать окружение, общаться с игроком и друг с другом и принимать решения на основе своих целей и воспоминаний.
- Город с ИИ-прохожими: Пока это просто отдельная игровая механика, а не полноценная игра, но она отлично иллюстрирует вектор развития. Представьте себе виртуальный город, где вы можете подойти к любому прохожему и завести осмысленный разговор на любую тему. Каждый NPC обладает своей уникальной личностью, памятью и мнением, генерируемыми ИИ в режиме реального времени. Это следующий шаг к созданию по-настоящему живых, «дышащих» игровых вселенных.

2. Иммерсивные механики
Отдельные механики, показывающие, как ИИ может углубить погружение.
- Stellar Cafe: VR-игра для Meta Quest 3, где ИИ-роботы с поддержкой LLM ведут живые, открытые диалоги, запоминают игроков и реагируют на команды на естественном языке.
- RPG с ИИ-NPC: Пока концепт, а не готовый продукт. Представьте себе Skyrim, где каждый персонаж не заученно повторяет фразы, а может поддержать полноценный разговор на любую тему и динамически реагировать на ваши действия. Звучит фантастически, но работы в этом направлении уже ведутся.

3. Сгенерированные приключения
Здесь ИИ выступает в роли ведущего или соавтора истории, создавая уникальный сюжет каждый раз.
- AI Dungeon: Классика жанра. Текстовое D&D-приключение, где ИИ — это ваш личный мастер игры. Вы можете делать практически все что угодно, а нейросеть в реальном времени генерирует мир и реакции на ваши действия. Полная свобода в жанрах фэнтези, научной фантастики или хоррора.
- Hidden Door: Нарративная ролевая платформа, где игроки вместе с LLM создают миры и истории в стиле настольных RPG. Сценарий развивается динамически, а персонажи «живут» за счёт генеративного ИИ.

4. На стыке геймдева и обучения
- Gandalf Game: Остроумный игровой взгляд на prompt-инжиниринг. Ваша цель — заставить Гендальфа (роль которого играет ИИ) раскрыть секретный пароль. Игра состоит из 7 уровней сложности, на каждом из которых обойти защиту ИИ становится все сложнее. Отличный способ научиться формулировать запросы!

Как видно, пока это в основном эксперименты, концепты или отдельные игровые механики (не буду врать, ожидал что геймдев намного активнее возьмется за технологию). Но именно в них кроется главная ценность — смелые идеи и новые подходы к взаимодействию.

Уверен, многие из этих находок можно и нужно перерабатывать для e-learning.
👍74🔥3🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
Хороший, но недостаточно: экономит ли ИИ время?

Очень часто попадаются юмористические ролики про то, как ИИ «экономит» время.

В посте расскажу про свой кейс «экономии» времени с ИИ, который отлично иллюстрирует те минусы инструмента, которые мешают автоматизации процессов.

👉Коротко о задаче:
Дано:

Есть «поток сознания» в голове (много неструктурированной информации) и пару десятков картинок, иллюстрирующих этот поток.

Задача:
Структурировать информацию и расписать её в таблице (600+ ячеек).

Осмысленно заполнить 600 ячеек — задача не быстрая.

ChatGPT отлично умеет структурировать информацию, а ещё умеет «видеть» картинки.
Логичное решение — объяснить ИИ, какая именно таблица мне нужна, какие поля в ней должны быть, как нужно их заполнять, закинуть весь «поток сознания» с картинками — и пусть структурирует и расписывает.

С первой же итерации результат получился неплохим. Всю огромную таблицу я, естественно, не читал. Пробежался по части таблицы, увидел общие недочёты и попросил ИИ их исправить (после каждой итерации перечитывать весь объём очень долго).

Несколько подобных итераций — и ChatGPT скидывает готовый Excel-файл с листами и удобным форматированием.

Круто? ДА НЕ ТО СЛОВО! Гигантская таблица меньше чем за полдня работы, да ещё мы успели «обсудить», что в таблице может быть не так и что требует улучшений. ChatGPT нашёл логическую ошибку в «потоке сознания» и внёс десяток идей по улучшению таблицы. Большая часть идей — откровенно дебильная, но 2 взял в работу — и это очень ценно.

Начал смотреть таблицу подробнее:
Часть столбцов и строк ИИ сделал практически идеально — проверил, немного подправил, и всё готово. В других было большое количество ошибок, поэтому проще и быстрее просто удалить «плохие столбцы» и заполнить их с нуля (ошибки и неточности разные, парой промптов не получится исправить).

В итоге не факт, что с ИИ у меня вообще получилось сделать работу быстрее.

Результат одновременно кажется и фантастическим, и совершенно бесполезным (не считая 2 классных советов, это было очень полезно). С одной стороны, то, что мы можем закинуть куда-то страницы текста с картинками и получить структурированную таблицу, — просто магия. С другой стороны, допущенные ошибки в составлении таблицы делают её совершенно бесполезной.

У классной таблицы высокая ценность, таблица с ошибками — не нужна и даром (при этом таблица далась совершенно не даром: на составление промпта, итерации, да и просто на то, чтобы перенести десяток страниц текста из головы на бумагу, ушло несколько часов).

С автоматизацией процессов всё ещё сложнее. Там не получится посмотреть работу и что-то доделать руками (иначе какая это автоматизация?). ИИ сделал работу плохо — значит, с этим и будем жить. Работа с промптами и применение современных методов работы с ИИ улучшают качество ответов принципиально, но получится ли «дотянуть» ответ до нужного качества и сколько это будет стоить — большой вопрос.

Упрощая: доверили бы вы задачу студенту-стажёру без контроля результата? Если да — такие задачи совершенно точно можно автоматизировать с ИИ.

Этот кейс хорошо иллюстрирует два тезиса:
🔹нас, скорее всего, не заменят машины, но вот тех, кто не использует ИИ в работе, весьма вероятно заменят те, кто использует (те, кто не пользуется - останутся без 2 классных советов);
🔹ИИ не снимает с вас ответственности за вычитку и контроль качества, а часто даже увеличивает её.

P.S. ИИ — это невероятно мощный инструмент. Но его эффективность всегда упирается вопрос: «Насколько хорошо я умею ставить ему задачи?».
4👍4🔥4😁2
Друзья, у меня для вас новости!

Уже в четвёртый раз выступаю на Learning Elements. В этот раз конференция будет онлайн и полностью про ИИ в обучении.

Планирую рассказать (и надеюсь расскажу 😁) об «умном обучении»: как встроить ИИ в электронные курсы так, чтобы он не просто проверял знания, а помогал формировать реальные умения и вовлекал в процесс. Покажу примеры из практики и разберу простые способы, как интегрировать ИИ в e-learning (да и про сложные способы расскажу).

👉Много классных спикеров и интересных тем (вот тут программа).

👉А еще практикумы.
Например, у Владимира Казакова будет практикум по вайбкодингу. Как мне кажется, тема суперактуальная для всех, кто разрабатывает курсы (да и не только).

Буду рад видеть вас на конференции (она уже на следующей неделе)! Думаю, получится живой разговор о том, как ИИ уже меняет e-learning.
👍63🔥2👏1
Мультиагентный подход в ИИ: как виртуальная команда экспертов решает сложные задачи

Представьте, что вам поручили создать с нуля отдел обучения в компании.

Какой путь выбрать? Нанять универсальных специалистов или команду узких экспертов?

Первый путь — быстрый и простой. Второй — дает более высокое качество, но сложнее в управлении.

Это не HR-задача, а современный тренд в искусственном интеллекте — мультиагентные системы.

Почему один бот часто ошибается и «галлюцинирует», а команда из нескольких ИИ справляется с самыми сложными задачами? Как работает виртуальный «оркестратор» и почему за этим подходом — будущее?

Ответы в СТАТЬЕ.
7👍5🔥3
Дебаты
Уже года 4 не участвовал в дебатах, хотя сам формат мне интересен (даже несколько раз проводил подобные мероприятия).

Как это работает: берется спорная тема и две команды. Одна команда отстаивает позицию «ЗА», другая «ПРОТИВ».

Но суть не в ссоре, а в интеллектуальной игре. Часто команды защищают позицию, с которой не согласны или согласны не полностью. Это и есть главный вызов — постараться увидеть любую проблему с разных сторон.

В чем польза для зрителей?
Дебаты — это возможность за короткое время услышать аргументы обеих сторон по сложному вопросу. Вместо одной точки зрения вы получаете сбалансированную картину, которая позволяет посмотреть на проблему объемнее, понимая сильные и слабые стороны каждой позиции.

И вот отличный повод посмотреть на дебаты вживую онлайн!
В этот четверг, участвую в онлайн-батле «Готовые курсы VS разработка» (формат очень похож на дебаты), который проводит сообщество Digital Learning.

Нам с Иваном Булавкиным (начальник центра дистанционных образовательных технологий ПАО «РЖД») предстоит отстоять позицию, что создание своего контента — стратегически вернее и выгоднее, чем покупка готовых решений.

Присоединяйтесь, чтобы услышать железные (со стороны Ивана уж точно, а с моей надеюсь 😁) аргументы и составить свое мнение.
(или просто поддержать)

----------

🗓 25 сентября 11:00 по мск, онлайн, бесплатно.

✍️Регистрация: КЛИК

ℹ️ А вот тут больше информации: КЛИК
👍7🔥6🤔1
Учебники скучные? Google придумал, как их оживить
Learn Your Way — новый инструмент от Google для учителей школ, который преобразует обычные учебники (например, в формате PDF) в интерактивные и (совсем немного) персонализированные учебные материалы. Разумеется, все это делает ИИ (ну а куда уж без него?).

Как это работает?
1. Загружаем в сервис главу учебника, по которой хотим составить урок.
2. Выбираем параметры для персонализации:
Возраст ученика (класс)
Выбор влияет на язык повествования: чем младше школьник – тем проще язык.
Интересы ученика
Некоторые темы/блоки/определения будут объясняться, основываясь на интересах ученика.
Например, эволюцию человека дополнительно объясняют на примере эволюции теннисного спорта.
3. Готово. У нас есть электронный курс.

Звучит весьма обычно на сегодняшний день, в чем фишка?

1. Урок собирается сразу в 3 форматах:

Интерактивный лендинг
E-learning специалиста тут, скорее всего, не удивишь. Текст, картинки, примеры с иллюстрациями, вопросы на понимание блоков. Но есть и интересные механики: тесты в конце каждой главы, в них при неправильном ответе можно попросить подсказку, а потом еще посмотреть «области роста в тексте» (однозначно опробую на практике обе фишки).

Слайды и повествование
Здесь материал подается в виде слайдов с озвучкой. Как будто смотришь вебинар.
Важно! Это не тот же лендинг, просто озвученный и упакованный в слайды. Методология полностью пересобрана под другой формат: другие задания, упражнения, другой стиль повествования.

Аудиоурок
И нет, это не просто убрали «слайды» из «слайдов и повествования». Здесь несколько действующих лиц, которые общаются между собой и ведут интересную беседу.

Итого: 3 формата – 3 разные методологии. Очень классный подход.

2) К каждому уроку собирается MindMap.
Удобный инструмент для структурирования информации в голове, школьнику легче «разложить все по полочкам», выделить главное и запомнить визуальную картину урока. А еще он интерактивный, можно «потыкать» блоки карты, что способствует вовлечению.

3) Самое главное – все сделано качественно.
ИИшка четко следует загруженному материалу, при этом делает его более структурированным, добавляет релевантные примеры и немного подстраивает материал под ученика.

Иными словами, ИИ не пишет урок с нуля и не выдумывает учебные материалы, а просто улучшает существующие: адаптирует под возраст и интересы, делает более интерактивными и дает возможность учиться так, как удобно/нравится школьнику.

Какие результаты?
Для тестирования инструмента Google взяла 60 учащихся в возрасте от 15 до 18 лет и разделила их на две группы. Одним дали 40 минут на чтение учебника, вторым дали интерактивный курс, основанный на материалах учебника.

Ребята, занимающиеся по электронному курсу, набрали на 9% больше баллов в тестировании после курса и на 11% больше баллов в повторном тестировании, которое проводилось через 3-5 дней после изучения материала.

Сами школьники оценили интерактивные материалы более высоко, чем электронные учебники (ну кто бы сомневался).

Исследование Google доказывает, что дело не только в содержании, но и в форме. Персонализация и адаптация формата под ученика — даже на базовом уровне — дают реальное улучшение результатов. Это шаг от образования «для всех одинакового» к образованию, которое (немного) учитывает индивидуальность.

Вот ТУТ можно посмотреть примеры уроков.
ЗДЕСЬ подробнее о исследовании.
👍124🔥4
Media is too big
VIEW IN TELEGRAM
Диалоговые тренажеры с ИИ: от первого MVP к комплексной симуляции
2,5 года назад мы создали наш первый MVP диалогового тренажера с ИИ в Articulate Storyline. Тогда сотрудник в роли продавца подбирал тарифы мобильной связи, а в конце получал обратную связь от «глупой» по современным меркам GPT-3.5. Результат был сырым, но очень показательным. Подробный (даже с перебором) разбор того пилотного проекта можно посмотреть ТУТ.

Новый демо-проект, использует современные модели и подходы, выводя идею на новый уровень.

Что сделали сейчас?
Это демонстрационный кейс для банковской сферы (все данные клиентов, банк и ПО вымышлены). Его цель — показать, на что уже способны диалоговые тренажеры с ИИ.

Ключевые фишки проекта:
1. Полный цикл работы оператора. 
Сотрудник колл-центра не просто общается, а выполняет задачи в симуляции «реального» банковского ПО. Он проверяет счета, блокирует и перевыпускает карты, сбрасывает пароли, и.т.д. — все как в реальности.

2. Живой голосовой диалог. 
Взаимодействие с клиентом происходит голосом. ИИ не просто генерирует текст, а проговаривает его, реагируя на слова и вектор беседы оператора.

3. Взаимосвязь действий и диалога. 
Это самая интересная часть системы. При необходимости, можно настроить изменение диалога и поведения клиента в зависимости от совершенных в системе действий, например:
- Если оператор в ПО отправляет клиенту SMS-уведомление, ИИ-клиент его «получает» и тут же упоминает в разговоре.
- Ошибка в проведенной операции (например, ошибочная блокировка карты) сразу меняет контекст беседы: клиент расстраивается, реагирует с недовольством или задает уточняющие вопросы.
- Конечно, возможны и более сложные сценарии, когда клиент «перезванивает через неделю» и продолжает диалог (например, чтобы наглядно продемонстрировать к чему привели ошибки в разговоре, или просто как продолжение сложного.

4. Комплексная оценка. 
Система может фиксировать и оценивать не только то, что сказал оператор, но и что он сделал в интерфейсе, и насколько слаженно прошли оба эти процесса.

За счет такого подхода процесс становится максимально иммерсивыным и позволяет не только получать знания, но и формировать умения, при этом в безопасной среде и без стресса для сотрудника (особенно для новичка).

Что под капотом?
В основе лежат технологии OpenAI: современная языковая модель, преобразование речи в текст и обратно.

Готовый тренажер, при необходимости, упаковывается в SCORM и загружается в любую LMS (статистика передается в LMS точно так же, как в обычном курсе).
(тему о том, что для сложных data-driven проектов будущего нужен xAPI, а не SCORM, оставим на потом)

Сколько это стоит?
Ценообразование в таких проектах — тема отдельного большого разговора.
Если коротко: цена одного диалога зависит от используемых моделей ИИ, его длительности и объема контекстных инструкций для ИИ-персонажа. Чем «умнее» модель, дольше разговор и больше контекст – тем дороже.

В этом конкретном демо-кейсе один диалог обходится примерно в 5 рублей.

Если готовы к небольшим компромиссам – можно снизить цену в 2-3 раза, но все зависит от кейса.

Такой подход создает уникальный гибридный формат обучения. Он находится ровно посередине между стандартным SCORM-курсом, который дает знания, и дорогостоящим тренингом с живым тренером, который дает практику.

Тренажер не заменяет полноценного наставника, но создает безопасную и максимально приближенную к реальности среду, где можно без риска совершать ошибки, отрабатывать сложные сценарии и формировать устойчивые умения, сочетающие в себе и коммуникацию, и работу с цифровыми инструментами.

-----

Это вымышленный кейс.
А о том, как ИИ реально помогает развивать тысячи сотрудников, расскажет руководитель центра по развитию персонала региональной сети и федеральных площадок ПАО «МегаФон» Татьяна Гуськова на конференции Digital Learning 2025!

Когда: 20 ноября 2025 года
Где: Москва, гостиница Аэростар

P.S. Я тоже приеду! Буду рад пообщаться со всеми лично.
🔥14👍75
Media is too big
VIEW IN TELEGRAM
Sora 2: не Google конечно, но зато дешевле

Не так давно экспериментировал с Google Veo 3 — лучшей нейросетью для генерации видео. Качество отличное, но бюджетной ее назвать точно не получится. За 200 долларов вы получаете очень ограниченное количество генераций, которых точно не хватит на месяц работы.

И вот теперь попробовал новую нейросеть для генерации видео — Sora 2 от OpenAI. Она пока находится в режиме неполного доступа: чтобы зарегистрироваться, нужно немного заморочиться — получить инвайт на использование и «релоцироваться» в Канаду или США.

Что я вам скажу:
Да, качество совсем не такое, как у Google, иногда происходит что-то странное, картинка подвисает, вернулась проблема с пальцами (только про нее забыли и перестали шутить), и вообще она прямо по всем показателям хуже.

Но!
Совершенно очевидно, что как только она выйдет из ранних тестов и шумиха немного уляжется, Sora 2, скорее всего, будет доступна подписчикам ChatGPT Plus. А он стоит всего 20$! 20 долларов — и у тебя есть ИИ-конвейер для всех задач, в том числе и видео.

Видео из примера было собрано за 2,5 часа (пришлось немного помонтировать). Каждый кусочек получался адекватным с 3-4 попыток. Но! Попыток дается много*, и совершенно ничего не мешает запустить сразу 4 генерации и просто выбрать хороший вариант (у Google так тоже можно делать, если у тебя прямо очень много денег, а тут достаточно иметь 20$).
*сейчас дается 100 генераций в день, говорят, что на подписке Plus будет меньше, но точных цифр не называют.

HeyGen, генерирующий скучных аватаров, которые уже всем надоели, стоит 29$, а тут всего 20$ + генерация картинок и языковая модель. Чудо просто!
(да, я очень впечатлен ценовой политикой)

Почему такой акцент на цене?
200$ — не та сумма, которую готов выкладывать e-learning-специалист из своего кармана каждый месяц, а вот 20$ – совершенно другая история, вполне можно себе позволить, чтобы сделать контент немного интереснее (да или даже просто «поиграться»).

Да, сегодня приходится выбирать между «круто, но дорого» и «хорошо, но доступно». Как мне кажется, для базовых e-learning-задач второго варианта вполне достаточно.
🔥157👍5❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Помните ваш первый вебинар по e-learning, который вас реально зацепил?

Для меня таким стал вебинар SRC Мультимедиа, где Александр Воробьёв показывал свои кейсы в Articulate Storyline.

Вебинар получился очень крутым с кучей практических советов, многие из которых я использовал в работе.

И вот, 28 октября я иду на вебинар к Александру. Мы поговорим про интеграцию ИИ в SCORM, разберем как можно использовать ИИ в курсах и какие преимущества это дает.

Будет много практических кейсов и интересных решений.

🎯 Подробности, время и регистрация — в анонсе Александра ниже. Переходите по ссылке и записывайтесь!

Буду рад всех видеть 😊
👍7🔥31
Что может искусственный интеллект, если мы разместим его прямо внутри SCORM-пакета и пользователи будут взаимодействовать с ним при прохождении электронного курса?

Обсудим это на 28.10.2025 в 11:00 на вебинаре «Как ИИ внутри SCORM-курса проверяет задания, выступает наставником и формирует умения»

Разберем несколько кейсов реальных возможностей искусственного интеллекта, встроенного в электронный курс:

1️⃣ Как перейти от проверки знаний к проверке понимания материала;

2️⃣ Как сформировать комплексные умения в иммерсивных AI-тренажерах;

3️⃣ Как сделать знания более доступными для всех сотрудников.

Также обсудим:

👉 Может ли ИИ вместо преподавателя быть умным помощником, который выслушивает пользователя и отвечает на все его вопросы по теме курса.

👉 Может ли ИИ в курсе справиться с задачей мотивации процесса обучения.

Удивительно, но все это работает в привычном и стандартном формате SCORM. Вам не нужно менять LMS или подключать сторонние платформы.

Просто загружаете курс в СДО — и он сразу работает со встроенным ИИ-наставником. А дальше вы получаете все данные о взаимодействии с ИИ (прогресс, ответы, аналитику) прямо в вашу LMS.

🔥 Вся мощь искусственного интеллекта в упаковке, которую понимает любая система обучения. Получаем инновации без сложной интеграции 😵‍💫.

Эксперты:
❗️ Алексей Миляев — менеджер проектов по внедрению ИИ-решений в обучении, ПАО «МегаФон».
❗️ Александр Воробьёв — IT/Edtech-предприниматель, SRC Мультимедиа / ARGUMENT.

Приходите, будет интересно.

[Зарегистрироваться на вебинар]
🔥5👍3👏2
HeyGen: Интерактивные AI-аватары для живого общения. На что они способны спустя год?

Видео: демо возможностей HeyGen. Я быстро собрал симулятор собеседования, где ИИ играет роль e-learning специалиста.


Год назад HeyGen анонсировали функцию генерации аватаров в реальном времени. Идея — фантастическая: диалоговый тренажер, где твой виртуальный собеседник выглядит и говорит почти как живой человек. Иммерсивность на максимум.

Правда, тогда это была скорее игрушка: качество и стабильность оставляли желать лучшего. Но за год команда здорово поработала, и сейчас продукт стал гораздо ближе к реальному применению.

Что изменилось в лучшую сторону?

1. Качество и стабильность
Картинка стала намного лучше. Подтормаживания есть, но уже не критичные. Да, всё ещё слышно и видно, что это ИИ, но общее впечатление стало более убедительным.

2. Упрощенная интеграция
Появился режим, похожий на создание агентов в ChatGPT. Загружаешь базу знаний, указываешь ссылки на материалы — и агент готов. Чтобы встроить его на сайт, достаточно скопировать пару строк кода. Идеально для простых консультантов-«болталок».

3. Гибкость через API
Если возможностей из «коробки» не хватает, есть стандартный API. Там аватар становится «говорящей головой», которой ты подаешь готовый текст. Реализация сложнее, но и свобода полная: можно делать диалоговые тренажеры с аналитикой или интегрировать аватара в бизнес-процессы.

Что все еще тормозит?

1. Эффект новизны быстро стирается
Пока записывал демо, успел наиграться. Набор анимаций, жестов и интонаций очень ограничен. Быстро замечаешь повторяющиеся паттерны. Создается впечатление, что для экономии мощностей используются костыли, что бьет по вариативности.

2. Цена для диалогов
Генерация видео стоит от 10 до 20 рублей за минуту. Простой голосовой тренажер на 10 минут обойдется в 10-20 рублей. Если добавить видео — +100 рублей за сессию. Цена вырастает в 5-10 раз. Резонный вопрос: а оно того стоит? Не думаю.

Приятный бонус:
Появились анимированные персонажи! И это, на мой взгляд, ключевое улучшение. Эффект «зловещей долины» (когда почти реалистичный, но неидеальный объект вызывает неприятие) для фотореалистичных аватаров никуда не делся. А с мультяшной графикой мелкие шероховатости смотрятся естественно и не отталкивают.

Ждем, когда цена упадет хотя бы раз в 10 (и немного подкрутят качество) – и будем внедрять 😁
7👍7🔥4👌1
Please open Telegram to view this post
VIEW IN TELEGRAM
Цена реализма: за что мы платим в голосовых ИИ-тренажёрах и без чего можно обойтись

Недавно я показывал пример диалогового тренажёра для сотрудников вымышленного банка.
В нём сотрудник не просто «кликает» в интерфейсе, а реально разговаривает с ИИ-клиентом голосом — тренируя и навыки общения, и работу в ПО.

Итоговая стоимость одного прохождения такого тренажёра — около 5 рублей.

Разберёмся, из чего складывается эта цифра и как её можно уменьшить.

Из чего состоит тренажёр
Весь процесс общения выглядит просто: сотрудник говорит — ИИ отвечает.
Но под капотом работает сразу три модели искусственного интеллекта:

1. Распознавание речи (Speech-to-Text)
Голос сотрудника отправляется в модель, которая переводит речь в текст.
Без этого языковая модель просто не сможет понять, что сказал человек.

2. Обработка смысла (LLM)
Текст запроса идёт в языковую модель (например, GPT-4.1), которая анализирует ситуацию и формирует ответ.

3. Озвучка (Text-to-Speech)
Текстовый ответ снова превращается в голос — и сотрудник слышит реакцию виртуального клиента.

За каждый этап мы платим отдельно.

Конкретика по деньгам
Приведу цены в долларах (расчёт в рублях будет примерно по курсу 1 $ ≈ 100 ₽).
(цены на ИИ меняются чуть ли каждый день, если читаете этот пост спустя пару месяцев после выхода – лучше уточнить актуальные цены)

1. Распознавание речи — Whisper от OpenAI
• Цена: $0,006 / минута (≈ 0,6 ₽)
• Можно удешевить процесс, используя упрощённую версию (например, gpt-4o-mini-transcribe) — она стоит примерно в два раза дешевле, хотя немного теряет в точности.

2. Языковая модель — GPT-4.1
• Цена (по официальным тарифам OpenAI):
• Input — $2 / млн токенов
(ваши слова + технический промпт)
• Cache — $0,5 / млн
(память ИИ о вашем разговоре (ИИ каждый раз перечитывает ваш разговор с самого начала, чтобы дать релевантный ответ))
• Output — $8 / млн
(слова ИИ)
- 1 млн токенов — это примерно 400–500 тыс. слов, или около 1 200 страниц А4.
- Для коротких диалогов используется считанные сотни токенов, так что стоимость обработки одного запроса — доли цента.

💡 Альтернатива:
• GPT-4.1-mini — примерно в 4–5 раз дешевле, при этом для простых сценариев (например, обработать жалобу клиента) качество более чем достаточным.
• DeepSeek V3.2-Exp — ещё более бюджетный вариант. По ощущениям, чуть проще в логике, но в части «понимания» человеческих эмоций местами даже лучше.

3. Озвучка — OpenAI TTS
• Цена: $15 за 1 млн символов (не токенов!) или примерно $0,015 / минута.
• Качество неплохое.

💡 Как можно экономить?
• Рассмотреть альтернативы OpenAI.
У OpenAI не самое лучшее качество на рынке (хотя хорошее), не самые гибкие настройки и не самая бюджетная цена. Серьезной экономии не будет, но вот в качестве и гибкости можно выиграть.
• Озвучка браузером.
Самый дешевый способ – озвучивать текст средствами браузера. В любом браузере есть «говорилка», которая может озвучивать любой текст. Это бесплатно.

Из минусов такого подхода:
- качество озвучки будет ощутимо хуже, чем в современных моделях.
- в разных браузерах разные голоса и их настройки.
Вам придется писать больше кода (проверять каким браузером пользуется ученик и настраивать голос под каждый браузер). Если сотрудники проходят тренажеры с рабочих компьютеров и у всех один и тот же браузер – не большая проблема, а вот если используют свои смартфоны – придется разбираться, как работает вся эта история в браузерах Oppo, Techno и.т.д. и прописывать этот момент специально под них (либо не заморачиваться и смириться с тем фактом, что у кого-то мужчина будет разговаривать женским роботизированным голосом).

Главное не «дешево», а «осознанно»
Цель не в том, чтобы выжать из моделей каждую копейку, а в том, чтобы осознанно выбирать, за что вы платите:
• Мощный TTS — это инвестиция в реализм.
• Мощная LLM вроде GPT-4 — это инвестиция в глубину сценария и качество обратной связи.

Найти баланс между бюджетом и педагогическим эффектом — вот основная задача.
👍6🔥54
Заканчиваем (возможно) с AI-видео: что может Grok Imagine от Илона Маска?

Уже говорил про Veo 3 и Sora 2, пришло время третьего кита американского ИИ-строительства – Grok.


Сравнивать Grok с Veo 3 в генерации реалистичных видео нет смысла, т.к., во-первых, разница в качестве весьма серьезная (а скоро должен выйти Veo 3.1, там обещают просто космические технологии), а во-вторых, и в цене разница принципиальная. А вот в аналоги Sora продукт однозначно записать можно.

Так что лучше, Grok или Sora?

Давайте сравнивать.

🎞️ Качество: 6 «живых» секунд
На мой взгляд, с точки зрения мультяшной анимации Grok сильно выигрывает.
Он лучше:
— Читает стиль и не ломает его от кадра к кадру.
— Анимирует детали, оживляя даже мелочи.
— Движения выходят более живыми и естественными.

Но есть и минус: если Sora может генерировать ролики продолжительностью до 15 секунд, то Grok генерирует только 6 (наверняка долго ждать увеличения продолжительности не придется).

При этом ограничение легко обходится генерацией нового ролика с последнего кадра предыдущего. Сгенерировали 6 секунд -> скопировали последний кадр -> начиная с него генерируем новые 6 секунд (так сделан ролик в шапке). Так же нейросети работают не идеально, часто можно встретить артефакты или просто плохо сгенерированное видео. Вероятность появления проблем в 15 секундах в 2.5 раза больше, чем в 6.

Но все же два реальных минуса в ограничении продолжительности есть:

Если нужен ролик с озвучкой – приходится разбивать реплики на короткие куски. В 6 секунд не так много слов можно уместить;

Техника генерации видео с последнего кадра имеет свои ограничения. Нейросеть «не помнит», что вы генерировали в прошлый раз. Следовательно, каждые 6 секунд вы будете получать случайный голос и случайную генерацию деталей, которых нет в кадре. Во втором ролике как раз показал эти нюансы. 6 секунд заканчиваются, когда персонаж стоит спиной к камере. ИИ «не помнит» лица персонажа и придумывает его сама. Если бы ролик сгенерировали сразу на 15 секунд – таких проблем не было бы.

💵 Цена: чуть дороже, но не критично
Минимальная подписка на Grok стоит 30$, подписка от OpenAI – 20$. Не сказать, что разница существенная, но помимо генерации видео мы в обоих случаях получаем еще и генерацию изображений, и языковую модель. По двум последним параметрам OpenAI, на мой взгляд, выигрывает.

⚖️ Авторские права и дипфейки: полная свобода (почти)
В Sora есть неприятные ограничения:
- нельзя генерировать известных персонажей, правообладатели которых запретили это делать;
- запрещено анимировать реальных людей (есть список исключений + можно верифицировать себя через приложение – и тогда ролики с собой можно будет делать).

Если первое ограничение никак не мешает в работе (мы же не будем делать курсы с Человеком-пауком), то второе весьма неприятно.

В Grok таких проблем нет – генерируй все что хочешь.

🎭 Дополнительные фишки: Normal, Fun и... Spicy
Помимо стандартного режима, в котором ты пишешь промпт и получаешь видео, есть еще три дополнительных:

- Normal. Нейросеть анализирует, что изображено на картинке, и пытается придумать адекватный сюжет на 6 секунд. Пользы режима я не понял.

- Fun. Здесь ИИ пытается придумать что-то максимально глупое и смешное. Чаще всего (почти всегда) получается ерунда, но можно подсмотреть интересные идеи по анимации деталей.

- Spicy. Ну, вы понимаете… Другие нейросети отказываются генерировать – а тут отдельный режим. Под «спайси» подразумевается что-то на уровне «Спасателей Малибу».
Прямого применения в e-learning, конечно, нет, но этот факт отлично демонстрирует главное — идеологическую свободу платформы.
(а вот маркетплейсы, наверняка, скоро заполнят толпы «девушек», бегущих по пляжам в замедленном режиме)

Итог
Grok — это не про реализм, а про креатив.
За сравнительно небольшой бюджет он позволяет делать видео, которые цепляют.
Пусть пока 6 секунд, но эти 6 секунд живее, чем 15 у Sora.

Для e-learning — идеальный баланс: быстро, недорого, ярко.
👍113🔥3