Передаем привет с площадки Russia Risk Conference 2024 — мы же всё-таки банкиры, не только ИИ развиваем, но и о рисках думаем. Работа такая:)
За экспертным столом встретились лидеры ИИ в финансах и телекоме. На площадке замечены:
- Юлий Шамаев, ВТБ
- Александр Дьяконов, Т-банк
- Евгений Смирнов, Альфа-Банк
- Никита Зелинский, МТС
- Сергей Афанасьев, Сбер
- Николай Филипенков, Т2.
Модерировал Руслан Морозов (Сбер).
О чем говорили? О галлюцинациях в моделях, которые могут не учесть тот или иной риск; о том, как важно правильно размечать датасеты; о том, может ли ИИ-модель составить психологический портрет человека по фото. Под конец эксперты признались, какую модель используют чаще всего. Особенно нам понравился ответ Александра Дьяконова — о том, использовать нужно все доступные модели. И риски хеджируются, и интереснее.
За экспертным столом встретились лидеры ИИ в финансах и телекоме. На площадке замечены:
- Юлий Шамаев, ВТБ
- Александр Дьяконов, Т-банк
- Евгений Смирнов, Альфа-Банк
- Никита Зелинский, МТС
- Сергей Афанасьев, Сбер
- Николай Филипенков, Т2.
Модерировал Руслан Морозов (Сбер).
О чем говорили? О галлюцинациях в моделях, которые могут не учесть тот или иной риск; о том, как важно правильно размечать датасеты; о том, может ли ИИ-модель составить психологический портрет человека по фото. Под конец эксперты признались, какую модель используют чаще всего. Особенно нам понравился ответ Александра Дьяконова — о том, использовать нужно все доступные модели. И риски хеджируются, и интереснее.
🔥8👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Очень насыщенная личным опытом дискуссия об этике и регулировании искусственного интеллекта сегодня прошла в Центре событий РБК на форуме РБК Tech. Запись в свободном доступе — посмотреть можно вот здесь. Кто беседовал:
Иван Оселедец, доктор физико-математических наук, профессор РАН, генеральный директор Института AIRI, профессор Сколтеха
Антон Исправников, начальник управления моделирования РБ ДАДМ
Иван Хворов, директор программы SKOLKOVO MBA
Дмитрий Марков, исполнительный директор, MTS AI
Сергей Марин, директор и основатель ООО «Студия Данных»
Данила Медведев, российский футуролог, популяризатор науки.
Антон, кстати, обладатель самых классных носков среди спикеров, рассказал, что у нас в ВТБ все модели перед выходом на рынок долго обкатывают сами сотрудники. А еще — поделился опасениями, что ограничения ИИ станут сдерживающим фактором для разработчиков.
Если вам интересна тема этики и перспектив госрегулирования языковых моделей и рекомендательных систем — обязательно к просмотру.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤3😁2
Как разрабатывалась модель, которая верифицирует личность клиента в контакт-центре? Что такое "голосовой слепок" и может ли модель сформировать его для незнакомого ей человека? Как решались главные проблемы распознавания голоса — шум, перебои в связи, эхо?
Обо всем этом на конференции "Антифрод в финансовых организациях" рассказал Иван Дуля, старший аналитик данных в команде "Модели антифрод". Иван заслуженно вошел в топ лучших спикеров конференции, а мы с удовольствием делимся с вами презентацией и записью его выступления.
Лайк не поставят только мошенники.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14❤3👍1👏1
Сходили (пешком) в гости к YandexGo на TechTalk 🚕
Делимся основными тейками из доклада Дили Хакимовой "Мифы об A/B-тестировании в ML". Поговорили об ошибках первого и второго рода, сложностях бакетной агрегации данных и особенностях данных в сезонном бизнесе. Было много математики и практики — все то, что мы любим💙
Миф 1. Данные независимы. На самом деле у пользователей повторяются маршруты, время и категория ТС в заказах.
Миф 2. T-тест можно использовать только на нормальных данных. На самом деле даже небольшого количества наблюдений достаточно, чтобы найти асимптоту. ЦПТ в помощь.
Миф 3. T-тест чувствителен к выбросам — убери их, и все будет хорошо. Выбросы могут быть процессом.
Миф 4. Мощность данных в районе 80% — это норм. На самом деле такая мощность в реальных данных встречается редко.
Миф 5. На "серые" метрики не стоит обращать внимания. Они могут быть частью эффекта эксперимента.
Миф 6. U-критерий подходит для проверки равенства средних и медиан. На самом деле проблема критерия Манна-Уитни — он сравнивает распределения, поэтому прокрашивает чаще других критериев и не показывает падение среднего. Для бизнеса игнорировать среднее нельзя.
Миф 7. Если целевая метрика прокрасилась, можно бежать раскатывать фичу. Подглядывая, мы сильно повышаем ошибку первого рода. Находим эффект там, где его нет.
Миф 8. Чем больше метрик проверяется в ходе эксперимента, тем лучше. Нет — метрики не просто могут прокраситься случайно, но они еще и прокрашиваются зависимо друг от друга, и это повышает вероятность ошибки первого рода.
Миф 9. Метрики медиан (квантили) можно считать только бутстрапом. Есть статья, в которой приведены аналитические формулы.
Миф 10. Если выборка маленькая, бутстрап поможет. Базовое предположение бутстрапа, что данные являются хорошим представителем генеральной совокупности.
Миф 11. Для расчета метрик отношения можно перейти к поюзерному отношению. Это неверно: пользователи неравномерно пользуются сервисом, есть heavy-юзеры, есть эпизодические пользователи. Взвесить всех "одинаково" нельзя. Эта метрика может быть не сонаправлена с исходной.
Спасибо команде DS YandexGo за гостеприимство и классный доклад! Тоже ждем вас в гости🔥
Делимся основными тейками из доклада Дили Хакимовой "Мифы об A/B-тестировании в ML". Поговорили об ошибках первого и второго рода, сложностях бакетной агрегации данных и особенностях данных в сезонном бизнесе. Было много математики и практики — все то, что мы любим
Миф 1. Данные независимы. На самом деле у пользователей повторяются маршруты, время и категория ТС в заказах.
Миф 2. T-тест можно использовать только на нормальных данных. На самом деле даже небольшого количества наблюдений достаточно, чтобы найти асимптоту. ЦПТ в помощь.
Миф 3. T-тест чувствителен к выбросам — убери их, и все будет хорошо. Выбросы могут быть процессом.
Миф 4. Мощность данных в районе 80% — это норм. На самом деле такая мощность в реальных данных встречается редко.
Миф 5. На "серые" метрики не стоит обращать внимания. Они могут быть частью эффекта эксперимента.
Миф 6. U-критерий подходит для проверки равенства средних и медиан. На самом деле проблема критерия Манна-Уитни — он сравнивает распределения, поэтому прокрашивает чаще других критериев и не показывает падение среднего. Для бизнеса игнорировать среднее нельзя.
Миф 7. Если целевая метрика прокрасилась, можно бежать раскатывать фичу. Подглядывая, мы сильно повышаем ошибку первого рода. Находим эффект там, где его нет.
Миф 8. Чем больше метрик проверяется в ходе эксперимента, тем лучше. Нет — метрики не просто могут прокраситься случайно, но они еще и прокрашиваются зависимо друг от друга, и это повышает вероятность ошибки первого рода.
Миф 9. Метрики медиан (квантили) можно считать только бутстрапом. Есть статья, в которой приведены аналитические формулы.
Миф 10. Если выборка маленькая, бутстрап поможет. Базовое предположение бутстрапа, что данные являются хорошим представителем генеральной совокупности.
Миф 11. Для расчета метрик отношения можно перейти к поюзерному отношению. Это неверно: пользователи неравномерно пользуются сервисом, есть heavy-юзеры, есть эпизодические пользователи. Взвесить всех "одинаково" нельзя. Эта метрика может быть не сонаправлена с исходной.
Спасибо команде DS YandexGo за гостеприимство и классный доклад! Тоже ждем вас в гости
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8❤4💯4👍1
Вчера на нашем ComDS, несмотря на дождь и ураган за окном, было жарко 🔥
ComDS — это неформальные встречи data science-сообщества ВТБ: мы делимся друг с другом экспертизой, приглашаем внешних гостей и обмениваемся опытом команд. На этот раз в программе было целых три классных доклада и продуктивный (см. фото 4) нетворкинг за пиццей. О чем говорили спикеры:
- о ML в ride-hailing платформах. Руководитель службы ML в Яндекс.Такси Александр Мамаев убедил нас в прозрачности ценообразования поездок и поделился необычными кейсами применения алгоритмов машинного обучения внутри сервиса.
- о миграции широкой витрины по клиенту на новое хранилище рассказал IT-лид в стриме моделирования РБ Максим Скаржинец. Как обычно, план был прост и понятен, реальность оказалась чуть сложнее 😅
- Об автоматизации обработки отчетности РСБУ. Андрей Ходяков, директор управления моделирования КИБ и СМБ, рассказал, как команде удается оцифровывать с помощью алгоритмов 100 тысяч документов в год.
В следующий раз поставим в зоне фуршета флипчарт 😅 Если вы хотите присоединиться к нашим встречам и тоже рассказать о своем кейсе — будем рады!
ComDS — это неформальные встречи data science-сообщества ВТБ: мы делимся друг с другом экспертизой, приглашаем внешних гостей и обмениваемся опытом команд. На этот раз в программе было целых три классных доклада и продуктивный (см. фото 4) нетворкинг за пиццей. О чем говорили спикеры:
- о ML в ride-hailing платформах. Руководитель службы ML в Яндекс.Такси Александр Мамаев убедил нас в прозрачности ценообразования поездок и поделился необычными кейсами применения алгоритмов машинного обучения внутри сервиса.
- о миграции широкой витрины по клиенту на новое хранилище рассказал IT-лид в стриме моделирования РБ Максим Скаржинец. Как обычно, план был прост и понятен, реальность оказалась чуть сложнее 😅
- Об автоматизации обработки отчетности РСБУ. Андрей Ходяков, директор управления моделирования КИБ и СМБ, рассказал, как команде удается оцифровывать с помощью алгоритмов 100 тысяч документов в год.
В следующий раз поставим в зоне фуршета флипчарт 😅 Если вы хотите присоединиться к нашим встречам и тоже рассказать о своем кейсе — будем рады!
🔥8❤1
🫖 Первый выпуск нового сезона подкаста «Деньги любят техно» уже доступен на всех платформах
Хотя на дворе еще осень, мы уже начинаем активную подготовку к конференции Data Fusion. На этот раз решили поближе познакомиться с теми людьми, на плечах которых стоит отечественная наука о данных. Эта идея легла в основу нашего специального сезона «Лица Data Fusion».
Формат сезона тоже новый: заместитель руководителя департамента анализа данных и моделирования ВТБ Денис Суржко общается с гостями за чашкой ароматного чая. Говорят, что совместное чаепитие — лучший способ настроиться на единое пространство смыслов и идей.
Герой первого эпизода нового сезона — доктор физико-математических наук, профессор РАН, генеральный директор института AIRI, профессор «Сколтеха» и друг конференции Data Fusion Иван Оселедец. Говорим о современных ученых, работе с людьми и будущем, которое уже невозможно представить себе без ИИ.
Старт нового сезона — это всегда волнительно. Пожалуйста, поддержите нас лайком и комментарием!
🔹 Смотреть подкаст в VK
🔹 Смотреть подкаст на Rutube
🔹 Слушать аудиоверсию на всех площадках
Хотя на дворе еще осень, мы уже начинаем активную подготовку к конференции Data Fusion. На этот раз решили поближе познакомиться с теми людьми, на плечах которых стоит отечественная наука о данных. Эта идея легла в основу нашего специального сезона «Лица Data Fusion».
Формат сезона тоже новый: заместитель руководителя департамента анализа данных и моделирования ВТБ Денис Суржко общается с гостями за чашкой ароматного чая. Говорят, что совместное чаепитие — лучший способ настроиться на единое пространство смыслов и идей.
Герой первого эпизода нового сезона — доктор физико-математических наук, профессор РАН, генеральный директор института AIRI, профессор «Сколтеха» и друг конференции Data Fusion Иван Оселедец. Говорим о современных ученых, работе с людьми и будущем, которое уже невозможно представить себе без ИИ.
Старт нового сезона — это всегда волнительно. Пожалуйста, поддержите нас лайком и комментарием!
🔹 Смотреть подкаст в VK
🔹 Смотреть подкаст на Rutube
🔹 Слушать аудиоверсию на всех площадках
🔥11❤5👏3
Мама, мы на всероссе
В этом году уже в четвертый раз прошла всероссийская олимпиада школьников по искусственному интеллекту: ВТБ стал партнером проекта и подготовил для школьников собственную задачу по геоаналитике. В соревновании могли участвовать ученики 8-11 классов, два этапа олимпиады проходили онлайн, а на третий, очный, ребята собрались в подмосковном Долгопрудном — в кампусе МФТИ.
Здесь-то и началась настоящая схватка за дипломы🎯 После решения задач финалистам было не до отдыха — о том, как ИИ реально работает и применяется в бизнесе, им рассказывали представители топовых российских data-driven компаний. Честь ВТБ перед олимпиадниками защищал Алексей Пустынников, Team Lead DS в управлении моделирования партнерств и ИТ-процессов: Леша сам занимается в банке геоаналитикой и успешно решает ту самую задачу со звездочкой каждый день.
Всего на ИИ-олимпиаде этого года — 12 победителей и призеров. Мы желаем всем участникам блестящих образовательных и карьерных успехов и обязательно ждем на стажировки в наши ds-команды. А вот здесь страница с заданиями и материалами олимпиады прошлых лет — попробуйте решить сходу.
С олимпиадника по лайку — проверим, сколько нас🔷
В этом году уже в четвертый раз прошла всероссийская олимпиада школьников по искусственному интеллекту: ВТБ стал партнером проекта и подготовил для школьников собственную задачу по геоаналитике. В соревновании могли участвовать ученики 8-11 классов, два этапа олимпиады проходили онлайн, а на третий, очный, ребята собрались в подмосковном Долгопрудном — в кампусе МФТИ.
Здесь-то и началась настоящая схватка за дипломы
Всего на ИИ-олимпиаде этого года — 12 победителей и призеров. Мы желаем всем участникам блестящих образовательных и карьерных успехов и обязательно ждем на стажировки в наши ds-команды. А вот здесь страница с заданиями и материалами олимпиады прошлых лет — попробуйте решить сходу.
С олимпиадника по лайку — проверим, сколько нас
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11❤8💯5👍2
⚡️ Новый выпуск подкаста «Деньги любят техно» — о телекоме и демократизации ИИ
Продолжаем общаться с лидерами отраслевых data-driven компаний и обсуждать с ними принципы построения ds-команд и особенности задач в их сфере.
В новом выпуске сезона Data Science беседуем с директором по искусственному интеллекту и цифровым продуктам «Билайна», генеральным директором «МедТех ИИ» Константином Романовым. Обсудили, как ИИ завоевывает себе пространство в поле среднего и малого бизнеса, как телеком решает задачу геоаналитики и пробует масштабироваться, а также затронули сферу медтеха и социальной ответственности бизнеса.
За живое обсуждение и практические вопросы по традиции отвечали начальник управления моделирования партнерств и ИТ-процессов ВТБ Юлий Шамаев и технологический обозреватель Марина Эфендиева.
Смотреть в VK
Слушать на всех аудиоплатформах
Продолжаем общаться с лидерами отраслевых data-driven компаний и обсуждать с ними принципы построения ds-команд и особенности задач в их сфере.
В новом выпуске сезона Data Science беседуем с директором по искусственному интеллекту и цифровым продуктам «Билайна», генеральным директором «МедТех ИИ» Константином Романовым. Обсудили, как ИИ завоевывает себе пространство в поле среднего и малого бизнеса, как телеком решает задачу геоаналитики и пробует масштабироваться, а также затронули сферу медтеха и социальной ответственности бизнеса.
За живое обсуждение и практические вопросы по традиции отвечали начальник управления моделирования партнерств и ИТ-процессов ВТБ Юлий Шамаев и технологический обозреватель Марина Эфендиева.
Смотреть в VK
Слушать на всех аудиоплатформах
🔥6❤4🐳2👍1
Community + DS = ComDS 💚
Такая вот у нас математика! 4 декабря мы собрались все вместе на последний в этом году митап нашего внутреннего сообщества ComDS. В преддверии праздника не обошлось без подарков: награды получили самые активные участники и спикеры сообщества. Кстати, число участников нашего коммьюнити прямо на мероприятии перевалило за 200 😄
С мини-лекциями о своих ds-итогах года и трендах на будущий выступили друзья нашего сообщества: Chief DS МТС Никита Зелинский, руководитель службы ML Яндекс.Такси Александр Мамаев, руководитель направления ранжирования и навигации Lamoda Tech Дмитрий Малахов и руководитель научной группы Института искусственного интеллекта МГУ Юрий Дорн.
После этого всех ждал уже полюбившийся нашему коммьюнити DS-квиз по всем правилам командных интеллектуальных игр, и здесь на равных пришлось попотеть и гостям, и спикерам.
Но этот маленький праздник уже позади. А впереди у нас — новый год: еще больше встреч, выступлений, обмена опытом, новых знакомств и впечатляющих результатов.
Спасибо, что провели этот год вместе с нашим сообществом. До новых встреч!
Ваше Наше ComDS 🎁
Такая вот у нас математика! 4 декабря мы собрались все вместе на последний в этом году митап нашего внутреннего сообщества ComDS. В преддверии праздника не обошлось без подарков: награды получили самые активные участники и спикеры сообщества. Кстати, число участников нашего коммьюнити прямо на мероприятии перевалило за 200 😄
С мини-лекциями о своих ds-итогах года и трендах на будущий выступили друзья нашего сообщества: Chief DS МТС Никита Зелинский, руководитель службы ML Яндекс.Такси Александр Мамаев, руководитель направления ранжирования и навигации Lamoda Tech Дмитрий Малахов и руководитель научной группы Института искусственного интеллекта МГУ Юрий Дорн.
После этого всех ждал уже полюбившийся нашему коммьюнити DS-квиз по всем правилам командных интеллектуальных игр, и здесь на равных пришлось попотеть и гостям, и спикерам.
Но этот маленький праздник уже позади. А впереди у нас — новый год: еще больше встреч, выступлений, обмена опытом, новых знакомств и впечатляющих результатов.
Спасибо, что провели этот год вместе с нашим сообществом. До новых встреч!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥6🥰6