Даниил Дранга - Дебаты: Fullstack Data Scientist или DS & Machine Learning Engineer — cтоит ли разделять роли?
3-4 июня - Секция Reliable ML на Data Fest 2023
Во время Data Fest 2023 на нашей секции Reliable ML Даниил Дранга, Data Science Community Lead, Райффайзен Банк, проведет дебаты «Fullstack Data Scientist или DS & Machine Learning Engineer». Поспорим о том, когда и стоит ли разделять эти роли и как организовать их взаимодействие.
Именно эту тему вы, как читатели канала, выбрали как наиболее интересную новую тему для обсуждения в 2023 г.
2 спикера, 4 раунда, по 2 минуты на аргументы в каждом раунде и голосование зрителей. В конце сессии будет возможность задать свои вопросы относительно той или иной позиции. Присоединяйтесь!
Спикеры:
Виктор Кантор – Big Data Director, МТС
Дмитрий Жванский – Expert Data Scientist, Райффайзен Банк
Регистрация на мероприятие тут.
Расписание будет опубликовано 1 июня.
Ваш @Reliable ML
#анонс #business #activity #organisational_design #datafest2023
3-4 июня - Секция Reliable ML на Data Fest 2023
Во время Data Fest 2023 на нашей секции Reliable ML Даниил Дранга, Data Science Community Lead, Райффайзен Банк, проведет дебаты «Fullstack Data Scientist или DS & Machine Learning Engineer». Поспорим о том, когда и стоит ли разделять эти роли и как организовать их взаимодействие.
Именно эту тему вы, как читатели канала, выбрали как наиболее интересную новую тему для обсуждения в 2023 г.
2 спикера, 4 раунда, по 2 минуты на аргументы в каждом раунде и голосование зрителей. В конце сессии будет возможность задать свои вопросы относительно той или иной позиции. Присоединяйтесь!
Спикеры:
Виктор Кантор – Big Data Director, МТС
Дмитрий Жванский – Expert Data Scientist, Райффайзен Банк
Регистрация на мероприятие тут.
Расписание будет опубликовано 1 июня.
Ваш @Reliable ML
#анонс #business #activity #organisational_design #datafest2023
🔥25❤3👍3
Дмитрий Раевский - FailConf - DS: почему бывает так больно
3-4 июня - Секция Reliable ML на Data Fest 2023
Во время Data Fest 2023 на нашей секции Reliable ML Дмитрий Раевский, Data Science Lead в Райффайзен Банке, проведёт небольшой FailConf про разные боли в жизни DS.
В рамках фейл-сессии мы рассмотрим несколько реальных проектов, которые не дошли до прода или дошли с рядом значительных переработок, подпортив жизнь и кровь всем причастным.
Количество проектов, уповающих на использовани AI, постоянно растет – бизнес рассчитывает на нереальный буст за счет магической силы DS.
Но что, если данных недостаточно для решения задачи? Или мы не учли реальный сценарий использования нашей модели в проде, из-за чего пришлось все делать заново? Или бизнес-цель поняли в корне неверно, а потому решали другую задачу?
Мы обсудим подобные примеры и постараемся ответить на вопрос: “Как можно избежать таких ситуаций, чтобы не было мучительно больно”.
Регистрация на мероприятие тут.
Расписание будет опубликовано 1 июня.
Ваш @Reliable ML
#анонс #tech #activity #ml_system_design #datafest2023
3-4 июня - Секция Reliable ML на Data Fest 2023
Во время Data Fest 2023 на нашей секции Reliable ML Дмитрий Раевский, Data Science Lead в Райффайзен Банке, проведёт небольшой FailConf про разные боли в жизни DS.
В рамках фейл-сессии мы рассмотрим несколько реальных проектов, которые не дошли до прода или дошли с рядом значительных переработок, подпортив жизнь и кровь всем причастным.
Количество проектов, уповающих на использовани AI, постоянно растет – бизнес рассчитывает на нереальный буст за счет магической силы DS.
Но что, если данных недостаточно для решения задачи? Или мы не учли реальный сценарий использования нашей модели в проде, из-за чего пришлось все делать заново? Или бизнес-цель поняли в корне неверно, а потому решали другую задачу?
Мы обсудим подобные примеры и постараемся ответить на вопрос: “Как можно избежать таких ситуаций, чтобы не было мучительно больно”.
Регистрация на мероприятие тут.
Расписание будет опубликовано 1 июня.
Ваш @Reliable ML
#анонс #tech #activity #ml_system_design #datafest2023
🔥17👍5❤2
Валерий Бабушкин - Метрики и функции потерь при дизайне систем машинного обучения
3-4 июня - Секция Reliable ML на Data Fest 2023
Во время Data Fest 2023 на нашей секции Reliable ML выступит Валерий Бабушкин, автор книги Machine Learning System Design и автор тг-канала Время Валеры.
В своем докладе Валерий расскажет, почему не любит писать анонсы, как просит Ира, а также про метрики и функции потерь при дизайне систем машинного обучения.
Регистрация на мероприятие тут.
Расписание будет опубликовано 1 июня.
Ваш @Reliable ML
#анонс #tech #ml_system_design #datafest2023
3-4 июня - Секция Reliable ML на Data Fest 2023
Во время Data Fest 2023 на нашей секции Reliable ML выступит Валерий Бабушкин, автор книги Machine Learning System Design и автор тг-канала Время Валеры.
В своем докладе Валерий расскажет, почему не любит писать анонсы, как просит Ира, а также про метрики и функции потерь при дизайне систем машинного обучения.
Регистрация на мероприятие тут.
Расписание будет опубликовано 1 июня.
Ваш @Reliable ML
#анонс #tech #ml_system_design #datafest2023
🗿21🔥12👍6🤮6🆒5💅3😇2❤1
Расписание секции Reliable ML - 3-4 июня
Data Fest 2023
Дорогие друзья, мы рады, наконец, опубликовать долгожданное расписание нашей секции Reliable ML, которая пройдет уже в эти выходные - 3-4 июня! Всех очень ждем!
Что будет
Первый день секции - 3 июня - практически полностью посвящен теме ML System Design. Будем слушать и обсуждать практические кейсы дизайна и построения ML систем: успешные внедрения, фейлы и уроки из них, фреймворки и рекомендации от экспертов. В этот день также стартует контест ML System Design Doc Challenge.
Второй день секции - 4 июня - ориентирован на темы Interpretable ML, Causal Inference in ML, Data Centric AI. Завершим день и всю секцию финалом контеста ML System Design Doc Challenge. Участники презентуют свои решения, а зрители и менторы совместно определят победителей.
Как подключиться
- Заходите в спейс по ссылке https://app.spatial.chat/s/ods
- Вбиваете пароль festparroteverywhere23
- Вбиваете свои ник и должность, разрешаете браузеру доступ к микрофону и видео - и вуаля! 😊
Всех очень ждем!
Ваш @Reliable ML
#расписание #business #tech #datafest2023
Data Fest 2023
Дорогие друзья, мы рады, наконец, опубликовать долгожданное расписание нашей секции Reliable ML, которая пройдет уже в эти выходные - 3-4 июня! Всех очень ждем!
Что будет
Первый день секции - 3 июня - практически полностью посвящен теме ML System Design. Будем слушать и обсуждать практические кейсы дизайна и построения ML систем: успешные внедрения, фейлы и уроки из них, фреймворки и рекомендации от экспертов. В этот день также стартует контест ML System Design Doc Challenge.
Второй день секции - 4 июня - ориентирован на темы Interpretable ML, Causal Inference in ML, Data Centric AI. Завершим день и всю секцию финалом контеста ML System Design Doc Challenge. Участники презентуют свои решения, а зрители и менторы совместно определят победителей.
Как подключиться
- Заходите в спейс по ссылке https://app.spatial.chat/s/ods
- Вбиваете пароль festparroteverywhere23
- Вбиваете свои ник и должность, разрешаете браузеру доступ к микрофону и видео - и вуаля! 😊
Всех очень ждем!
Ваш @Reliable ML
#расписание #business #tech #datafest2023
🔥15👍6🤩1🍾1
Всех ждем сегодня в spatial chat!
Скоро начинаем!
Как подключиться
- Заходите в спейс по ссылке https://app.spatial.chat/s/ods
- Вбиваете пароль festparroteverywhere23
- Вбиваете свои ник и должность, разрешаете браузеру доступ к микрофону и видео
- Идем в комнату Reliable ML
Скоро начинаем!
Как подключиться
- Заходите в спейс по ссылке https://app.spatial.chat/s/ods
- Вбиваете пароль festparroteverywhere23
- Вбиваете свои ник и должность, разрешаете браузеру доступ к микрофону и видео
- Идем в комнату Reliable ML
👍7❤3🔥1
Трансляция первого дня секции Reliable ML сегодня доступна также на youtube.
https://www.youtube.com/watch?v=oaRIDDBVDuc
https://www.youtube.com/watch?v=oaRIDDBVDuc
YouTube
Data Fest 2023, день 15: online из spatial.chat
В последнюю субботу Data Fest 2023 в spatial.chat участников Феста ждет много всего крутого!
На этом стриме с 10:00 до 19:30 по Московскому времени будет идти трансляция Reliable ML. Основные активности, вопросы, и личное общение будут происходить в spatial.chat…
На этом стриме с 10:00 до 19:30 по Московскому времени будет идти трансляция Reliable ML. Основные активности, вопросы, и личное общение будут происходить в spatial.chat…
❤19👍4🔥1
4 июня - продолжение секции Reliable ML на Data Fest 2023
Скоро начинаем!
Сегодня будем говорить об Interpretable ML, Causal Inference in ML, Data Centric AI. Завершим день и всю секцию финалом контеста ML System Design Doc Challenge. Участники презентуют свои решения, а зрители и менторы определят победителей.
Как подключиться
- Открываете браузер Chrome (остальные тоже работают, но не всегда)
- Заходите в спейс по ссылке https://app.spatial.chat/s/ods
- Вбиваете пароль festparroteverywhere23
- Вбиваете свои ник и должность, разрешаете браузеру доступ к микрофону и видео
- Идете в комнату Reliable ML
Всех очень ждем!
Ваш @Reliable ML
Скоро начинаем!
Сегодня будем говорить об Interpretable ML, Causal Inference in ML, Data Centric AI. Завершим день и всю секцию финалом контеста ML System Design Doc Challenge. Участники презентуют свои решения, а зрители и менторы определят победителей.
Как подключиться
- Открываете браузер Chrome (остальные тоже работают, но не всегда)
- Заходите в спейс по ссылке https://app.spatial.chat/s/ods
- Вбиваете пароль festparroteverywhere23
- Вбиваете свои ник и должность, разрешаете браузеру доступ к микрофону и видео
- Идете в комнату Reliable ML
Всех очень ждем!
Ваш @Reliable ML
🔥10👍2
Вакансии в Raiffeisenbank Operations
По следам предшествующего поста
Всем привет!
Итоги предыдущего поста про вакансии показали, что нас читают очень профессиональные и компетентные люди, вовлеченные в аналитику данных. И часть из них уже с нами :)
Хочу снова поделиться с вами интересными вакансиями в мою команду – предложить вам принять участие в построении Advanced Analytics and Data Management Department в Операционном блоке Райффайзенбанка.
Ниже краткое описание к каждой вакансии, подробнее – можно почитать по ссылкам. Откликаться лучше ко мне в тг (@irina_goloshchapova) – с заголовком, на какую позицию откликаетесь.
- Middle+/Senior Data Analyst – на задачи аналитики, отчетности и исследований в направления Corporate и Retail Operations.
- Senior Data Scientist – на задачи управления эффективностью наличных денежных средств и антифрода.
- Tech Lead Advanced Analytics Team – по сути – Head of Data Science & Data Analytics для нашей замечательной команды аналитиков и data саентистов.
- Product Owner Data Management Team – вести команду по развитию дата-сервисов для аналитики в домене.
#анонс #career
По следам предшествующего поста
Всем привет!
Итоги предыдущего поста про вакансии показали, что нас читают очень профессиональные и компетентные люди, вовлеченные в аналитику данных. И часть из них уже с нами :)
Хочу снова поделиться с вами интересными вакансиями в мою команду – предложить вам принять участие в построении Advanced Analytics and Data Management Department в Операционном блоке Райффайзенбанка.
Ниже краткое описание к каждой вакансии, подробнее – можно почитать по ссылкам. Откликаться лучше ко мне в тг (@irina_goloshchapova) – с заголовком, на какую позицию откликаетесь.
- Middle+/Senior Data Analyst – на задачи аналитики, отчетности и исследований в направления Corporate и Retail Operations.
- Senior Data Scientist – на задачи управления эффективностью наличных денежных средств и антифрода.
- Tech Lead Advanced Analytics Team – по сути – Head of Data Science & Data Analytics для нашей замечательной команды аналитиков и data саентистов.
- Product Owner Data Management Team – вести команду по развитию дата-сервисов для аналитики в домене.
#анонс #career
🔥27👍4❤2👎2
Новый запуск курса по ML System Design в августе 2023
Собрали программу и примерное расписание нового запуска курса по ML System Design https://kolodezev.ru/mlsystemdesign2023.html
Содержание будет обновлено более чем наполовину. Будет добавлен раздел про вывод языковых моделей в продуктовое окружение. Скорее всего, будут еще материалы про тестирование и риски, дополнительные материалы про устойчивость и переработанное введение в ML Design Doc.
Есть возможность повлиять на содержание - напишите в комментариях, о чем хотелось бы услышать, чего не хватило на прошлом запуске курса.
Курс будет осенью, онлайн, бесплатно, анонсы будут в этом канале.
Ваш @Reliable ML
#анонс #ml_system_design
Собрали программу и примерное расписание нового запуска курса по ML System Design https://kolodezev.ru/mlsystemdesign2023.html
Содержание будет обновлено более чем наполовину. Будет добавлен раздел про вывод языковых моделей в продуктовое окружение. Скорее всего, будут еще материалы про тестирование и риски, дополнительные материалы про устойчивость и переработанное введение в ML Design Doc.
Есть возможность повлиять на содержание - напишите в комментариях, о чем хотелось бы услышать, чего не хватило на прошлом запуске курса.
Курс будет осенью, онлайн, бесплатно, анонсы будут в этом канале.
Ваш @Reliable ML
#анонс #ml_system_design
🔥63👍14❤6👏2
Дата ужин Reliable ML 28.06
Почему бы и нет?
Всем привет! Задумали мы тут с Димой дата-ужин в Мск провести, и рассказать вам об этом даже заранее, в выходные.
Но как-то отложился анонс с выходных :)
Поэтому решили брать внезапностью! Если кому интересно завтра с нами пообщаться о Reliable или даже UnReliable ML, то заходите сюда. Мы планируем быть с 18:30 до 21:00.
Расскажем про задумки на сентябрь :)
P.S. Если действительно готовы прийти, то поставьте, пожалуйста, 💯 - нам было бы очень полезно понимать примерное количество людей 😊
Ваш @Reliable ML
#анонс #дата_ужин
Почему бы и нет?
Всем привет! Задумали мы тут с Димой дата-ужин в Мск провести, и рассказать вам об этом даже заранее, в выходные.
Но как-то отложился анонс с выходных :)
Поэтому решили брать внезапностью! Если кому интересно завтра с нами пообщаться о Reliable или даже UnReliable ML, то заходите сюда. Мы планируем быть с 18:30 до 21:00.
Расскажем про задумки на сентябрь :)
P.S. Если действительно готовы прийти, то поставьте, пожалуйста, 💯 - нам было бы очень полезно понимать примерное количество людей 😊
Ваш @Reliable ML
#анонс #дата_ужин
💯10🔥8👍7❤1
Видеозаписи докладов - Reliable ML - 3 июня 2023 - Data Fest Online
Видео и презентации докладов первого дня секции
Опубликованы видео и презентации докладов первого дня секции Reliable ML на Data Fest Online 2023. День был посвящен докладам по теме ML System Design. Можно смотреть, пересматривать и наслаждаться! 😊
Все доклады, их описания и презентации можно найти на сайте ODS.ai, а также в плейлисте на YouTube.
Ссылки отдельно по докладам:
- Евгений Финогеев - Автоматизация заведения новых товаров на маркетплейс с использованием ML (видео, презентация)
- Михаил Масагутов - Опыт составления дизайн документа при проектировании ML системы: прогнозирование продаж в магазинах (видео, презентация, диздок)
- Любава Ткаченко - Опыт составления дизайн документа при проектировании ML системы: сервис для кластеризации магазинов (видео, презентация, диздок опубликуем в репозитории чуть позже)
- Андрей Денисенко - Как построить real-time ML на криптобирже (видео, презентация)
- Максим Берёзов - Алгоритм маршрутизации без компромисса между качеством и скоростью (видео, презентация)
- Павел Филонов - Паттерны инференса ML-моделей (видео, презентация)
- Павел Филонов - Тестовое ML System Design Interview (видео, материалы)
- Дмитрий Колодезев - Reliable ML: Устойчивость моделей после выкатки в прод (видео, презентация)
- Валерий Бабушкин - Метрики и функции потерь при дизайне систем машинного обучения (видео, презентация)
- Даниил Дранга - Дебаты: Fullstack Data Scientist или DS & Machine Learning Engineer — cтоит ли разделять роли? [Виктор Кантор – Big Data Director, МТС vs. Дмитрий Жванский – Expert Data Scientist, Райффайзен Банк] (видео, презентация)
- Дмитрий Раевский - FailConf - DS: почему бывает так больно (видео, презентацию опубликуем чуть позже)
Ваш @Reliable ML
#tech #business #reliable_ml #ml_system_design
Видео и презентации докладов первого дня секции
Опубликованы видео и презентации докладов первого дня секции Reliable ML на Data Fest Online 2023. День был посвящен докладам по теме ML System Design. Можно смотреть, пересматривать и наслаждаться! 😊
Все доклады, их описания и презентации можно найти на сайте ODS.ai, а также в плейлисте на YouTube.
Ссылки отдельно по докладам:
- Евгений Финогеев - Автоматизация заведения новых товаров на маркетплейс с использованием ML (видео, презентация)
- Михаил Масагутов - Опыт составления дизайн документа при проектировании ML системы: прогнозирование продаж в магазинах (видео, презентация, диздок)
- Любава Ткаченко - Опыт составления дизайн документа при проектировании ML системы: сервис для кластеризации магазинов (видео, презентация, диздок опубликуем в репозитории чуть позже)
- Андрей Денисенко - Как построить real-time ML на криптобирже (видео, презентация)
- Максим Берёзов - Алгоритм маршрутизации без компромисса между качеством и скоростью (видео, презентация)
- Павел Филонов - Паттерны инференса ML-моделей (видео, презентация)
- Павел Филонов - Тестовое ML System Design Interview (видео, материалы)
- Дмитрий Колодезев - Reliable ML: Устойчивость моделей после выкатки в прод (видео, презентация)
- Валерий Бабушкин - Метрики и функции потерь при дизайне систем машинного обучения (видео, презентация)
- Даниил Дранга - Дебаты: Fullstack Data Scientist или DS & Machine Learning Engineer — cтоит ли разделять роли? [Виктор Кантор – Big Data Director, МТС vs. Дмитрий Жванский – Expert Data Scientist, Райффайзен Банк] (видео, презентация)
- Дмитрий Раевский - FailConf - DS: почему бывает так больно (видео, презентацию опубликуем чуть позже)
Ваш @Reliable ML
#tech #business #reliable_ml #ml_system_design
🔥40👍9👏1
Видеозаписи докладов - Reliable ML - 4 июня 2023 - Data Fest Online
Видео и презентации докладов второго дня секции: Causal Inference & Interpretable ML
Опубликованы видео и презентации докладов второго дня секции Reliable ML на Data Fest Online 2023. День был посвящен докладам по теме Causal Inference и Interpretable ML.
Все доклады, их описания и презентации можно найти на сайте ODS.ai, а также в плейлисте на YouTube.
Ссылки отдельно по докладам:
- Захар Понимаш, Виктор Носко - Как интерпретируемый ИИ объясняет генерацию трансформеров (видео)
- Сабрина Садиех - Explainable AI: что, как и зачем (видео, презентация)
- Григорий Чернов - Корреляция не подразумевает причинно-следственную связь. А что подразумевает? (видео, презентация)
- Максим Кочуров - Bayes in the Wild (видео, презентация)
- Кристина Лукьянова - Байесовский подход к АБ-тестам на примере теста конверсии (видео, презентация)
- Юрий Кацер - Предварительная обработка и поиск аномалий во временных рядах (видео, презентация)
- Артем Ерохин - Бутстрапирование временных рядов (видео, материалы)
- Богдан Печёнкин - Bag-of-tricks того, как сделать ваш ML-пайплайн более reliable (видео, презентация)
Ваш @Reliable ML
#tech #business #reliable_ml #causal_inference #interpretable_ml
Видео и презентации докладов второго дня секции: Causal Inference & Interpretable ML
Опубликованы видео и презентации докладов второго дня секции Reliable ML на Data Fest Online 2023. День был посвящен докладам по теме Causal Inference и Interpretable ML.
Все доклады, их описания и презентации можно найти на сайте ODS.ai, а также в плейлисте на YouTube.
Ссылки отдельно по докладам:
- Захар Понимаш, Виктор Носко - Как интерпретируемый ИИ объясняет генерацию трансформеров (видео)
- Сабрина Садиех - Explainable AI: что, как и зачем (видео, презентация)
- Григорий Чернов - Корреляция не подразумевает причинно-следственную связь. А что подразумевает? (видео, презентация)
- Максим Кочуров - Bayes in the Wild (видео, презентация)
- Кристина Лукьянова - Байесовский подход к АБ-тестам на примере теста конверсии (видео, презентация)
- Юрий Кацер - Предварительная обработка и поиск аномалий во временных рядах (видео, презентация)
- Артем Ерохин - Бутстрапирование временных рядов (видео, материалы)
- Богдан Печёнкин - Bag-of-tricks того, как сделать ваш ML-пайплайн более reliable (видео, презентация)
Ваш @Reliable ML
#tech #business #reliable_ml #causal_inference #interpretable_ml
🔥29👍4🙏3❤1👏1
Видеозапись - Финал ML System Design Doc Challenge - Reliable ML - 4 июня 2023 - Data Fest Online
Видео финала контекста по составлению дизайн-документов
Отдельным постом хочется опубликовать видеозапись завершающего мероприятия секции Reliable ML на Data Fest Online 2023 - огненного финала контеста ML System Design Doc Challenge от Марины Завгородней из Райффайзенбанка.
Под руководством Марины участники команд в течение 2х дней работали над дизайн документом ML-системы по антифроду и в финале контеста - поделились своими решениями. Преимущества и возможности улучшения решений обсудили вместе с аудиторией.
Такой формат контеста прошел впервые, и мы с Димой счастливы, что наш проект по дизайн доку уже живет своей жизнью и помогает компаниям строить ML-системы эффективнее.
Ваш @Reliable ML
#tech #business #reliable_ml #ml_system_design
Видео финала контекста по составлению дизайн-документов
Отдельным постом хочется опубликовать видеозапись завершающего мероприятия секции Reliable ML на Data Fest Online 2023 - огненного финала контеста ML System Design Doc Challenge от Марины Завгородней из Райффайзенбанка.
Под руководством Марины участники команд в течение 2х дней работали над дизайн документом ML-системы по антифроду и в финале контеста - поделились своими решениями. Преимущества и возможности улучшения решений обсудили вместе с аудиторией.
Такой формат контеста прошел впервые, и мы с Димой счастливы, что наш проект по дизайн доку уже живет своей жизнью и помогает компаниям строить ML-системы эффективнее.
Ваш @Reliable ML
#tech #business #reliable_ml #ml_system_design
YouTube
Марина Завгородняя - ML System Design Doc Challenge – Финал
ML System Design Doc: https://github.com/IrinaGoloshchapova/ml_system_design_doc_ru
Марина Завгородняя, Data Science Community Lead в Райффайзенбанке, проводит финальный этап контеста по составлению ML System Design Doc – дизайна ML-системы для решения конкретных…
Марина Завгородняя, Data Science Community Lead в Райффайзенбанке, проводит финальный этап контеста по составлению ML System Design Doc – дизайна ML-системы для решения конкретных…
🔥17❤4👍3👎1👏1
Оценка неопределенности, как быть?
Пост от читателя канала — Максима Кочурова, партнера PyMC Labs
Для построения надежных ML-систем нам нужно не только построить систему, предсказывающую интересующие нас переменные, но и оценить неопределенность предсказания. Эту проблему решают с помощью conformal prediction. Байесовские модели тоже оценивают неопределенность, но делают это немного иначе - различается сам подход к моделированию.
Conformal prediction позволяет получить оценку неопределенности в виде, например, интервалов, содержащих истинное значение с заданной вероятностью. Это model-agnostic подход, который может быть использован с любой моделью машинного обучения. Но эта оценка дается только для целевой переменной.
В противоположность этому байесовские методы явно описывают неопределенности процесса, которым генерируются данные. Мы получаем не только оценку неопределенности нашей целевой переменной, но и вероятностную оценку параметров модели. Когда это может быть важно?
В целом, можно разделить прикладные задачи датасаентиста по степени их «прозрачности»: white, grey, black. Вы наверняка слышали эти термины, между ними принципиальная разница в том, как вообще обычно формулируется постановка, и что в ней на самом деле важно. Условно, это качественная градация задач на “предсказывать” (black box), “предсказывать и делать интервенции”(causal grey box), “предсказывать, делать интервенции, находить неэффективности” (white box).
Если с black box задачами все понятно, то во многих чувствительных приложениях нам важен не только результат, но и параметры процесса. Когда нам нужно организовать валидацию модели экспертами, перенос знаний экспертов доменной области в модель, а так же валидацию экспертами закономерностей, выявленных моделями, нам нужны прозрачные модели, явно формулирующие предположения о процессе генерации данных.
Байесовские модели — самый очевидный выбор для построения таких white-box моделей.
В статье от нашего читателя Максима Кочурова из PyMC Labs выясняем что, как и зачем. Максим также прочитал прекрасный вводный доклад о байесовских методах в июне на секции Reliable ML на Data Fest 2023.
Ваш @Reliable ML
#tech #reliable_ml #bayes_in_ml
Пост от читателя канала — Максима Кочурова, партнера PyMC Labs
Для построения надежных ML-систем нам нужно не только построить систему, предсказывающую интересующие нас переменные, но и оценить неопределенность предсказания. Эту проблему решают с помощью conformal prediction. Байесовские модели тоже оценивают неопределенность, но делают это немного иначе - различается сам подход к моделированию.
Conformal prediction позволяет получить оценку неопределенности в виде, например, интервалов, содержащих истинное значение с заданной вероятностью. Это model-agnostic подход, который может быть использован с любой моделью машинного обучения. Но эта оценка дается только для целевой переменной.
В противоположность этому байесовские методы явно описывают неопределенности процесса, которым генерируются данные. Мы получаем не только оценку неопределенности нашей целевой переменной, но и вероятностную оценку параметров модели. Когда это может быть важно?
В целом, можно разделить прикладные задачи датасаентиста по степени их «прозрачности»: white, grey, black. Вы наверняка слышали эти термины, между ними принципиальная разница в том, как вообще обычно формулируется постановка, и что в ней на самом деле важно. Условно, это качественная градация задач на “предсказывать” (black box), “предсказывать и делать интервенции”(causal grey box), “предсказывать, делать интервенции, находить неэффективности” (white box).
Если с black box задачами все понятно, то во многих чувствительных приложениях нам важен не только результат, но и параметры процесса. Когда нам нужно организовать валидацию модели экспертами, перенос знаний экспертов доменной области в модель, а так же валидацию экспертами закономерностей, выявленных моделями, нам нужны прозрачные модели, явно формулирующие предположения о процессе генерации данных.
Байесовские модели — самый очевидный выбор для построения таких white-box моделей.
В статье от нашего читателя Максима Кочурова из PyMC Labs выясняем что, как и зачем. Максим также прочитал прекрасный вводный доклад о байесовских методах в июне на секции Reliable ML на Data Fest 2023.
Ваш @Reliable ML
#tech #reliable_ml #bayes_in_ml
👍12❤4🔥1
Иллюстрация к посту Максима Кочурова об оценке неопределенности ML-систем
#tech #reliable_ml #bayes_in_ml
#tech #reliable_ml #bayes_in_ml
👍10🔥2❤1
Опубликован новый пример дизайна ML системы по шаблону Reliable ML
Пишем ML System Design Doc вместе с Reliable ML
Для нас большая гордость добавлять дизайны ML систем, написанные на основе нашего шаблона, в открытый доступ. Огромное спасибо авторам, которые вкладываются в развитие ML System Design своими силами и временем.
Сегодня был опубликован новый пример - дизайн сервиса по кластеризации магазинов, разработанного в компании Лента. Автор: Любава Ткаченко, Data Scientist. Бизнес-цель ML-решения – помочь бизнесу в быстром принятии решений с помощью инструмента для автоматической группировки магазинов по базовым метрикам, важным для ритейла. Один из типовых возможных сценариев использования инструмента - адаптация CVP (Customer Value Proposition) с учетом кластеров. А еще Любава сделала замечательный доклад об опыте составления дизайн-дока на недавнем Data Fest.
Успехов в дальнейшем развитии решения!
Шаблон дизайн-документа ML-систем от Reliable ML - тут.
Лекция о том, как с ним работать - тут.
Как написать док вместе с Reliable ML - тут.
Stay tuned!
P.S. Предыдущий дизайн-док был опубликован с похожими словами в посте. Но что поделать, ничего не изменилось - мы с Димой по-прежнему радуемся 😊 И уже знаем об опыте внедрения нашего дока в более чем 10 крупных компаний российского рынка. А еще больше мы радуемся, когда вы приходите к нам рассказать о своем опыте.
Ваш @Reliable ML
#business #tech #ml_system_design
Пишем ML System Design Doc вместе с Reliable ML
Для нас большая гордость добавлять дизайны ML систем, написанные на основе нашего шаблона, в открытый доступ. Огромное спасибо авторам, которые вкладываются в развитие ML System Design своими силами и временем.
Сегодня был опубликован новый пример - дизайн сервиса по кластеризации магазинов, разработанного в компании Лента. Автор: Любава Ткаченко, Data Scientist. Бизнес-цель ML-решения – помочь бизнесу в быстром принятии решений с помощью инструмента для автоматической группировки магазинов по базовым метрикам, важным для ритейла. Один из типовых возможных сценариев использования инструмента - адаптация CVP (Customer Value Proposition) с учетом кластеров. А еще Любава сделала замечательный доклад об опыте составления дизайн-дока на недавнем Data Fest.
Успехов в дальнейшем развитии решения!
Шаблон дизайн-документа ML-систем от Reliable ML - тут.
Лекция о том, как с ним работать - тут.
Как написать док вместе с Reliable ML - тут.
Stay tuned!
P.S. Предыдущий дизайн-док был опубликован с похожими словами в посте. Но что поделать, ничего не изменилось - мы с Димой по-прежнему радуемся 😊 И уже знаем об опыте внедрения нашего дока в более чем 10 крупных компаний российского рынка. А еще больше мы радуемся, когда вы приходите к нам рассказать о своем опыте.
Ваш @Reliable ML
#business #tech #ml_system_design
🔥29❤5👍4
Winter is coming: почему академики сферы AI все чаще оказываются в депрессии и есть ли у них шансы на выживание
Цикл постов: обзор статьи Togelius, Yannakakis (2023) от Reliable ML. Предисловие и часть 1
Прочитали с Димой статью от весны 2023 г. - Choose Your Weapon: Survival Strategies for Depressed AI Academics, Togelius J., Yannakakis G.N. - и впечатлились.
Впечатлились уже давно, но собрались с мыслями только сейчас :)
Шуточное название статьи обманчиво - в ней на полном серьезе приведена инструкция по выживанию для сотрудников научных лабораторий, выбравших путь теоретических исследований в области AI. Легкое настроение читателя от названия и бодрого резюме в начале статьи - к концу прочтения сменяется серьезной задумчивостью о том, что ждет наш мир уже в ближайшем будущем.
Поделимся с вами конспектом статьи и нашими мыслями о последствиях. По аналогии с размышлениями о тезисах конференции Gartner Data & Analytics про критичность финансовых эффектов дата-команд. Этот пост оказался одним из наиболее популярных в нашем канале.
Часть 1. Почему грустят AI академики
- Недостаток вычислительных ресурсов. Нет доступа к мощностям, или он несопоставимо ниже, чем в любой корпорации с AI отделом. Ресурса критически не хватает для конкурентоспособных исследований, тогда как еще всего 5-10 лет назад для того, чтобы двигать науку в AI, достаточно было локальной машины. Сейчас же большинство прорывов базируется на больших мощностях и сериях крупных экспериментов.
- Несправедливая конкуренция с корпорациями. Рост важности самого понятия конкуренции в академии. В идеальном мире научные эксперименты - это совместный труд ученых на благо развития науки - с признанием вклада каждого. В случае высокого влияния корпораций любая стоящая идея получает развитие в рамках той компании, которая первая вложила достаточно денег. Ученый в любом случае в проигрыше и его вклад незаметен. В статье исследование ученого и подключение к ним корпораций сравнивается с открытием Walmart напротив местного семейного магазинчика в небольшом городке.
В следующем посте обсудим, что предлагается делать академикам, впавшим в депрессию по причинам выше.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
Цикл постов: обзор статьи Togelius, Yannakakis (2023) от Reliable ML. Предисловие и часть 1
Прочитали с Димой статью от весны 2023 г. - Choose Your Weapon: Survival Strategies for Depressed AI Academics, Togelius J., Yannakakis G.N. - и впечатлились.
Впечатлились уже давно, но собрались с мыслями только сейчас :)
Шуточное название статьи обманчиво - в ней на полном серьезе приведена инструкция по выживанию для сотрудников научных лабораторий, выбравших путь теоретических исследований в области AI. Легкое настроение читателя от названия и бодрого резюме в начале статьи - к концу прочтения сменяется серьезной задумчивостью о том, что ждет наш мир уже в ближайшем будущем.
Поделимся с вами конспектом статьи и нашими мыслями о последствиях. По аналогии с размышлениями о тезисах конференции Gartner Data & Analytics про критичность финансовых эффектов дата-команд. Этот пост оказался одним из наиболее популярных в нашем канале.
Часть 1. Почему грустят AI академики
- Недостаток вычислительных ресурсов. Нет доступа к мощностям, или он несопоставимо ниже, чем в любой корпорации с AI отделом. Ресурса критически не хватает для конкурентоспособных исследований, тогда как еще всего 5-10 лет назад для того, чтобы двигать науку в AI, достаточно было локальной машины. Сейчас же большинство прорывов базируется на больших мощностях и сериях крупных экспериментов.
- Несправедливая конкуренция с корпорациями. Рост важности самого понятия конкуренции в академии. В идеальном мире научные эксперименты - это совместный труд ученых на благо развития науки - с признанием вклада каждого. В случае высокого влияния корпораций любая стоящая идея получает развитие в рамках той компании, которая первая вложила достаточно денег. Ученый в любом случае в проигрыше и его вклад незаметен. В статье исследование ученого и подключение к ним корпораций сравнивается с открытием Walmart напротив местного семейного магазинчика в небольшом городке.
В следующем посте обсудим, что предлагается делать академикам, впавшим в депрессию по причинам выше.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
👍16🤣6❤3🔥3🤔3
Winter is coming. Цикл постов про академиков в депрессии - Часть 2
Цикл постов по статье Togelius, Yannakakis (2023). Часть 2
Продолжаем цикл постов “Winter is coming: почему академики сферы AI все чаще оказываются в депрессии и есть ли у них шансы на выживание”. Обсудим, какие пути предлагают авторы для AI-академиков, погрузившихся в депрессию. Причины депрессии обсуждали в предыдущем посте цикла.
Что предлагается делать AI-академикам в депрессии
- Сдаться. Не пытаться совершить прорыв, а публиковать статьи в журналах невысоких рейтингов, улучшая технические детали и рассматривая под-под-вопросы различных тем.
- Все-таки пытаться масштабировать вычислительные ресурсы, а именно - тратить наибольшую возможную часть исследовательского гранта на CPU и GPU. Правда, стоит иметь в виду, что даже самые крутые по суммам научные гранты в мире позволяют выделить на вычисления несопоставимо меньше денег, чем нужно на один (один, не серию) норм эксперимент даже с GPT-3.
- Сужать масштаб экспериментов (анти-масштабирование). Сконцентрироваться на игрушечных проблемах, позволяющих продемонстрировать преимущества нового подхода в теории на каких-то сравнениях. Авторы приводят вполне рабочие примеры такого подхода: Shafiullah et al. (2022), Pearce et al. (2023), Paster, McIlraith, Ba (2022). Недостаток в том, что широкий круг людей обращает внимание на подобные прорывы, как правило, значительно позже - когда кто-то проведет крупный эксперимент на реальных данных.
- Использовать претренированные модели. Хороший вариант не делать все с нуля, но чаще всего недостаточно для значимых результатов.
- Анализировать нюансы работы уже существующих моделей, вместо того, чтобы пытаться создать что-то новое.
- Использовать RL! Данные не нужны! Главное, без фанатизма, ибо грань науки и научной фантастики будет пролегать в непосредственной близости от вас.
- Заниматься небольшими моделями. Как с помощью минимально-нагруженной модели и минимального объема данных сделать ценные выводы? Привет Томасу Байесу. Ценность подобных методов неуклонно растет от года к году, хотя и имеет значительные ограничения в использовании.
- Работать над областями, которые на данный момент неинтересны индустрии. Может быть, они не заметят, как вы совершите прорыв. На этом моменте делаем паузу, для того чтобы сходить за успокоительным, и продолжаем дальше.
- Найти области, о которых еще никто не подумал о вас. Или взять заброшенный всеми метод и дать ему шанс. Тут еще чуточку больше шансов остаться незамеченным до получения важных результатов.
- Пробовать методы, которые не должны работать. Ну, вы поняли логику.
- Развивать сомнительные с точки зрения этики направления, потому что корпорации ограничены общими правилами этики, PR-службами и репутационными рисками, а вы - нет. Ну разве что только законом иногда. Цитата: “if you can’t do the research they couldn’t do, do the research they wouldn’t do”.
- Попытаться скооперироваться с индустрией. Если продать перспективную идею бизнесу, то можно получить как финансирование, так и стартап с вашим участием. Правда, ваша идея должна быть в первую очередь практико-ориентированной (иметь кейс с получением денег на не очень большом временном горизонте), чем направленной на улучшение мира, или новые теоретические научные прорывы. Тут уж извините, nothing personal just business.
- Развивать коллаборации между разными университетами. Здорово, но перспективы не сильно видны.
В следующих постах цикла поделимся размышлениями о том, что нас ждет в связи со всем вышеперечисленным, и что же можно сделать.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
Цикл постов по статье Togelius, Yannakakis (2023). Часть 2
Продолжаем цикл постов “Winter is coming: почему академики сферы AI все чаще оказываются в депрессии и есть ли у них шансы на выживание”. Обсудим, какие пути предлагают авторы для AI-академиков, погрузившихся в депрессию. Причины депрессии обсуждали в предыдущем посте цикла.
Что предлагается делать AI-академикам в депрессии
- Сдаться. Не пытаться совершить прорыв, а публиковать статьи в журналах невысоких рейтингов, улучшая технические детали и рассматривая под-под-вопросы различных тем.
- Все-таки пытаться масштабировать вычислительные ресурсы, а именно - тратить наибольшую возможную часть исследовательского гранта на CPU и GPU. Правда, стоит иметь в виду, что даже самые крутые по суммам научные гранты в мире позволяют выделить на вычисления несопоставимо меньше денег, чем нужно на один (один, не серию) норм эксперимент даже с GPT-3.
- Сужать масштаб экспериментов (анти-масштабирование). Сконцентрироваться на игрушечных проблемах, позволяющих продемонстрировать преимущества нового подхода в теории на каких-то сравнениях. Авторы приводят вполне рабочие примеры такого подхода: Shafiullah et al. (2022), Pearce et al. (2023), Paster, McIlraith, Ba (2022). Недостаток в том, что широкий круг людей обращает внимание на подобные прорывы, как правило, значительно позже - когда кто-то проведет крупный эксперимент на реальных данных.
- Использовать претренированные модели. Хороший вариант не делать все с нуля, но чаще всего недостаточно для значимых результатов.
- Анализировать нюансы работы уже существующих моделей, вместо того, чтобы пытаться создать что-то новое.
- Использовать RL! Данные не нужны! Главное, без фанатизма, ибо грань науки и научной фантастики будет пролегать в непосредственной близости от вас.
- Заниматься небольшими моделями. Как с помощью минимально-нагруженной модели и минимального объема данных сделать ценные выводы? Привет Томасу Байесу. Ценность подобных методов неуклонно растет от года к году, хотя и имеет значительные ограничения в использовании.
- Работать над областями, которые на данный момент неинтересны индустрии. Может быть, они не заметят, как вы совершите прорыв. На этом моменте делаем паузу, для того чтобы сходить за успокоительным, и продолжаем дальше.
- Найти области, о которых еще никто не подумал о вас. Или взять заброшенный всеми метод и дать ему шанс. Тут еще чуточку больше шансов остаться незамеченным до получения важных результатов.
- Пробовать методы, которые не должны работать. Ну, вы поняли логику.
- Развивать сомнительные с точки зрения этики направления, потому что корпорации ограничены общими правилами этики, PR-службами и репутационными рисками, а вы - нет. Ну разве что только законом иногда. Цитата: “if you can’t do the research they couldn’t do, do the research they wouldn’t do”.
- Попытаться скооперироваться с индустрией. Если продать перспективную идею бизнесу, то можно получить как финансирование, так и стартап с вашим участием. Правда, ваша идея должна быть в первую очередь практико-ориентированной (иметь кейс с получением денег на не очень большом временном горизонте), чем направленной на улучшение мира, или новые теоретические научные прорывы. Тут уж извините, nothing personal just business.
- Развивать коллаборации между разными университетами. Здорово, но перспективы не сильно видны.
В следующих постах цикла поделимся размышлениями о том, что нас ждет в связи со всем вышеперечисленным, и что же можно сделать.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
👍21❤9🤣6🔥2😢1
Иллюстрация к части 2 - Winter is coming. Цикл постов про академиков в депрессии
Картинка к части 2. Будьте бдительны!
Цикл постов “Winter is coming: почему академики сферы AI все чаще оказываются в депрессии и есть ли у них шансы на выживание”.
- Часть 1. Почему AI-академики оказываются в депрессии.
- Часть 2. Какие пути предлагают авторы дляAI-академиков, погрузившихся в депрессию.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
Картинка к части 2. Будьте бдительны!
Цикл постов “Winter is coming: почему академики сферы AI все чаще оказываются в депрессии и есть ли у них шансы на выживание”.
- Часть 1. Почему AI-академики оказываются в депрессии.
- Часть 2. Какие пути предлагают авторы дляAI-академиков, погрузившихся в депрессию.
Ваш @Reliable ML
#business #tech #thoughts #reliable_ml
😁21👍5❤4🔥2🤣1
Reliable ML pinned «Видеозаписи докладов - Reliable ML - 3 июня 2023 - Data Fest Online Видео и презентации докладов первого дня секции Опубликованы видео и презентации докладов первого дня секции Reliable ML на Data Fest Online 2023. День был посвящен докладам по теме ML System…»