#домашка
Всем привет!
Как и говорил вчера - у нас открыта домашка для желающих попрактиковаться. Начать участие в соревновании можно по ссылке: https://www.kaggle.com/t/7e9b43b6978b4c18a58c6b60a2da2ed8
Также для соревнования уже подготовлено несколько бейзлайнов:
1) Простые: все нули, среднее по трейну, медиана по трейну
2) Стартер на LightAutoML (скор 3021.75)- https://www.kaggle.com/alexryzhkov/lightautoml-starter-for-hw1
3) Baseline 2 на LightAutoML (скор 1561.11) - код в кернеле пока что скрыт
4) Сильный baseline на LightAutoML (скор 1398.89) - код в кернеле пока что скрыт
Если вдруг при решении задачи возникают вопросы - не стесняйтесь их задавать 😎
Всем привет!
Как и говорил вчера - у нас открыта домашка для желающих попрактиковаться. Начать участие в соревновании можно по ссылке: https://www.kaggle.com/t/7e9b43b6978b4c18a58c6b60a2da2ed8
Также для соревнования уже подготовлено несколько бейзлайнов:
1) Простые: все нули, среднее по трейну, медиана по трейну
2) Стартер на LightAutoML (скор 3021.75)- https://www.kaggle.com/alexryzhkov/lightautoml-starter-for-hw1
3) Baseline 2 на LightAutoML (скор 1561.11) - код в кернеле пока что скрыт
4) Сильный baseline на LightAutoML (скор 1398.89) - код в кернеле пока что скрыт
Если вдруг при решении задачи возникают вопросы - не стесняйтесь их задавать 😎
Kaggle
Kaggle: Your Home for Data Science
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.
#release_notes
В версии 0.2.13:
- Добавлена поддержка регрессии для интерпретации NLP моделей на основе LIME
В версии 0.2.13:
- Добавлена поддержка регрессии для интерпретации NLP моделей на основе LIME
Коллеги, всем привет!
Расскажите плз, кто начал решать домашку и кто планирует ее делать - все ли в задаче понятно? Нужны ли какие-то дополнительные комментарии по ней или по использованию фреймворка?
Расскажите плз, кто начал решать домашку и кто планирует ее делать - все ли в задаче понятно? Нужны ли какие-то дополнительные комментарии по ней или по использованию фреймворка?
Ссылка на отдельный чат для обсуждения домашки с предсказанием цены машины: https://news.1rj.ru/str/joinchat/sp8P7sdAqaU0YmRi
Нужны ли дополнительные семинары по ML теории? Если да, то отпишите в комментах по какой теме.
Anonymous Poll
83%
Да, нужны
17%
Нет, не нужны
Судя по опросу, у нас побеждает вариант ответа «Да, нужны». Попробуем подобрать для такого семинара подходящий слот.
Список тем для обсуждения (буду его тут постепенно обновлять):
1) Ансамбли - блендинги, стекинги и т.п.
2) Особенности метрик (f1, rocauc и др.)
3) feature engineering
Список тем для обсуждения (буду его тут постепенно обновлять):
1) Ансамбли - блендинги, стекинги и т.п.
2) Особенности метрик (f1, rocauc и др.)
3) feature engineering
Всем привет, коллеги! Хотел бы поделиться важной инфой, о которой мб не все в курсе - для того, чтобы радовать других людей своими апвоутами (и чтобы их засчитывал Kaggle и учитывал в общем количестве), вам необходимо добраться до статуса Contributor из изначального статуса Novice. Как это сделать, рассказывает прикрепленная к посту картинка
Доброе утро, товарищи! Quick reminder: сегодня в 19.00 пройдет второй вебинар курса, на котором я расскажу о практическом примерении LightAutoML для решения различных задач (в том числе и активных на текущий момент соревнований на Kaggle). Также будет разобран better_baseline для текущей домашки по предсказанию стоимости машин. Приходите - будет интересно 😎
Через 10 минут начинаем наш второй вебинар с Александром Рыжковым: "Практикум по решению основных ML-задач"
Ждем всех по ссылке в 19.00
Ждем всех по ссылке в 19.00
Zoom Video
Join our Cloud HD Video Meeting
Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…
Добрый вечер всем!
Еще раз всем большое спасибо за то, что посетили наш вебинар. Собрал в одно сообщение все кернелы, которые мы сегодня посмотрели:
1) Быстрое решение титаника
2) Титаник (шаблон решения задач)
3) House Prices регрессия
4) Предсказание цены квартир
5) Дефолты заемщиков
6) Интерпретируемая модель с отчетом и SQL
7) (Текущее открытое соревнование) Tabular Playgroung Series May 2021
8) Изначальный бейзлайн домашки
9) Обновленный бейзлайн домащки
Ну и на закуску ссылка на датасет с конфигами ламы.
P.S. Понравился кернел - не стесняйся, ткни лейкоцит ❤️. Давайте вместе загоним LightAutoML в тренды на Kaggle.🤩
Еще раз всем большое спасибо за то, что посетили наш вебинар. Собрал в одно сообщение все кернелы, которые мы сегодня посмотрели:
1) Быстрое решение титаника
2) Титаник (шаблон решения задач)
3) House Prices регрессия
4) Предсказание цены квартир
5) Дефолты заемщиков
6) Интерпретируемая модель с отчетом и SQL
7) (Текущее открытое соревнование) Tabular Playgroung Series May 2021
8) Изначальный бейзлайн домашки
9) Обновленный бейзлайн домащки
Ну и на закуску ссылка на датасет с конфигами ламы.
P.S. Понравился кернел - не стесняйся, ткни лейкоцит ❤️. Давайте вместе загоним LightAutoML в тренды на Kaggle.🤩
Kaggle
LightAutoML extreme short Titanic solution
Explore and run machine learning code with Kaggle Notebooks | Using data from Titanic - Machine Learning from Disaster
Всем привет, коллеги!
Хотел бы поделиться одной довольно важной особенностью, которая есть у нас в решении для задач бинарной и мультикласс классификации (ее понимание и использование очень важно для получения адекватных результатов).
В случае, если таргет переменная в вашем датасете задана не как 0-1 для бинарки или 0-1-2-..-N для мультикласса, то LIghtAutoML все равно сможет работать с такими данными, НО самостоятельно проведет их замену на знакомые ему 0-1-.. в порядке убывания встречаемости классов. О том, каким образом прошла замена, вам может сказать
Будьте внимательны 🧐🤓😎
Хотел бы поделиться одной довольно важной особенностью, которая есть у нас в решении для задач бинарной и мультикласс классификации (ее понимание и использование очень важно для получения адекватных результатов).
В случае, если таргет переменная в вашем датасете задана не как 0-1 для бинарки или 0-1-2-..-N для мультикласса, то LIghtAutoML все равно сможет работать с такими данными, НО самостоятельно проведет их замену на знакомые ему 0-1-.. в порядке убывания встречаемости классов. О том, каким образом прошла замена, вам может сказать
automl.reader.class_mapping, который будет None, если замены не было, и dict-ом в случае замены. Будьте внимательны 🧐🤓😎
👍1
Всем привет!
Сегодня в 19.00 наш коллега Дмитрий Симаков расскажет про NLP- и CV-пресеты в LightAutoML, а так же про то, как работать со смешанными датасетами.
Кроме того:
- покажем, как с помощью встроенного в LightAutoML LIME можно интерпретировать модели с текстовыми признаками;
- сделаем сабмит в идущее сейчас соревнование на kaggle CommonLit Readability Prize" 🚀.
Ссылка традиционно будет в рассылке позже.
Ждем всех на вебинаре в 19.00 🎓
Сегодня в 19.00 наш коллега Дмитрий Симаков расскажет про NLP- и CV-пресеты в LightAutoML, а так же про то, как работать со смешанными датасетами.
Кроме того:
- покажем, как с помощью встроенного в LightAutoML LIME можно интерпретировать модели с текстовыми признаками;
- сделаем сабмит в идущее сейчас соревнование на kaggle CommonLit Readability Prize" 🚀.
Ссылка традиционно будет в рассылке позже.
Ждем всех на вебинаре в 19.00 🎓
Через 10 минут начинаем наш третий вебинар с Дмитрием Симаковым «NLP и CV пресеты LightAutoML: теория и практика»!
Ждем вас в 19.00 по ссылке
Ждем вас в 19.00 по ссылке
Zoom Video
Join our Cloud HD Video Meeting
Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…
AutoNLPandCV.pdf
1.7 MB
Добрый день!
По мотивам вебинара про NLP:
Соревнование CommonLit Readability Prize:
1) Ноутбук для обучения. В этом ноутбуке можно обратить внимание на две истории. Первая, как передать веса transformer модели напрямую в автомл. Вторая - если вы хотите сэкономить оперативную память, то можно сохранять чекпоинты модели на диск при помощи аргумента
2) Ноутбук для сабмита. Стоит отметить, что необходимо сохранить структуру директории, как во время обучения, поэтому мы дополнительно копируем веса наших моделей в правильную папку (ячейка 3 ноутбука).
Скор на паблике: 505.
А также презентация с первой части вебинара.
По мотивам вебинара про NLP:
Соревнование CommonLit Readability Prize:
1) Ноутбук для обучения. В этом ноутбуке можно обратить внимание на две истории. Первая, как передать веса transformer модели напрямую в автомл. Вторая - если вы хотите сэкономить оперативную память, то можно сохранять чекпоинты модели на диск при помощи аргумента
'path_to_save' нейронной сети. Кроме того, ноутбук демонстрирует работу методов интерпретации. Интересный вывод, что на сложность восприятия текста сильно влияют артикли и местоимения.2) Ноутбук для сабмита. Стоит отметить, что необходимо сохранить структуру директории, как во время обучения, поэтому мы дополнительно копируем веса наших моделей в правильную папку (ячейка 3 ноутбука).
Скор на паблике: 505.
А также презентация с первой части вебинара.
Всем привет! Сегодня ночью завершилось наше первое домашнее задание соревнование. В топ-5 вошли:
1. Crazy Pandas (Александр Косолапов, Сергей Кутепов)
2. Антон Чикин
3. Степан Пономарев
4. Валерий Якухин
5. Mishacamry
Поздравляю вас ребят, вы проделали классный путь и удержались в шейкапе привата 👍
Для всех, у кого не пропал соревновательный дух и хочется еще больше хлеба и соревов, напоминаю:
1) Открыта домашка 2 в реальном соревновании https://www.kaggle.com/c/commonlitreadabilityprize с кернелами от Димы Симакова по работе с NLP данными
2) Для любителей табличного экстрима есть соревнование TPS May 2021 с моим кернелом https://www.kaggle.com/alexryzhkov/lightautoml-baseline-tps-may-2021 (которому чутка осталось до голды) - там есть на что посмотреть и над чем поломать голову.
Аппетит приходит во время еды :)
1. Crazy Pandas (Александр Косолапов, Сергей Кутепов)
2. Антон Чикин
3. Степан Пономарев
4. Валерий Якухин
5. Mishacamry
Поздравляю вас ребят, вы проделали классный путь и удержались в шейкапе привата 👍
Для всех, у кого не пропал соревновательный дух и хочется еще больше хлеба и соревов, напоминаю:
1) Открыта домашка 2 в реальном соревновании https://www.kaggle.com/c/commonlitreadabilityprize с кернелами от Димы Симакова по работе с NLP данными
2) Для любителей табличного экстрима есть соревнование TPS May 2021 с моим кернелом https://www.kaggle.com/alexryzhkov/lightautoml-baseline-tps-may-2021 (которому чутка осталось до голды) - там есть на что посмотреть и над чем поломать голову.
Аппетит приходит во время еды :)
Привет! Напоминаем, что в 19.00 сегодня у нас будет вебинар про отчеты, мониторинги в LightAutoML - радости разработчика моделей 📊📈.
Василий Бунаков расскажет и покажет, как пользоваться ReportDeco в библиотеке, и посвятит в ближайшие планы!
Ждем всех в 19!
Василий Бунаков расскажет и покажет, как пользоваться ReportDeco в библиотеке, и посвятит в ближайшие планы!
Ждем всех в 19!
Начинаем через 10 минут!
Сделай отчет по модели к к завтра! А добавь еще вот этих диаграмм...
Мы все не раз слышали эти просьбы.
Сегодня в про отчеты, мониторинг за пару строк кода и вот эти все полезные в работе каждого DS плюшки!
Ждем вас в 19.00 по ссылке.
Сделай отчет по модели к к завтра! А добавь еще вот этих диаграмм...
Мы все не раз слышали эти просьбы.
Сегодня в про отчеты, мониторинг за пару строк кода и вот эти все полезные в работе каждого DS плюшки!
Ждем вас в 19.00 по ссылке.
Zoom Video
Join our Cloud HD Video Meeting
Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…
Ребят, всем добрый вечер! Очень большая просьба писать в репозитории (в ишьюсах, в пуллреквестах, в комментах и т.п.) на английском. Нас там читает весь мир и хочет понимать 🙏
Большое спасибо всем, кто сегодня вырвался из трудовых будней послушать как за пару-тройку строчек кода построить иногда такие срочно-необходимые🚨 в работе отчеты по моделям.
Сегодня разбирали существующие и близкие к релизу фичи LightAutoML:
- отчеты (как находить инсайты, эксплоративный анализ данных, параметры модели, метрики и др)
- мониторинги
- интерпретируемость
Ловите парочку кернелов по итогам вебинаров👇
1. Отчеты ReportDeco для WhiteBox пресета
2. Отчеты ReportDeco для BlackBox пресетов
Мы делаем в первую очередь инструмент для людей, упрощающий их ежедневный труд в таком неопределеном мире ML, поэтому нам важно ваше мнение и запросы на доработку👨💻.
- Кидайте ваши issues, фича-реквесты на GitHub (in english, please!)
- Пишите нам и Василию Бунакову (телеграм @Vasbu ) если у вас есть запросы на доработки по отчетам и мониторингам - вроде добавления кастомных метрик
- если кидаете Pull Request c доработкой либы - in english, please!
Домашка: запили отчеты своим кернелам на текущем реальном открытом сореве, майском Tabular Playground Series May 21 сореве TPS May, опубликуй свой кернел! 😉
Сегодня разбирали существующие и близкие к релизу фичи LightAutoML:
- отчеты (как находить инсайты, эксплоративный анализ данных, параметры модели, метрики и др)
- мониторинги
- интерпретируемость
Ловите парочку кернелов по итогам вебинаров👇
1. Отчеты ReportDeco для WhiteBox пресета
2. Отчеты ReportDeco для BlackBox пресетов
Мы делаем в первую очередь инструмент для людей, упрощающий их ежедневный труд в таком неопределеном мире ML, поэтому нам важно ваше мнение и запросы на доработку👨💻.
- Кидайте ваши issues, фича-реквесты на GitHub (in english, please!)
- Пишите нам и Василию Бунакову (телеграм @Vasbu ) если у вас есть запросы на доработки по отчетам и мониторингам - вроде добавления кастомных метрик
- если кидаете Pull Request c доработкой либы - in english, please!
Домашка: запили отчеты своим кернелам на текущем реальном открытом сореве, майском Tabular Playground Series May 21 сореве TPS May, опубликуй свой кернел! 😉
Kaggle
LightAutoML interpretable model - AutoWoE
Explore and run machine learning code with Kaggle Notebooks | Using data from Tabular Playground Series - Apr 2021
Всем привет.
Сегодня идет большая конференция для разработчиков https://smartdev.ru/program.
Не секрет, что наша библиотека LightAutoML интегрирована как основной AutoML инструмент в SberCloud ML Space
Про LightAutoML в 3х стримах 5 докладов🔥:
2 наших - о библиотеке Максим Савченко (стрим SmartUniverse) + воркшоп Антона Вахрушева (стрим SberCloud)
1 доклад SberCloud в MLSpace (стрим Machine Learning) - new
1 кейс GetTransfer по использованию LightAutoML в ML Space (стрим Machine Learning) - new
1 кейс ЦРТ (стрим Machine Learning) - про перспективные разработки learn-to-explain для колл-центров - new
без регистрации и смс, и выложат в записи думаю позже
Сегодня идет большая конференция для разработчиков https://smartdev.ru/program.
Не секрет, что наша библиотека LightAutoML интегрирована как основной AutoML инструмент в SberCloud ML Space
Про LightAutoML в 3х стримах 5 докладов🔥:
2 наших - о библиотеке Максим Савченко (стрим SmartUniverse) + воркшоп Антона Вахрушева (стрим SberCloud)
1 доклад SberCloud в MLSpace (стрим Machine Learning) - new
1 кейс GetTransfer по использованию LightAutoML в ML Space (стрим Machine Learning) - new
1 кейс ЦРТ (стрим Machine Learning) - про перспективные разработки learn-to-explain для колл-центров - new
без регистрации и смс, и выложат в записи думаю позже