Начинаю подводить итоги года🥂👨🏻🌾
Так вышло, что этот год, сам того не замечая, я "обильно" преподавал, поэтому ожидаемым шоком для меня стала следующая статистика. За 2021-й год я успел провести:
- 41 вебинар в Otus по ML
- 33 вебинара по статистике в Нетологии
- 15 семинаров в МФТИ по анализу данных
- 16 вебинаров разной тематики в DLS, Мегафон, Сбер, РШП
- Записать курс по АБ - тестированию в SkillBox
- Вывести в свет 11 топиков в курсе по Flask в Jet Brains.
- "Зачать" курс по соревновательному DS с Proglib
Итого: Около 118 вебинаров/семинаров/лекций за год!!!😳
Считай, что раз в три дня надо было сесть и прокачать кого-нибудь в DS. Мой самый отточенный навык за этот год - могу объяснить, что такое p-value даже детям.Да что там дети, моя бабуля уже даже бустинги тюнит.
Преподавание - преподаванием, но учиться тоже надо, поэтому, в свою очередь, успел пройти:
- 5 курсов в школе MADE
- 4 курса на Coursera
- 4 курса на Stepik
Было бы время, прошел бы больше🙈
#НеРеклама
#OnlineКурсыТопчик
#Прокачиваю
Так вышло, что этот год, сам того не замечая, я "обильно" преподавал, поэтому ожидаемым шоком для меня стала следующая статистика. За 2021-й год я успел провести:
- 41 вебинар в Otus по ML
- 33 вебинара по статистике в Нетологии
- 15 семинаров в МФТИ по анализу данных
- 16 вебинаров разной тематики в DLS, Мегафон, Сбер, РШП
- Записать курс по АБ - тестированию в SkillBox
- Вывести в свет 11 топиков в курсе по Flask в Jet Brains.
- "Зачать" курс по соревновательному DS с Proglib
Итого: Около 118 вебинаров/семинаров/лекций за год!!!😳
Считай, что раз в три дня надо было сесть и прокачать кого-нибудь в DS. Мой самый отточенный навык за этот год - могу объяснить, что такое p-value даже детям.
- 5 курсов в школе MADE
- 4 курса на Coursera
- 4 курса на Stepik
Было бы время, прошел бы больше🙈
#НеРеклама
#OnlineКурсыТопчик
#Прокачиваю
👍4
Говорят, новый год не начнется, пока не составишь планы!🎅🏻
Выделил несколько пунктов на этот год, связанные с DS, погнали! За этот год в моих планах:
- Отвоевать официальный титул Kaggle мастера🤹♂️🏵
- Запустить вебинары совместно с Deep Learning School👨🎨
- Довести 3-х людей до медалек на Kaggle🥇🧞♂️
- Прижиться и по возможности стать лидом в X5 👷♂️🚀
- Выпустить авторский интенсив по DS🎯
- Опубликовать уже наконец-то научную статью🤪
Год будет богат на хакатоны и чемпионаты. Буду фармить и делиться всеми трюками на максималках. Следите!
Всех с наступающим, чемпионы!
Выделил несколько пунктов на этот год, связанные с DS, погнали! За этот год в моих планах:
- Отвоевать официальный титул Kaggle мастера🤹♂️🏵
- Запустить вебинары совместно с Deep Learning School👨🎨
- Довести 3-х людей до медалек на Kaggle🥇🧞♂️
- Прижиться и по возможности стать лидом в X5 👷♂️🚀
- Выпустить авторский интенсив по DS🎯
- Опубликовать уже наконец-то научную статью🤪
Год будет богат на хакатоны и чемпионаты. Буду фармить и делиться всеми трюками на максималках. Следите!
Всех с наступающим, чемпионы!
🎉6
Не стоит звать меня в команду, если вы не заряженны, как этот парниша 👆🤠🤪
С наступившим!🥳
Понеслась!🏇🎉
#мотивация
#побеждают_только_безумцы
#СберМаркет
С наступившим!🥳
Понеслась!🏇🎉
#мотивация
#побеждают_только_безумцы
#СберМаркет
👍4
Пару недель назад обещнулся урвать бронзу по ранжированию текстов на Kaggle. Уже начал тюнить ансамбль BERT’тов, но это не мешает участвовать параллельно еще где-то.
Сейчас ворвались в специфичную сореву по рекомендашкам от Сбера на🍋💰Думал, в начале январских с гордостью сделаю пост, как с кентами вошли топ-5, но пока держим топ-8. Осталось еще 5 дней. Долбим баги дальше. 🪲⛏
Надеюсь на топ-3, ибо тиммейты заряженные до бешенства💪Раньше таких не встречал😳. Скоро расскажу, как собирать команду, чтобы брать любые вершины.
А еще рад новому апдейту телеги. Теперь можно оставлять реакции. Пробуйте 😉
#Aleron_фармит
Сейчас ворвались в специфичную сореву по рекомендашкам от Сбера на🍋💰Думал, в начале январских с гордостью сделаю пост, как с кентами вошли топ-5, но пока держим топ-8. Осталось еще 5 дней. Долбим баги дальше. 🪲⛏
Надеюсь на топ-3, ибо тиммейты заряженные до бешенства💪Раньше таких не встречал😳. Скоро расскажу, как собирать команду, чтобы брать любые вершины.
А еще рад новому апдейту телеги. Теперь можно оставлять реакции. Пробуйте 😉
#Aleron_фармит
🔥53👍23🤩4👎3😢1
Так, банда, делюсь новостями. Все по порядку:
1) Моя статья на Хабре, написанная утром за час, вошла в топ лучших за сутки. 🏆🏆🏆
2) СберМаркет переполнился техническими багами и продлил дедлайн. Теперь есть еще неделя, чтоб урвать призовые🕹. Тем временем, мы уже ближе к топу🤫. Сейчас топ-6, полет нормальный😤
3) Прошел мой первый боевой день в X5 Group. Атмосфера превзошла все мои ожидания. Очень нравится🔝
4) Помните, я искал видео-карточку, чтобы фармить? 🏎Теперь у меня есть карточка) Причем проблему я решил гениально. Даже платить не пришлось. Как решил, расскажу в конце месяца.
1) Моя статья на Хабре, написанная утром за час, вошла в топ лучших за сутки. 🏆🏆🏆
2) СберМаркет переполнился техническими багами и продлил дедлайн. Теперь есть еще неделя, чтоб урвать призовые🕹. Тем временем, мы уже ближе к топу🤫. Сейчас топ-6, полет нормальный😤
3) Прошел мой первый боевой день в X5 Group. Атмосфера превзошла все мои ожидания. Очень нравится🔝
4) Помните, я искал видео-карточку, чтобы фармить? 🏎Теперь у меня есть карточка) Причем проблему я решил гениально. Даже платить не пришлось. Как решил, расскажу в конце месяца.
🔥21👍13🎉2
Для меня вчера было шоком узнать, сколько в моём окружении парней из DS, кто пришел в индустрию после 30 лет. 💪🔥
"Вошли в Data Science после 30-ти и не вышли" - Именно так я назову следующую статью с коротким интервью от этих ребят.
Парни реально крутые. Есть джуны, есть даже лиды, а кто-то просто крушит хакатончики один за другим. Над форматом еще подумаю, но выпуск точно выйдет вдохновляющим.🤔
А ты уже вошел в DS?)
"Вошли в Data Science после 30-ти и не вышли" - Именно так я назову следующую статью с коротким интервью от этих ребят.
Парни реально крутые. Есть джуны, есть даже лиды, а кто-то просто крушит хакатончики один за другим. Над форматом еще подумаю, но выпуск точно выйдет вдохновляющим.🤔
А ты уже вошел в DS?)
👍56🔥6❤5🎉3
Что ж, посмеялись, теперь снова ныряем в тематику.
#Трюк №54 Feature Engineering
Именно эта техника превращает Data Sсience в искусство. Почему? Простой пример. Вот все любят хакатоны по табличкам, потому что они простые - "воткнул бустинг", и, если ты угадал с гиперпараметрами, ты в топе🏆. Однако, если ты мало знаешь про генерацию новых признаков, то твои оппоненты не дадут тебе так просто урвать призовые. 🙅♂️ Я проверял😕
Чтоб с успехом рамсИть синдусами лидерами на Kaggle за звание чемпиона, придется освоить эту технику 🧠
Так просто этому научить не смогу, но вот вам пример из моего опыта - классификация временных рядов. Выражу весь смысл техники одной фразой - новые признаки должны как можно более однозначно разделять объекты. Все.
В остальном - порефлексируйте над картинкой к посту или чекайте мою статейку по увеличению точности моделей.
#Трюк №54 Feature Engineering
Именно эта техника превращает Data Sсience в искусство. Почему? Простой пример. Вот все любят хакатоны по табличкам, потому что они простые - "воткнул бустинг", и, если ты угадал с гиперпараметрами, ты в топе🏆. Однако, если ты мало знаешь про генерацию новых признаков, то твои оппоненты не дадут тебе так просто урвать призовые. 🙅♂️ Я проверял😕
Чтоб с успехом рамсИть с
Так просто этому научить не смогу, но вот вам пример из моего опыта - классификация временных рядов. Выражу весь смысл техники одной фразой - новые признаки должны как можно более однозначно разделять объекты. Все.
В остальном - порефлексируйте над картинкой к посту или чекайте мою статейку по увеличению точности моделей.
👍28🔥5
🍋🙅♂️Упустили лям 😅
📈Скор подняли, но место уронили - топ-7 из 70 участников.
🤔Раньше почти никогда не участвовал в задачах на рекомендательные системы, но за этот хакатон успел отработать пайплайн😎. В следующие разы буду громить уже не с нуля. 🏹
🙈🙊Оказаться в топ-7 не так обидно, как ребятам на топ-2. Ведь призовые Сбер давал только за топ-1. Либо все, либо ничего 👌
✅Пока разбирался в рекомендашках, узнал столько полезных технических тонкостей в Pandas, LightFM и в целом в Python, что ни капли не пожалел, что сыграл. Такой опыт редко приобретёшь на работе. Будет теперь, о чем вам рассказать
Тима решает🎯
@MaxYaz вывел в топ-10
@Alexcei64 вывел в топ-5
@Aleron75 не вывел в топ-1
P.S. - отдельная сложность была - преодолеть баги платформы. Времени уходило изрядно🤷♀️🤦♀️🤹♂️
📈Скор подняли, но место уронили - топ-7 из 70 участников.
🤔Раньше почти никогда не участвовал в задачах на рекомендательные системы, но за этот хакатон успел отработать пайплайн😎. В следующие разы буду громить уже не с нуля. 🏹
🙈🙊Оказаться в топ-7 не так обидно, как ребятам на топ-2. Ведь призовые Сбер давал только за топ-1. Либо все, либо ничего 👌
✅Пока разбирался в рекомендашках, узнал столько полезных технических тонкостей в Pandas, LightFM и в целом в Python, что ни капли не пожалел, что сыграл. Такой опыт редко приобретёшь на работе. Будет теперь, о чем вам рассказать
Тима решает🎯
@MaxYaz вывел в топ-10
@Alexcei64 вывел в топ-5
@Aleron75 не вывел в топ-1
P.S. - отдельная сложность была - преодолеть баги платформы. Времени уходило изрядно🤷♀️🤦♀️🤹♂️
🔥33👍11
Можно ли свое хобби соревноваться на чемпионатах превратить в работу? Что?
😎Представьте, Вы на full time фармите Kaggle, вырываетесь в медали, скидываете оппонентов вниз по лидерборду. Жизнь прекрасна. А спустя месяц вам еще и зарплата за это прилетает. А в случае успеха еще и призовые🥳
😳Оказывается, такое есть. Узнал, что есть такая профессия - Kaggle фармить. И не только Kaggle, но любые другие открытые чемпионаты. Где-то даже был успешный кейс от Philips по соревнованию на ускорение MRT с помощью DL, но не нашел сходу ссылки на выступление этих ребят. В целом, примеры можно найти даже на Физтехе, где студенты участвую в чемпионатах, представляя свои лабораториираскидывают индусов налево и направо за стипу.
🤔Закралась мысль, может, раскачать такую практику в России посильнее?!
🧞♂️За какую адекватную зп ты бы фармил на фул тайм? И в скольких чемпионатах смог бы участвовать одновременно?
😎Представьте, Вы на full time фармите Kaggle, вырываетесь в медали, скидываете оппонентов вниз по лидерборду. Жизнь прекрасна. А спустя месяц вам еще и зарплата за это прилетает. А в случае успеха еще и призовые🥳
😳Оказывается, такое есть. Узнал, что есть такая профессия - Kaggle фармить. И не только Kaggle, но любые другие открытые чемпионаты. Где-то даже был успешный кейс от Philips по соревнованию на ускорение MRT с помощью DL, но не нашел сходу ссылки на выступление этих ребят. В целом, примеры можно найти даже на Физтехе, где студенты участвую в чемпионатах, представляя свои лаборатории
🤔Закралась мысль, может, раскачать такую практику в России посильнее?!
🧞♂️За какую адекватную зп ты бы фармил на фул тайм? И в скольких чемпионатах смог бы участвовать одновременно?
👍15🔥5
За что можно влюбиться в компанию? За престиж? За зарплату? За комьюнити? За ДМС и курсы? А может за стикеры???🤩
Все мимо. Моя выдала мне сервак с видеокарточками для фарминга. И не а бы какими! А с такими зверями - Tesla v100-SXM2⚙️💣🤯
Ауууффф, ну всеееее…
✅Две тимы укомплектованы.
✅Карточки есть.
✅Экспертизы поднакопил
Теперь будем по выходным фармить на Kaggle, как черти🤿 👨🏻🌾🤹♂️
🤔P.S.- Все думал, как Бабушкин успевал фармить в X5, вот оно что..
Все мимо. Моя выдала мне сервак с видеокарточками для фарминга. И не а бы какими! А с такими зверями - Tesla v100-SXM2⚙️💣🤯
Ауууффф, ну всеееее…
✅Две тимы укомплектованы.
✅Карточки есть.
✅Экспертизы поднакопил
Теперь будем по выходным фармить на Kaggle, как черти🤿 👨🏻🌾🤹♂️
🤔P.S.- Все думал, как Бабушкин успевал фармить в X5, вот оно что..
🔥28👍6😁4❤3🎉1
👨🚒Настоящие Kaggler'ы обучают модели на неочищенных данных и не говорят - "это только прототип", поэтому что так говорят только закомплексованные и неуверенные в себе аналитики. Если каглер решил, что хочет обучать ансамбль из 1000 моделей на данных с грязью из канавы, а не учить всего одну сильную на почищенных, то он не обязан никому ничего доказывать. Его воля несгибаема, как дамасская сталь, разум чист, как горный хрусталь, а рука быстра, как скорость стохастического градиентного спуска. Каглер всегда уверен в своём выборе и, если он хочет в продакшене модель на необоснованных эвристиках и рандомных фичах, значит, так нужно. Это и отличает сопливого, неуверенного в своей ориентации юнца от настоящего мужчины💪
#😅
#😅
🔥42😁15👍4🤩3😱1
#Aleron_фармит
За выходные и немного понедельник наконец-то составили и приоритизировали план + отработали пайплайн модели.🙈
Пока лично сам плетусь где-то в топ-500 из 2 000 участников.
🥇Очень хотим с тимой в голду поэтому цель на оставшиеся две недели стэкнуть 40 разных Bert'ов в единый ансамбль. Уже есть список😶🌫️
P.S. - одна только RoBerta-base требует на обучение около 7 часов. Но инференс очень быстрый - 10 минут. По-любому все успеем🙂🤥
#JigSaw
#Аминь
За выходные и немного понедельник наконец-то составили и приоритизировали план + отработали пайплайн модели.🙈
Пока лично сам плетусь где-то в топ-500 из 2 000 участников.
🥇Очень хотим с тимой в голду поэтому цель на оставшиеся две недели стэкнуть 40 разных Bert'ов в единый ансамбль. Уже есть список😶🌫️
P.S. - одна только RoBerta-base требует на обучение около 7 часов. Но инференс очень быстрый - 10 минут. По-любому все успеем🙂🤥
#JigSaw
#Аминь
🔥13👍8
✊Не бойся биться против тех, кто отрабатывал тюнинг тысячи разных моделей. Опасайся того, кто отрабатывал тюнинг одного бустинга, но 1000 раз 😅
#optuna_мама
#catboost_папа
#optuna_мама
#catboost_папа
👍30❤3🔥2🤩2😱1
👨🏻🌾#Aleron_фармит
Такс, еще одни выходные заканчиваются. И мы все еще не в топ-10% текущего JigSaw на Kaggle
🙃Заметил, что как-то резко наше место на лидер борде опустилось на пару сотен позиций🤔 Оказалось, кто-то опубликовал решение с высоким скором, но при этом с безумным оверфитом, как мне кажется. Скрин прилагаю =)
Хотя может это и не оверфит вовсе, а просто я хейтер🤷♀️
🤔Решили резко сменить стратегию и немного отойти от ансамбля бертов в сторону классических линейных регрессий💪. Скор подлетел😳 Будем с тимой пробовать дальше и верить своей валидации.
Такс, еще одни выходные заканчиваются. И мы все еще не в топ-10% текущего JigSaw на Kaggle
🙃Заметил, что как-то резко наше место на лидер борде опустилось на пару сотен позиций🤔 Оказалось, кто-то опубликовал решение с высоким скором, но при этом с безумным оверфитом, как мне кажется. Скрин прилагаю =)
Хотя может это и не оверфит вовсе, а просто я хейтер🤷♀️
🤔Решили резко сменить стратегию и немного отойти от ансамбля бертов в сторону классических линейных регрессий💪. Скор подлетел😳 Будем с тимой пробовать дальше и верить своей валидации.
👍14😁2
🔞Пост может содержать ненормативную лексику
😳На второй недели активной участия в чемпионате JigSaw на ранжирование текстов по уровню токсичности - поймал себя на мысли, что я понятия не имею, что такое токсичность.
Это вроде агрессия, но не совсем…
Похоже на гнев, но не он...
Как бы ирония, а вот нет…
Наличие матов ..., близко, но это лишь маркеры токсичности...
🤔Так что же такое эта ваша токсичность?!
🙈Учим модели тому, что сами не понимаем.
На скрине пример, где вроде бы все токсично, но добавление слова enjoy сразу делает его не токсичным.🤷♀️ Причем сложно поспорить. По смыслу действительно не токсично😄🤪🔫
😳На второй недели активной участия в чемпионате JigSaw на ранжирование текстов по уровню токсичности - поймал себя на мысли, что я понятия не имею, что такое токсичность.
Это вроде агрессия, но не совсем…
Похоже на гнев, но не он...
Как бы ирония, а вот нет…
Наличие матов ..., близко, но это лишь маркеры токсичности...
🤔Так что же такое эта ваша токсичность?!
🙈Учим модели тому, что сами не понимаем.
На скрине пример, где вроде бы все токсично, но добавление слова enjoy сразу делает его не токсичным.🤷♀️ Причем сложно поспорить. По смыслу действительно не токсично😄🤪🔫
🤔13😁2
😎Ооо, Сбер пересчитался на привате🎰. Поднялись на + 2 позиции вверх, что неплохо✅
Последние два дня у меня эйфория от количества надвигающихся или актуальных чемпионатов. Сейчас у вас тоже ее вызову!
1) На одном только Kaggle + 2 свежие соревы по CV и NLP, задачи прям как я люблю🐬👨⚕️
2) Сорева на Boosters от hhu все никак не дождется меня. Но пайплайн я уже зарядил.🪖
3) Тиммейты по запущенному IDAO 2022 уже тегают меня в чате, ждут когда меня JigSaw отпустит🚀
4) А тут еще и Data Fusion на 2 мульта прилетел🍋🍋
5) Так еще кент из Германии сказал, если мы в Global AI Challenge не урвем призовые, то мы больше не кенты 😳 Что ж, значит придется забрать весь банк💰🧞♂️
6) Более того, я мечтаю урвать крутой квадракоптер себе в сореве по детекции еды тут 🚁
Сезон начался⏱. Хоть отпуск бери и фарми на всю катушку. Чувствую, надо собирать еще несколько тим, чтоб везде успеть. Ох, какой же февраль будет жарким🔥🤹. Планирую везде войти в топы 💪🤠
Репости пост. Пусть твои кенты из DS тоже побеждают😉
Последние два дня у меня эйфория от количества надвигающихся или актуальных чемпионатов. Сейчас у вас тоже ее вызову!
1) На одном только Kaggle + 2 свежие соревы по CV и NLP, задачи прям как я люблю🐬👨⚕️
2) Сорева на Boosters от hhu все никак не дождется меня. Но пайплайн я уже зарядил.🪖
3) Тиммейты по запущенному IDAO 2022 уже тегают меня в чате, ждут когда меня JigSaw отпустит🚀
4) А тут еще и Data Fusion на 2 мульта прилетел🍋🍋
5) Так еще кент из Германии сказал, если мы в Global AI Challenge не урвем призовые, то мы больше не кенты 😳 Что ж, значит придется забрать весь банк💰🧞♂️
6) Более того, я мечтаю урвать крутой квадракоптер себе в сореве по детекции еды тут 🚁
Сезон начался⏱. Хоть отпуск бери и фарми на всю катушку. Чувствую, надо собирать еще несколько тим, чтоб везде успеть. Ох, какой же февраль будет жарким🔥🤹. Планирую везде войти в топы 💪🤠
Репости пост. Пусть твои кенты из DS тоже побеждают😉
👍19🔥4🤯3❤2
🎪Через 10 минут будет "цирк с конями"🤠
Финишировали в 8-й сотне из 2300 участников, но модель сделали стабильную🗿
Пока ждем, что нас подкинет вверх на ~300-400 позиций выше☝️ .
Хотели пихнуть 30-бертов, а по факту пихнули 5 линейных регрессий😂
Увы, ничего другого не помогало поднять скор🤷♀️
Ждем-с!🙈
#JigSaw 2022
#Aleron_фармит
UP: ждем до 3 часов👨🏻🦳
Финишировали в 8-й сотне из 2300 участников, но модель сделали стабильную🗿
Пока ждем, что нас подкинет вверх на ~300-400 позиций выше☝️ .
Хотели пихнуть 30-бертов, а по факту пихнули 5 линейных регрессий😂
Увы, ничего другого не помогало поднять скор🤷♀️
Ждем-с!🙈
#JigSaw 2022
#Aleron_фармит
UP: ждем до 3 часов👨🏻🦳
🔥14😱3
🥉Бронза !!! 😳
🙅♂️ Почти, но увы нет. Мы не поверили локальной валидации полностью и решили опираться на скор на лидер борде. Выбрали неверный финальный сабмишен🙃
🎳Как итог, вместо того чтобы подлететь на 600 мест вверх и залелеть в бронзу, мы выбрали неверный сабмит и слетели на 400 позиций вниз.😬
🤔Не знаю, что заставило меня сменить изначальную стратегию "стекать берты", но ансамбль ридж регрессий оказался по факту слабее, хотя подавал хорошие надежды.
🧗♀️Окей, пайплайн с Bert'ами я отработал, будем крушить в следующих NLP чемпионатах уже не с нуля😈
Тащили с @a_dzis 💪💪💪
#Aleron_фармит
#fails
🙅♂️ Почти, но увы нет. Мы не поверили локальной валидации полностью и решили опираться на скор на лидер борде. Выбрали неверный финальный сабмишен🙃
🎳Как итог, вместо того чтобы подлететь на 600 мест вверх и залелеть в бронзу, мы выбрали неверный сабмит и слетели на 400 позиций вниз.😬
🤔Не знаю, что заставило меня сменить изначальную стратегию "стекать берты", но ансамбль ридж регрессий оказался по факту слабее, хотя подавал хорошие надежды.
🧗♀️Окей, пайплайн с Bert'ами я отработал, будем крушить в следующих NLP чемпионатах уже не с нуля😈
Тащили с @a_dzis 💪💪💪
#Aleron_фармит
#fails
👍21🔥8👏4