NEW BOT Телеграм, страница - 177950993

🏆 Data Feeling | AIeron

15.5K subscribers

751 photos

227 videos

6 files

485 links

IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2

Download Telegram

About

Blog

Apps

Platform

🏆 Data Feeling | AIeron

15.5K subscribers

🏆 Data Feeling | AIeron

🏆 Data Feeling | AIeron

Ого, да я сам бы завалил этот вопрос. А сетка еще и тесты накидала.

Если вам надо пройти лайф-кодинг, просто кидайте свои вопросы в chatGPT.

Live coding на python пройдент.

😁28🔥4👍2🏆2

3.95K viewsАлерон Миленькин, 14:37

🏆 Data Feeling | AIeron

🏆 Data Feeling | AIeron

Ого, да я сам бы завалил этот вопрос. А сетка еще и тесты накидала. Если вам надо пройти лайф-кодинг, просто кидайте свои вопросы в chatGPT. Live coding на python пройдент.

Засчитывать ей SQL или нет? Отвечает мгновенно.

Революция наступила.

👍19🔥4😁1

3.7K viewsАлерон Миленькин, 14:50

🏆 Data Feeling | AIeron

🏆 Data Feeling | AIeron

Устал видеть длинные "сопли" в чужих ноутбуках. Поэтому вот вам лайфхак как сделать установку либ в Jupyter Notebook'ах аккуратнее, если вы стеснялись спросить. Способ не единственный, но мне этого хватает.

😳 Чей способ лучше, мой или от GPT? Только честно

Кажется, gpt решила и меня заменить.

Теперь она будет с вами лайф-хаками делиться. Ждем, когда она выиграет первую медаль на Kaggle.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍15🔥9😁1

3.69K viewsАлерон Миленькин, edited 15:04

🏆 Data Feeling | AIeron

🏆 Data Feeling | AIeron

Когда собесишь джуна и в конце спрашиваешь его, какими задачами он хотел бы заниматься. А он такой:

Все-таки GPT джун еще!
И денег платить не надо)

В общем, даже если вы не шарите за Data Science так же блестяще как GPT, все равно не надо говорить, что хотите работать за еду. Всегда называйте вилку.

Ту часть, где GPT задает вопросы мне и я их валю - выкладывать не стал, чтоб не ронять марку😂

На сегодня все. Успехов!

😁38👍12

3.79K viewsАлерон Миленькин, edited 15:13

🏆 Data Feeling | AIeron

Вы просили, я организовал.

Инсайдерский вебинар по текущей задаче на Kaggle.

Залетайте, расскажу пару идей и немного за биологию поболтаем. Подниму ваши шансы на фоне остальный.

https://us02web.zoom.us/j/84090762014?pwd=TFl5cUk4MGkzUzhmOTdZNWJJRzRoUT09

Meeting Passcode: 772480

Update:
Если этот пост наберет 50 огоньков, то я выложу запись.

Update 2:
👨‍🔬 Алерон Миленькин "Introduction to Kaggle competition Novozymes Enzyme Stability Prediction"
📹 Video: https://youtu.be/-rRosSQtP7Y
✔️ Abstract: https://news.1rj.ru/str/sberlogabig/206

🔥98👍4❤3👎2😁2

3.84K viewsАлерон Миленькин, edited 15:02

🏆 Data Feeling | AIeron

🏆 Data Feeling | AIeron

Вы просили, я организовал. Инсайдерский вебинар по текущей задаче на Kaggle. Залетайте, расскажу пару идей и немного за биологию поболтаем. Подниму ваши шансы на фоне остальный. https://us02web.zoom.us/j/84090762014?pwd=TFl5cUk4MGkzUzhmOTdZNWJJRzRoUT09…

А вот вам на сладкое.

Дошли руки дописать статью про решение с American Express. Как и обещал. Делюсь.

Мое первое серебро на Kaggle или как стабилизировать ML модель и подпрыгнуть на 700 мест вверх

Привет, чемпион! Летом прошел очередной чемпионат на Kaggle - " American Express - Default Prediction ", где требовалось предсказывать - выйдет ли пользователь в дефолт или нет. Табличное соревнование...

👍26🔥13👎2

4.16K viewsАлерон Миленькин, edited 16:12

🏆 Data Feeling | AIeron

🏆 Data Feeling | AIeron

А вот вам на сладкое. Дошли руки дописать статью про решение с American Express. Как и обещал. Делюсь.

This media is not supported in your browser

VIEW IN TELEGRAM

4.24K viewsАлерон Миленькин, 16:12

👎11😁4🔥2

🏆 Data Feeling | AIeron

Кого только не встретишь в Таиланде?!

🏄‍♀️ С аппетитом посерфили с Женей и кайфово поболтали за мир DS/ML с высоты тим-лида.

☝️Кстати, Женя матерый competitive data scientist. Заметил его когда-то в топе соревнований на Boosters. (Хотя на Kaggle его так и не уговорил) А еще у Жени есть классный канал, где он делится опытом решаемых задач в Альфе с помощью ML’я.

Канал прикольный, но не помню ссылку. Подскажите?

🎙Если в Бангкоке встретимся на новый год, то запишем подкаст. 🎥📝

#физтехи_повсюду

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥32👍12🎉4👎1

4.9K viewsАлерон Миленькин, edited 15:23

🏆 Data Feeling | AIeron

Раздаю свои долги перед наступающим годом.

📢 Разбор kaggle-соревнования "American Express" в гостях у MISIS AI Lab

Вместе с ребятами из MISIS AI Lab, у которых сейчас идет открытый курс по ML, решили провести онлайн разбор решения kaggle-задачи на предсказанию дефолтов по кредиту, о чем кстати недавно выходила статья на хабре

Поговорим о том, какие методы и техники обычно хороши при решении, казалось бы, обычных табличных соревнований. Обсудим методы стабилизации ML моделей. Возможно разберем что-то из текущих соревнований на Kaggle.

Так же разберемся, что за опенсорс курсы делают эти ребята из МИСИС.

Сегодня, 12 декабря, в 18:00 встречаемся на занятии. Подключение к лекции по ссылке → link

Please open Telegram to view this post

VIEW IN TELEGRAM

👍24🔥9👎5

6.18K viewsАлерон Миленькин, edited 08:59

🏆 Data Feeling | AIeron

🏆 Data Feeling | AIeron

👨🏻‍🌾Как помните, 40 марафонцев фармят сейчас текущую сореву на Kaggle. Финиш уже завтра. 🌊Все было гладко пока масло в огонь не подлили публичные решения, одно из которых занимает сейчас топ-5 на лидерборде. Это какие-то лютые блендинги из решений, опубликованных…

This media is not supported in your browser

VIEW IN TELEGRAM

Придумал очень простую интуитивную аналогию, чтоб объяснить почему смешивание (блендинг) моделей работает.

Есть у вас две модели. Пусть это не модели, а две аудитории двух блогеров. Решено сделать блендинг (кросс-постинг), чтоб максимально увеличить суммарную аудиторию (точность).

😵‍💫 Если это две полностью совпадающие аудитории (одни и те же люди), то от такой взаимной рекламы у вас не будет прироста ни в одном канале. В этом вообще нет смысла.

🤔 А вот если аудитории вообще никак не пересекаются (диверсифицированные модели), но тематики схожие, то при смешивании, вероятность, что уникальные люди из одного канала перейдут в другой будет сильно выше.

🍽 При смешивании ответов нескольких моделей механика полностью аналогична. Это и снижении одновременной ошибки объясняет и баес от допущений каждой из моделей и так далее.

🎓 Это я недавно так объяснял, в чем понт смешивать модели и какие модели вообще полезно смешивать. Быстро дошло.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍29👎15❤4🔥4

5.27K viewsАлерон Миленькин, edited 06:54

🏆 Data Feeling | AIeron

Решил, что весь год усердно трудился и в качестве подарка накуплю себе разных тренингов и мини-курсов на 100к.

Технические навыки подразгоню, англ подкачаю и без физ нагрузки не останусь. Коучей и психологов всяких не хочу, хочу больше во что-нибудь прикладное. Аля «Интенсив по ML System Design» или «Недельное нон-стоп аудирование на английском». Что-то похожее у меня уже было в этом году по MLOps. А еще я успел пройти курс по «Съемке с коптера»

🎅🎄В общем, надо уметь себя порадовать хотя бы на НГ. Поэтому пишу это сюда, чтоб точно не смог потом отмазаться перед самим собой, да и с вами поделиться потом полным чеклистом ништяков.

И вообще, скоро буду подводить итоги года. Сейчас все силы бросил на борьбу за золото на Kaggle. Ензимы оказались невероятно интересными. Это тянет на несколько сочных статей на Хабре. Осталось только подняться еще ~40 мест 😅

Ждите вестей и напишите в комменты, что вы себе подарили? Хочу варианты поизучать

👍57🔥11

4.43K viewsАлерон Миленькин, edited 13:48

🏆 Data Feeling | AIeron

Встретился сегодня с земляком из Сочи. Тот сказал интересную фразу: "Я твой канал почитал, на ютубе тебя послушал. Вообще ни слова не понял, но понял, что ты чем-то из IT сферы занимаешься"

Не знаю почему, но мне было очень смешно. А еще приятно, что Вы меня все понимаете) Хотя бы иногда!

Ладно родители крестились, когда мои рабочие разговоры слышали, но от ровесников из digital мира все равно похожее забавляет. Живете в разных мирах и разных информационных пузырях.

Кстати, с людьми не из IT, как правило ~~я не разговариваю, ибо зачем~~ при разговоре я не использую терминологию совсем. Четко слежу за тем, чтоб собеседнику было легко меня понимать. Душнил в мире и без того хватает, таких, кто не может от профессиональных деформаций оправиться, когда в мир "обычных смертных" спускается.

👍54🔥14👎5😁3❤2

4.52K viewsАлерон Миленькин, edited 15:48

🏆 Data Feeling | AIeron

Меня периодически спрашивают, а что нужно, чтоб выигрывать на Kaggle и прочих DS чемпионатах?!

🎰 Вопрос не однозначный, но вот недавно увидел критерии молодых ребят, чтоб попасть к ним в команду по фармингу Kaggle и тп.

👨‍🔧 Проверьте себя. Интересный чек-лит.
На пункте про "медвежонка" прям орнул. Не хватает еще фрикаделек на Lingualeo 1k+

😁63🔥28👍5👎2🤔1

4.79K viewsАлерон Миленькин, edited 13:36

🏆 Data Feeling | AIeron

Уперлись с командой в очень необычный кейс ...

Вот у нас есть три предобученные модели, на тесте эти модели дают метрику 0.90, 0.80 и 0.70. (чем больше, тем лучше)

Мы решили построить и отвалидировать ансамбль из трех моделей на трейне. Подали прогнозы моделей как фичи + дополнительные фичи в бустинг. Как итог, бустинг отранжировал выходы моделей по важности абсолютно противоположно тесту. Более того, на тесте ансамбль дал значение метрики r ~ 0.75 😳 Хотя если тупо усреднить с весами, дает >0.9

Вот думаем, что делать) Как смешивать? Как выбить мета моделью больше 0.9? Метрика на тесте - корреляция Спирмена.

Из идей, навесить на фичи веса, чтоб бустинг через "не хочу" ранжировал фичи в соответствии с информацией с теста.

#Kaggle

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7🏆5

4.61K viewsАлерон Миленькин, edited 13:59

🏆 Data Feeling | AIeron

👆В целом, это верный путь почти в любой сфере. Если сильно надо - бьешь в одну точку, пока не треснет.

😳 Кстати, спасибо за ваши ответы вчера. Мы все внимательно прочитали и нашли пару идей для себя. Мне понравились варианты с Adversarial Validation и со смешиванием моделей заранее в единую фичу с весами пропорционально известной точности (корреляции) на тесте. Последнее, кажется, может докинуть. Надеюсь, вам тоже было полезно подумать над кейсом.

💪 Аудитория у меня, конечно, заряженная

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥38

4.73K viewsАлерон Миленькин, edited 09:01

🏆 Data Feeling | AIeron

🏆 Взобраться в топ Kaggle без ML

⛔️ Узнал необычный “трюк” по соревнованиям, где метрика - корреляция.

💥 Накидываете на свой ответ шум и скор с ненулевой вероятностью подрастает. Если скор подрос, накидываете еще шум и так пока не станете медалистом. Оказывается, нужно не так много попыток, чтоб зайти в золото и обессмыслить лидерборд.

🤔 Вопрос, можно ли так выиграть на привате?

А пока на борде идет неразбериха, мы продолжаем с тиммейтами валидировать модели в текущем чемпионате. Радует, что локальная валидация коррелирует с бордом.

✅ Еще один, но уже нормальный трюк, который внезапно помог - это учить ансамбль моделей на тех данных, на которых базовые модели имеют такую же точность как и на тесте. То есть выбираете «легкие» для модели объекты. Это аля такой мета-лернинг.

🤪 Очень парадоксально, но в этом чемпионате можно проверять модели сперва на тесте, а только потом уже валидировать на трейне

#kaggle
#Novozymes

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16😁5🔥4

4.28K viewsАлерон Миленькин, edited 05:31

🏆 Data Feeling | AIeron

Выиграть 100к или как написать лучшую статью на Хабре.

😐 Год уходит. Подводить итоги буду завтра, а сейчас просто хочу поделиться небольшой радостью. Выиграл в конкурсе авторов!

😄 За этот год я написал 8 статей на Хабре. Почти каждая была в топе лучших среди недели. Три из них висели в топе лучших за месяц. Про массовые репосты другими группами вообще молчу. А одна оказалась в топе всех топов, закинув меня в топ-1 на Хабре и, как выяснилось сегодня, принесла мне возможность покрыть расходы на идею с курсами на 100к, о которой писал выше.

🤖 Кстати, перед публикацией той статьи у меня не было в мыслях выставлять ее на конкурс, я просто классно провел время играя с новой игрушкой и фантазируя над альтернативами для лого red_mad_robot. На момент завершения статьи, у меня встал выбор, добавить в статью рекламу и получить ~3-5к или просто публикануть, включив в конкурс.

🍽 Чтоб выиграть, мне надо было побороть хотя бы победителя прошлых лет. Спарсив рейтинги других статей Хабра и сравнив со своими - понял, что мат ожидание выигрыша трое кратно выше, чем просто разовая плата. Как видите, оценка была хорошей.

😳 Знаете почему я вообще начал писать свои статьи? Все от дури! Однажды ночью мою голову просто разрывал поток мыслей и идей, не дающих спать.

😵‍💫 Не переселив желание поделиться, я просто сел за чистый ворд и начала писать, облегчая так свой "приступ". Так родилась моя первая статья, которую по фану решил заслать на Хабр утром. Тот день был моим первым рабочим днем в Х5.

🤫 Мне очень нравится делиться/писать про штуки, которыми редко кто стал бы делиться. Всякий технический схематоз - это прям мое любимое, то за что я полюбил Хабр.

👻 Скучно писать что-то, про что писали уже до тебя, а вот накропать что-то такое от чего читатель сказал бы: "Вау, это надо запомнить" - это бесценно.

#Хабр #Aleron
#red_mad_robot #ruvds
@datafeeling

Please open Telegram to view this post

VIEW IN TELEGRAM

👍77🔥20🏆5❤2👎1

4.53K viewsАлерон Миленькин, edited 16:37

🏆 Data Feeling | AIeron

🏆 Data Feeling | AIeron

Говорят, новый год не начнется, пока не составишь планы!🎅🏻 Выделил несколько пунктов на этот год, связанные с DS, погнали! За этот год в моих планах: - Отвоевать официальный титул Kaggle мастера🤹‍♂️🏵 - Запустить вебинары совместно с Deep Learning School👨‍🎨…

Традиционно подвожу итоги года и ставлю новые цели 🎯

⛔️ Титул Kaggle мастера - эх, не хватило золотой медали, что ж - стало быть за 2023-й год надо добить уже до Kaggle Grand мастера
✅ Вебинары совместно с Deep Learning School - тут я постарался и внес свой вклад в несколько модулей. Про новый запуски DLS слышали многие.
✅ Довести 3-х людей до медалек на Kaggle - я довел 7-х человек.
⛔️ Стать лидом в X5 - не вышло, но я получил за год большой опыт управления технической командой из 3-х человек.
🟡 Выпустить авторский интенсив по DS - анонса не было, но уже в январе мы его запустим.
✅ Опубликовать научную статью - за этот код я вошел в авторство двух научных статей, где закрывал анализ биологических данных.

✅ Не было моей целью, но горжусь, что под моим началом запустились 7 интересных data блогеров. Приятно было повлиять так сильно на индустрию анализа данных. Это круто!

💪 Что сделаю за 2023-й год?
🌟 Kaggle Grand Master
🌟 Выведу в медали на Kaggle 30 человек
🌟 Сдам IELTS на 8 баллов
🌟 Проведу через свой курс по соревновательному анализу данных 300 человек.
🌟 Нарешаю 250 LeetCode задачек
🌟 Выведу свой пет-проект по аналитике на самоокупаемость
🌟 Пройду и засниму собеседование в МААНГ-like компанию
🌟 Напишу на Хабр 25 новых статей.
🌟 10К подписчиков @datafeeling

Год будет драйвовее предыдущего. Всех с наступающим, мои чемпионы!

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥91👍26❤6👎2

5.44K viewsАлерон Миленькин, edited 15:28

🏆 Data Feeling | AIeron

This media is not supported in your browser

VIEW IN TELEGRAM

0:28

5.12K viewsАлерон Миленькин, 21:34

🔥54👍16🎉9❤7👎1