🏆 Data Feeling | AI – Telegram
🏆 Data Feeling | AI
15.9K subscribers
732 photos
222 videos
6 files
469 links
IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2
Download Telegram
Чем больше участвую в соревнованиях, тем больше убеждаюсь, что классические приемы, которым учат на курсах по Data Science часто не работают.

😉 В классических курсах, тебя учат обучать модель на таких данных, которые точно встретятся в тесте.

😆 В реальных боевых или соревновательных условиях - это часто не так. А если это нет так, то надо делать модель более обобщенной.

😱 Простейший пример - early stopping, с помощью которого находят оптимальное время обучения модели. Так вот, хорошей практикой, при участии в соревнованиях, является остановка обучения модели на более ранних стадиях. Так можно откалибровать локальную валидацию по отложенной выборке на лидер борде и не допустить переобучения под тренировочную выборку.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍60🔥6👎3🏆1
Девушки, занимающиеся Data Science, просто сверх сексуальны
🔥87👎55😁17🤔148👍6🏆1
У меня для вас две новости.
Хорошая и не очень.

😈 Та что не очень, вот:
Please open Telegram to view this post
VIEW IN TELEGRAM
👎22😁6👍3
😇 Хорошая новость:

А уже сегодня — 11 ноября в 19:00 по мск пройдет стрим с моковым собеседованием на Junior ML позицию в рамках Tech Interview Fest

😈 Провожу собеседование я вдоем с ментором SolveryДжамилем Закировым (ML Engineer в EyeQ Inc.)

Сегодня анонсируем участника от сообщества
Им стал Никита Дильман 🎉🥂

Присоединяйтесь в качестве зрителя, поддержите Никиту, а также задайте свои вопросы мне и Джамилю в конце стрима. Можете накидать их сюда под постом даже =)

Регистрируйтесь в качестве зрителя по ссылке

Кайфового дня!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍9👎1🎉1
Меня одного уже достал своей навязчивой рекламой этот Алекс Рубанов?!?!?!

Принципиально уже никогда не куплю его продукты😂

Чертовы инфо-цЫганы!
🔥29😁18👎2
🏆 Data Feeling | AI
Картинка, как маленький спойлер. Какая модель лучше и почему? 😈 Ссылка на интервью на ютуб. Уже идет!
😈Простой вопрос, который для меня казался очевидным, сходу почти никто не осилил.

😘 Да, верно угадывают, что вторая модель может нестабильно работать в случае пропусков или выбросов. Однако, никто не сказал, как пофиксить эту проблему. Хотя вчерашний собеседуемый в целом догадался🤫

🥳 В общем, такую проблему можно исправить регуляризацией.
В случае нейронок это дропаут, в случае бустингов это уменьшение процента признаков на дерево.

😜 Тюним: colsample_bytree / feature_fraction и другие похожие по смыслу параметры. Смысл заставить модель опираться сильнее на менее важные признаки. Способов масса.


🧐 Какой ваш любимый гипер-параметр в бустингах?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42👎4🤔3😱1
Иногда хочу постить свои мысли вот так. Переворчивать тренды на биржах одним только твитом, как Илон Маск.

Нравится?
👎97👍43😁26
Устал видеть длинные "сопли" в чужих ноутбуках. Поэтому вот вам лайфхак как сделать установку либ в Jupyter Notebook'ах аккуратнее, если вы стеснялись спросить.

Способ не единственный, но мне этого хватает.
👍114👎16🔥11
После пары моих постов (этого и этого), все чаще люди начинают спрашивать у меня про Таиланд.

Кажется, мне не избежать поста про Тай. Придется все-таки побыть немного в роли тайского амбассадора и рассказать больше про свой опыт пребывания тут. В противном случае, моя личка лопнет скоро без универсального ответа.

Окей, сейчас расскажи немного как тут живется и почему я выбрали именно Таиланд на ближайший год, а не другую страну.

Вообще, я бы не подумал про это писать, но на этих выходных - был прикольный момент. Поехал небольшой компанией на Краби (погуглите, если никогда не видели, что это). Пока фотографировали коптером местные красоты с катера, я спросил своего приятеля Игоря: "А почему ты решил рвануть в Тай?" Ответ был по типу - твой пост про сравнение Турции, Казахстана и Таиланда навел меня на этим мысли.

Мне было чертовски приятно это слышать, что я пишу то что откликается в некоторых. Хотя никого агитировать не планировал, но по счастливому лицу Игоря было понятно, что он не промахнулся. К тому же, мне очень не хватало тут Физтехов первые пару недель.

Мне вообще приятно, когда удается навести людей на верные мысли или сделать удачный выбор. Например удачный сабмит🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32👎9
🏆 Data Feeling | AI
После пары моих постов (этого и этого), все чаще люди начинают спрашивать у меня про Таиланд. Кажется, мне не избежать поста про Тай. Придется все-таки побыть немного в роли тайского амбассадора и рассказать больше про свой опыт пребывания тут. В противном…
This media is not supported in your browser
VIEW IN TELEGRAM
✈️ Как сейчас приехать в Тай?
Покупаешь любой билет и летишь сюда. Сам летел через Индию. Пришлось делать визу и ПЦР, зато билет дешевле, чем через Дубай. Собирал маршрут руками, ибо, как помните, авиасейлс хотел меня по-тихому разорить.

🤑 Как расплачиваюсь?
В запасе 4 способа, использую только два.
1) Привез наличку. Разрешено 10к USD, этого хватит вам на год-два точно, если не шиковать. 2) Рубли на карте. Тут куча "менял", которым можно отправить на Сбер/Тиньк и забрать наличку в батах. 3) UnionPay карта. Тут без рекламы. 4) Крипта.

🏠 Где живу? Легко ли снять жилье?
Снял себе качественные апарты с басиком. Выходит 18к рублей в месяц. Уже второй раз тут, поэтому сходу знал куда заеду. Но вижу, что варианты кондиков еще есть, если приехать и ногами поискать. (В сам сезон это правило менее актуально) В целом, всегда можно найти жилье у моря за 30-40к бат в месяца даже в разгар сезона.

👨‍💻 Как там с интернетом?
Таиланд топ-1 в мире по скорости интернета, этим все сказано. Дальше все зависит от того, куда вы заселились. На Пхукете в среднем все на уровне.

Как остаться тут на больше, чем на дефолтные 45 дней?
Прилетаешь и сразу идешь в языковую школу. Тебе делают языковую визу (ED) на год. Школ тут на любой вкус. Сам выбрал самую академическую, где готовят именно к IELTS, вместо формальной ради визы. Такой способ стоит ~70к рублей на год. Через год делаешь снова и так до бесконечности. Встречаю тут русских, которые по 10-15 лет так живут. Учить можно любой язык.

🤤 Как там с едой, инфраструктурой и сервисом?!
Магазинов еды, услуг и товаров адаптированных под русскоговорящих тут полно. Русские не жалуются. А если жалуются - то открываются свой бизнес и другие русские жалуются уже на что-нибудь другое.

🏝 Почему Пхукет?
В любой момент можно сменить провинцию, но Пхукет по количеству развлечений, соотношения цена/качества меня полностью устраивает.

Что там по комьюнити? С кем можно объединиться?
Тут очень много разных комьюнити, в том числе русско-говорящих. Можно начать с этого чата программистов в Таиланде
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥57👍146👎2
Рандомный кусочек поездки на Краби. Если этот видос наберет больше 100 дизов, то я не буду больше тут постить личные видосы 😅

Update: 30 -> 50 дизов
Update: 50 -> 100 дизов
⛔️ Update: 100 -> 150 дизов
👎81👍49😁14
Forwarded from Алерон на чилле в Тае
This media is not supported in your browser
VIEW IN TELEGRAM
👍88👎68🎉92
🤬 Какой смысл в том, что ты знаешь как работает градиентный бустинг, если ты все равно не знаешь, как его тюнить на практике!?

😏 Тюнить бустинги не изи, если мы говорим про максимальный перфоманс, в одном только LightGBM больше 30 гипер-параметров, про которые многие едва ли слышали.

🤓 Пока решал задачу по текущему Цифровому Прорыву, понял, сколько всего полезного там есть, чего даже я не знал сам. Кстати, влетел в топ.

🤔 Пока убеждаюсь, что лучшая документация среди бустингов у LightGBM. Хотя Catboost мне тоже нравится, но дока не такая удобная.

🤐 Какие у вас есть лайфхаки на эту тему?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍47👎4
Фиксация random_seed'а не помогла воспроизвести скор

😱 Заметил тут вечером любопытный факт. С одной стороны простой технических нюанс, но с другой стороны не очень уж очевидная проблема.

🤔 Оказывается, если в модель (например LightGBM) подавать признаки в разной последовательности, то результаты будут разные, к тому же очень сильно! Получается, порядок обхода фичей важен?!

⛔️ Вы спросите меня, а зачем подавать признаки в разных последовательностях?! Например, если вы хотели удалить дубли в списке и реализовали это так: (привет LeetСode)

features = list(set(features))

😎 Вроде бы красивый трюк, как удалить дубли в одну строчку. Однако, если запустить этот код потом снова, последовательность будет уже иная. Как следствие - иной результат модели.

😵‍💫 Последствия оказываются болезненными, если вы проверяете разные гипотезы и результат модели должен четко отражать наличие/удаление признака, а не более удачную последовательность.

😬 В общем, будьте осторожнее. Вместо Set'а используйте лучше Numpy =)

features = np.unique(features)

👻 Теперь блендить можно не только по разным сидам, но и по разным последовательностям фичей!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62👍22😱9👎1
Угадайте про какой градиентный бустинг идет речь по картинке.

Первые три угадавших получат скидку 50% на мой курс по соревновательному анализу данных. Курса пока нет, но скидка уже будет.
👎40😁19👍3🔥3
Мы тут с ребятками успели пофармить не медалей ради, а потому что было много призовых!

😬 Было 15 призовых мест! Такое я вижу впервые) Боролось за призовые больше 220 человек.

☕️ Унесли с тимой суммарно на троих ~160к за несколько вечеров фултайма. В целом, тоже хорошо. Жалко, что скинули меня с топ-8, удивительно, что подходы были абсолютно разные. Даже сетки заходили, но не в чистом виде.

🤫 У меня был Dart! Это собственно второе соревнование на моей памяти, где хорошо заходит dart из LightGBM. Пришлось помучаться с настройкой т.к по дефолту там нет early-stopping’а, но зато оно того стоило. Сразу бустануло наверх.

🤗 Ссылка на мой ноутбук простынь. Причесал на столько, на сколько мне хватило выдержки.

🤠 Дальше до нового года буду фармить только Kaggle.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍45🏆15👎2
Подумал, прикольно было бы начать разгонять в Таиланде свое IT комьюнити.

🧐🎓 Возможно когда-нибудь даже буткемпы по программированию тут организую пару раз. В Сочи не успел, но мб в Тае получится.

🤔 Уехать в Тай с опытом в IT любой сможет, а вот никто не закрывает спрос - уехать в Тае и уже тут получить опыт в IT.

😳 Это меня вдохновила замужняя пара врачей, которые уволились и уехали в Тай разгоняться в проге.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍23😁9🔥6👎2
Что ж, ждем, когда BERT'ты запретят на территории России

#иноаберт
😁87🔥9👎5👍21🤔1
Боюсь быть уволенным из FAANG’а.

Если глубоко погружаюсь в эти мысли, то даже мурашки пробегают по спине.

Если страх быстро проходит, то просто дополнительно представляю, что у меня ипотека и снова боюсь.

LeetCode пока не решаю, но уже психологически закалюсь.
😁24😱8🔥42👍1👎1