🏆 Data Feeling | AI – Telegram
🏆 Data Feeling | AI
15.9K subscribers
732 photos
222 videos
6 files
470 links
IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2
Download Telegram
Сегодня особый день, поэтому делюсь секретной техникой🤺

Трюк № 49 - random seed = 7575

🤪 Про это мало кто знает, топ-каглеры обычно это всячески скрывают, а разработчики популярных фреймворков нагло отрицают и не подтверждают этого факта, боясь, что другие будут этим активно пользоваться! Хватит это скрывать!

🤫 Раскрываю секрет. Фишка в рандом сиде! Чтоб ваша модель выдавала самый лучший результат указывайте random seed = 7575.

🤹‍♂️ Я провел десятки тысяч симуляций и доказал этот эффект. Результат статистически значимый. Хейтеры начнут спорить, говорить, что это случайность, но мы то с вами знаем, что p-value < 5% нам врать не будет! Все. Тут нет места никаким контраргументам. Эффект не оспорим.

Отныне используйте random_seed = 7575 и побеждайте!
👍53😱22🔥7🤔74
Выходные выходными, но хакатоны сами себя не выиграют.

🚀 Разогнал одну из команд марафона по фармингу в международном хакатончике. Поборолись с гендерным неравенством, за одно урвали немного 💸

🧠 Спарсили данных. Накинули Бертов. Вышли в лидеры🏆. По соотношению призы/время похоже на джуновскую зп.

🏃‍♂️Вышел сейчас в режим, в одни выходные полностью сфокусирован на одной команде. Всего команд 8.
🤔 Не все команды в моем марафоне дойдут до Kaggle-ких медалей, но опыта наберутся точно все, а с кем-то я еще и прям уверен в успехе. Есть очень исполнительные и дерзкие команды, с такими можно стены пробивать!

А как проходят ваши выходные?)

#Моя_тима_фармит
👍33🔥5
Послушал от знакомых успешные кейсы по оферам. Вдохновился. После ряда собесов получил офферы от $50к/год в сфере DA/DS.
🧠 Так как сам собеседую джунов+, а мои друзья-физтехи знают, как правильно продать себя зарубежным компаниям, нам захотелось помочь найти работу и другим!

Что предлагаю?
Хочу взять трех ребят. Проработать позиционирование и CV. Разослать в 50 компаний. Продумать с каждым стратегию и прогнать серию технических собеседований, на ходу подтягивая базу. А после откликов эйчаров помочь с тестовыми.

Идея экспериментальная, поэтому готов взять только трех человек. Условия такие:
✔️ Ты ищешь работу с зп в долларах/евро, удаленно или с релокейтом.
✔️ У тебя разговорный английский (строишь простые предложения)
✔️ Ты junior+/middle с опытом работы от года в DS, DE, DA или разработке на C++.
✔️ У тебя есть 300$ (время людей ценно, бесплатно мотивировать людей работать над тобой не смогу)

Если хочешь уже через 3-4 недели получить несколько валютных офферов, то заполняй форму. STOPED!
👍28🤔4👎2
Не, ну а мало ли?!?!

Преодолеваю свой рекордный по времени 36-часовой перелет через Алматы. Сейчас чилю в лофте в центре. Буду тут до полуночи.

Если ты из Алматы, пиши в лс, может кофе/чай повьем вместе. Потрещим за жизнь и DS.

#Казахстан
👍2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Одно время практиковал пробуждение в 5 утра. Было сложно, почти месяц продержался и бросил.

Однако, желание начинать рабочий день рано осталось.

🧠 Решил проблему гениально. Улетел в Таиланд🇹🇭 Теперь просыпаюсь в 5 утра относительно России. Просыпаясь, есть еще 6 часов до того, как начнётся основная работа. Теперь успеваю прожить по две жизни за одни сутки!

Впервые увидел океан. Нашел кондоминиум с собственным кабинетом и “5G” интернетом и океаном в 15 минутах на байке. Вышло 30к рублевых. Московские цены на аренду нервно курят в сторонке.

#digital_nomad
👍54🔥8👎1
Как я вижу джуновский код, который мне иногда приходится ревьюить.

(На фото типичный двор с ЛЭП в Тае, тут много где такая беда с проводами)

В общем, за циклы в pandas и двор - стреляю в упор😄
24👍8🔥2👎1
🧞‍♂️ Хм, а давайте сделаем код-ревью.

Кидайте в комментарии свои "неудачные" куски кода, которые вы бы хотели узнать как написать изящнее:

Признаки, что стоит скинуть код:
- Кажется, что можно было лучше
- У вас в есть циклы при работе с pandas/numpy и вам кажется, что циклов было никак не избежать
- В целом не знаете, как реализовать задуманную фичу/логику.
- У вас есть ветви с простыми условиями

В любом случае - кидай код или скрин кода. Посмотрю, напишу статейку с разбором частых затыков кодов и примерами как бы стоило это написать изящнее.

За идею спасибо @Veretion

Только Python код)
👍26👎1🤔1
👎 Регрессией и классификацией уже никого не удивишь)

🧠 Пора прокачиваться в мэтчинге и рекомендашках!

🤔 Мэтчинг - новый тренд или совпадение?
👍24👎1🔥1🎉1
🥺 Да, мне говорили что pandas медленный, но чтоб настолько!

🤯 Векторизация groupby дает ускорение в 22 000 раз !!

🤔 Не пытался раньше оптимизировать время, пока pandas не начал обрабатывать генерацию признаков больше четырех часов на датесете в 30М строк от соревы H&M.

🤺 Пришлось освоить за эти выходные векторизованную генерации признаков.

🥷 Техники бывают очень хитрые, но ускорение всегда не меньше, чем в 200 раз. Сложнейшим челенджем для меня было написать подсчет моды с двумя группировками.

🌶 Ждите статью по кунг-фу в pandas/numpy
🔥75👍22😱4👎2
🤺 Пару недель назад решились с друзьями на эксперимент - помочь в получении оферов заграницу.

🪂 Из присланных заявок мы отобрали 4-х джунов+, с которыми на прошлой недели отполировали резюме, linkedin и выявили пробелы по хард скилам в режиме собеседования. Далее раскидали резюме по списку открытых вакансий.

🤷‍♀️ Логично, что некоторым нашим ребятам сразу же после открытия и полировки профиля написали релевантные эйчары

🚀 Мы выделили участникам месяц на то, чтобы как следует разогнаться и получить офер мечты в направлении DS.

🐾 В это время мы:
- Трекаем их прогресс
- Устраиваем тех собесы на английском
- Помогаем в решении присланных тех. заданий
- Не даем отчаяться!

🦍 На этой недели участники продолжают закрывать пробелы в знаниях и тренируют собеседования на английском.

🔥Буду держать в курсе.

P.S - На скрине три сеньорчика мучают джуна:)
👍61🔥18👎2
Взялся в этом семестре вести курс по алгоритмам у иностранной группы студентов в МФТИ.

Цель была прокачать технический английский + заодно алгоритмы повторить.

Возник неожиданный побочный эффект - студенты непривычно ко мне обращаются. Приятно конечно, но каждый раз ору с этого 😂🤔😅🔥😳😎

Update: переводится как преподаватель, а не профессор

#Professor
👍48🔥15👎2🎉2😁1🤔1
Если я хочу что-то изучить глубоко, то просто начинаю это преподавать 🥸

🤠 Увидел рекламу курса по аб тестированию. Кликнул на банер, а там я и мой коллега. Тут же осознал, что реклама от онлайн школы, для которой я этот курсец писал около года назад😳

🤷‍♀️ Заняло 5 месяцев кропотливой работы и чтения не одного десятка статей.

👨🏻‍🌾 Есть побочка - почти сразу понимаю на собесах, шарит ли человек, который спрашивает у меня вопросы про аб-тестирование или просто скрипт читает.

😈 Кстати, сейчас я хочу сильнее углубиться в MLOps - написать свой курсец что ли?!🤔

#НеРеклама
🔥33👍3👎2🤔2
Я сейчас вам покажу, откуда на модель готовился оверфит! И, если бы за шесть часов до конца итераций не был нанесён превентивный early stopping по обучению катбуста по всем четырем фолдам — Я сейчас покажу, рэндом сид я зафиксировал и принёс — То они бы уронили нашу accuracy на привате. Не мы развязали этот лютый стекинг, у нас веса для блендинга чисты и без bias'а. Хорошо, что регуляризировали..
👍58🔥18👎62🤔2😁1🎉1
🤼‍♀️ Давно не рассказывал про марафонцев.

На входе в марафон было 5 основных и 3 запасных команд. Сейчас среди активных ~4. Причем 3 из них вот-вот урвут себе медали/призовые или уже что-то урвали.

⚙️ Так вышло, что только пару дней назад к нам пришел в доступ сервак. До этого обходились иными ресурсами. Сейчас же все участники заряжены GPU и CPU ресурсами в приоритете срочности.

✌️Тем не менее, одна из команд мне особенно импонирует - они сейчас в топе Data Fusion от ВТБ. Не буду загадывать, но судя по их задиристости и подъехавшим мощностям - эти ребята заберут себе не меньше двух соток.

Моя задача на ближайшие три недели оставшегося времени - не дать им остановиться и забрать вообще весь банк.

#Моя_тима_фармит
👍11🔥5👎3
💡Идея

- Устраивать собесы по позициям из DS
- Фачить кандидатов с коллегами из DS
- Победитель (успешно ответивших на все) получает $100
- Собесы записывать и скидывать в канал


Update:
- Возможно будем брать только джунов, чтоб всю зп не слить на призовые😂😈 (нет)


Пиши в комменты, если хочешь попасть
👍33🔥15👎2
😅Кого только не встретишь в Таиланде :)

🔥Kaggle Grand Master’а тут тоже отдыхают)

🌴Покатались по островам. Выпили по кокосу. Поболтали за DS. Обменялись идеями.
🔥64👍95😱5👎3
Подходит к концу мой почти трехмесячный тур заграницей. За это время я успеваю побывать в 4 странах. Сейчас делаю небольшую паузу и возвращаюсь в Москву (лишь на время)

За время тура:
- Разогнал нетворкинг
- Успел выиграть хак
- Запустил два пет-проекта
- Написал часть DS курса
- Записал вам 3 мок собеса
- Раз 80 искупался в бассейне

🎯Считаю теперь, что удаленка заграницей - это топчик. Одно из немногих, что сильно тебя бустит.

P.S. Пользуясь моментом, скажу, что в Таиланде открыты Apple Store’ы. А значит я могу привести тебе в Мск дефицитные один-два 🍎🍏 по рыночной цене по запросу. Пиши в лс.
🔥27👍93👎1😱1
Это я приехал в Россию и с кайфом продолжаю пользоваться всеми зарубежными сервисами (нет)
👎23🎉2👍1🔥1🤔1
Пока записи с мок собеседованиями по Data Science обрабатываются -делюсь лайфхаком.

В Линкедине, оказывается, полезно указать свой телеграм. В личку начинают писать HR'ы. На скрине Тайская компания написала в лс. Очень удобно.

Кстати, и линкедином я теперь тоже пользуюсь через боль.
👍22👎1