Сегодня особый день, поэтому делюсь секретной техникой🤺
Трюк № 49 - random seed = 7575
🤪 Про это мало кто знает, топ-каглеры обычно это всячески скрывают, а разработчики популярных фреймворков нагло отрицают и не подтверждают этого факта, боясь, что другие будут этим активно пользоваться! Хватит это скрывать!
🤫 Раскрываю секрет. Фишка в рандом сиде! Чтоб ваша модель выдавала самый лучший результат указывайте random seed = 7575.
🤹♂️ Я провел десятки тысяч симуляций и доказал этот эффект. Результат статистически значимый. Хейтеры начнут спорить, говорить, что это случайность, но мы то с вами знаем, что p-value < 5% нам врать не будет! Все. Тут нет места никаким контраргументам. Эффект не оспорим.
Отныне используйте random_seed = 7575 и побеждайте!
Трюк № 49 - random seed = 7575
🤪 Про это мало кто знает, топ-каглеры обычно это всячески скрывают, а разработчики популярных фреймворков нагло отрицают и не подтверждают этого факта, боясь, что другие будут этим активно пользоваться! Хватит это скрывать!
🤫 Раскрываю секрет. Фишка в рандом сиде! Чтоб ваша модель выдавала самый лучший результат указывайте random seed = 7575.
🤹♂️ Я провел десятки тысяч симуляций и доказал этот эффект. Результат статистически значимый. Хейтеры начнут спорить, говорить, что это случайность, но мы то с вами знаем, что p-value < 5% нам врать не будет! Все. Тут нет места никаким контраргументам. Эффект не оспорим.
Отныне используйте random_seed = 7575 и побеждайте!
👍53😱22🔥7🤔7❤4
Выходные выходными, но хакатоны сами себя не выиграют.
🚀 Разогнал одну из команд марафона по фармингу в международном хакатончике. Поборолись с гендерным неравенством, за одно урвали немного 💸
🧠 Спарсили данных. Накинули Бертов. Вышли в лидеры🏆. По соотношению призы/время похоже на джуновскую зп.
🏃♂️Вышел сейчас в режим, в одни выходные полностью сфокусирован на одной команде. Всего команд 8.
🤔 Не все команды в моем марафоне дойдут до Kaggle-ких медалей, но опыта наберутся точно все, а с кем-то я еще и прям уверен в успехе. Есть очень исполнительные и дерзкие команды, с такими можно стены пробивать!
А как проходят ваши выходные?)
#Моя_тима_фармит
🚀 Разогнал одну из команд марафона по фармингу в международном хакатончике. Поборолись с гендерным неравенством, за одно урвали немного 💸
🧠 Спарсили данных. Накинули Бертов. Вышли в лидеры🏆. По соотношению призы/время похоже на джуновскую зп.
🏃♂️Вышел сейчас в режим, в одни выходные полностью сфокусирован на одной команде. Всего команд 8.
🤔 Не все команды в моем марафоне дойдут до Kaggle-ких медалей, но опыта наберутся точно все, а с кем-то я еще и прям уверен в успехе. Есть очень исполнительные и дерзкие команды, с такими можно стены пробивать!
А как проходят ваши выходные?)
#Моя_тима_фармит
👍33🔥5
Послушал от знакомых успешные кейсы по оферам. Вдохновился. После ряда собесов получил офферы от $50к/год в сфере DA/DS.
🧠 Так как сам собеседую джунов+, а мои друзья-физтехи знают, как правильно продать себя зарубежным компаниям, нам захотелось помочь найти работу и другим!
Что предлагаю?
Хочу взять трех ребят. Проработать позиционирование и CV. Разослать в 50 компаний. Продумать с каждым стратегию и прогнать серию технических собеседований, на ходу подтягивая базу. А после откликов эйчаров помочь с тестовыми.
Идея экспериментальная, поэтому готов взять только трех человек. Условия такие:
✔️ Ты ищешь работу с зп в долларах/евро, удаленно или с релокейтом.
✔️ У тебя разговорный английский (строишь простые предложения)
✔️ Ты junior+/middle с опытом работы от года в DS, DE, DA или разработке на C++.
✔️ У тебя есть 300$ (время людей ценно, бесплатно мотивировать людей работать над тобой не смогу)
Если хочешь уже через 3-4 недели получить несколько валютных офферов, то заполняй форму. STOPED!
🧠 Так как сам собеседую джунов+, а мои друзья-физтехи знают, как правильно продать себя зарубежным компаниям, нам захотелось помочь найти работу и другим!
Что предлагаю?
Хочу взять трех ребят. Проработать позиционирование и CV. Разослать в 50 компаний. Продумать с каждым стратегию и прогнать серию технических собеседований, на ходу подтягивая базу. А после откликов эйчаров помочь с тестовыми.
Идея экспериментальная, поэтому готов взять только трех человек. Условия такие:
✔️ Ты ищешь работу с зп в долларах/евро, удаленно или с релокейтом.
✔️ У тебя разговорный английский (строишь простые предложения)
✔️ Ты junior+/middle с опытом работы от года в DS, DE, DA или разработке на C++.
✔️ У тебя есть 300$ (время людей ценно, бесплатно мотивировать людей работать над тобой не смогу)
Если хочешь уже через 3-4 недели получить несколько валютных офферов, то заполняй форму. STOPED!
👍28🤔4👎2
Не, ну а мало ли?!?!
Преодолеваю свой рекордный по времени 36-часовой перелет через Алматы. Сейчас чилю в лофте в центре. Буду тут до полуночи.
Если ты из Алматы, пиши в лс, может кофе/чай повьем вместе. Потрещим за жизнь и DS.
#Казахстан
Преодолеваю свой рекордный по времени 36-часовой перелет через Алматы. Сейчас чилю в лофте в центре. Буду тут до полуночи.
Если ты из Алматы, пиши в лс, может кофе/чай повьем вместе. Потрещим за жизнь и DS.
#Казахстан
👍2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Одно время практиковал пробуждение в 5 утра. Было сложно, почти месяц продержался и бросил.
Однако, желание начинать рабочий день рано осталось.
🧠 Решил проблему гениально. Улетел в Таиланд🇹🇭 Теперь просыпаюсь в 5 утра относительно России. Просыпаясь, есть еще 6 часов до того, как начнётся основная работа. Теперь успеваю прожить по две жизни за одни сутки!
✅ Впервые увидел океан. Нашел кондоминиум с собственным кабинетом и “5G” интернетом и океаном в 15 минутах на байке. Вышло 30к рублевых. Московские цены на аренду нервно курят в сторонке.
#digital_nomad
Однако, желание начинать рабочий день рано осталось.
🧠 Решил проблему гениально. Улетел в Таиланд🇹🇭 Теперь просыпаюсь в 5 утра относительно России. Просыпаясь, есть еще 6 часов до того, как начнётся основная работа. Теперь успеваю прожить по две жизни за одни сутки!
✅ Впервые увидел океан. Нашел кондоминиум с собственным кабинетом и “5G” интернетом и океаном в 15 минутах на байке. Вышло 30к рублевых. Московские цены на аренду нервно курят в сторонке.
#digital_nomad
👍54🔥8👎1
🧞♂️ Хм, а давайте сделаем код-ревью.
Кидайте в комментарии свои "неудачные" куски кода, которые вы бы хотели узнать как написать изящнее:
Признаки, что стоит скинуть код:
- Кажется, что можно было лучше
- У вас в есть циклы при работе с pandas/numpy и вам кажется, что циклов было никак не избежать
- В целом не знаете, как реализовать задуманную фичу/логику.
- У вас есть ветви с простыми условиями
В любом случае - кидай код или скрин кода. Посмотрю, напишу статейку с разбором частых затыков кодов и примерами как бы стоило это написать изящнее.
За идею спасибо @Veretion
Только Python код)
Кидайте в комментарии свои "неудачные" куски кода, которые вы бы хотели узнать как написать изящнее:
Признаки, что стоит скинуть код:
- Кажется, что можно было лучше
- У вас в есть циклы при работе с pandas/numpy и вам кажется, что циклов было никак не избежать
- В целом не знаете, как реализовать задуманную фичу/логику.
- У вас есть ветви с простыми условиями
В любом случае - кидай код или скрин кода. Посмотрю, напишу статейку с разбором частых затыков кодов и примерами как бы стоило это написать изящнее.
За идею спасибо @Veretion
Только Python код)
👍26👎1🤔1
Три мои статьи про соревновательный анализ данных, которые получили хороший отклик. Забирай!
🙅♂️ 8 ошибок, из-за которых ты проиграешь в соревновательном Data Science
👮♀️ 5 грязных трюков в соревновательном Data Science, о которых тебе не расскажут в приличном обществе
🤹♂️ Как увеличить точность модели с 80% до 90%+ (мой опыт)
🙅♂️ 8 ошибок, из-за которых ты проиграешь в соревновательном Data Science
👮♀️ 5 грязных трюков в соревновательном Data Science, о которых тебе не расскажут в приличном обществе
🤹♂️ Как увеличить точность модели с 80% до 90%+ (мой опыт)
🔥37👍13👎1😱1
🥺 Да, мне говорили что pandas медленный, но чтоб настолько!
🤯 Векторизация groupby дает ускорение в 22 000 раз !!
🤔 Не пытался раньше оптимизировать время, пока pandas не начал обрабатывать генерацию признаков больше четырех часов на датесете в 30М строк от соревы H&M.
🤺 Пришлось освоить за эти выходные векторизованную генерации признаков.
🥷 Техники бывают очень хитрые, но ускорение всегда не меньше, чем в 200 раз. Сложнейшим челенджем для меня было написать подсчет моды с двумя группировками.
🌶 Ждите статью по кунг-фу в pandas/numpy
🤯 Векторизация groupby дает ускорение в 22 000 раз !!
🤔 Не пытался раньше оптимизировать время, пока pandas не начал обрабатывать генерацию признаков больше четырех часов на датесете в 30М строк от соревы H&M.
🤺 Пришлось освоить за эти выходные векторизованную генерации признаков.
🥷 Техники бывают очень хитрые, но ускорение всегда не меньше, чем в 200 раз. Сложнейшим челенджем для меня было написать подсчет моды с двумя группировками.
🌶 Ждите статью по кунг-фу в pandas/numpy
🔥75👍22😱4👎2
🤺 Пару недель назад решились с друзьями на эксперимент - помочь в получении оферов заграницу.
🪂 Из присланных заявок мы отобрали 4-х джунов+, с которыми на прошлой недели отполировали резюме, linkedin и выявили пробелы по хард скилам в режиме собеседования. Далее раскидали резюме по списку открытых вакансий.
🤷♀️ Логично, что некоторым нашим ребятам сразу же после открытия и полировки профиля написали релевантные эйчары ✊
🚀 Мы выделили участникам месяц на то, чтобы как следует разогнаться и получить офер мечты в направлении DS.
🐾 В это время мы:
- Трекаем их прогресс
- Устраиваем тех собесы на английском
- Помогаем в решении присланных тех. заданий
- Не даем отчаяться!
🦍 На этой недели участники продолжают закрывать пробелы в знаниях и тренируют собеседования на английском.
🔥Буду держать в курсе.
P.S - На скрине три сеньорчика мучают джуна:)
🪂 Из присланных заявок мы отобрали 4-х джунов+, с которыми на прошлой недели отполировали резюме, linkedin и выявили пробелы по хард скилам в режиме собеседования. Далее раскидали резюме по списку открытых вакансий.
🤷♀️ Логично, что некоторым нашим ребятам сразу же после открытия и полировки профиля написали релевантные эйчары ✊
🚀 Мы выделили участникам месяц на то, чтобы как следует разогнаться и получить офер мечты в направлении DS.
🐾 В это время мы:
- Трекаем их прогресс
- Устраиваем тех собесы на английском
- Помогаем в решении присланных тех. заданий
- Не даем отчаяться!
🦍 На этой недели участники продолжают закрывать пробелы в знаниях и тренируют собеседования на английском.
🔥Буду держать в курсе.
P.S - На скрине три сеньорчика мучают джуна:)
👍61🔥18👎2
Взялся в этом семестре вести курс по алгоритмам у иностранной группы студентов в МФТИ.
Цель была прокачать технический английский + заодно алгоритмы повторить.
Возник неожиданный побочный эффект - студенты непривычно ко мне обращаются. Приятно конечно, но каждый раз ору с этого 😂🤔😅🔥😳😎
Update: переводится как преподаватель, а не профессор
#Professor
Цель была прокачать технический английский + заодно алгоритмы повторить.
Возник неожиданный побочный эффект - студенты непривычно ко мне обращаются. Приятно конечно, но каждый раз ору с этого 😂🤔😅🔥😳😎
Update: переводится как преподаватель, а не профессор
#Professor
👍48🔥15👎2🎉2😁1🤔1
Если я хочу что-то изучить глубоко, то просто начинаю это преподавать 🥸
🤠 Увидел рекламу курса по аб тестированию. Кликнул на банер, а там я и мой коллега. Тут же осознал, что реклама от онлайн школы, для которой я этот курсец писал около года назад😳
🤷♀️ Заняло 5 месяцев кропотливой работы и чтения не одного десятка статей.
👨🏻🌾 Есть побочка - почти сразу понимаю на собесах, шарит ли человек, который спрашивает у меня вопросы про аб-тестирование или просто скрипт читает.
😈 Кстати, сейчас я хочу сильнее углубиться в MLOps - написать свой курсец что ли?!🤔
#НеРеклама
🤠 Увидел рекламу курса по аб тестированию. Кликнул на банер, а там я и мой коллега. Тут же осознал, что реклама от онлайн школы, для которой я этот курсец писал около года назад😳
🤷♀️ Заняло 5 месяцев кропотливой работы и чтения не одного десятка статей.
👨🏻🌾 Есть побочка - почти сразу понимаю на собесах, шарит ли человек, который спрашивает у меня вопросы про аб-тестирование или просто скрипт читает.
😈 Кстати, сейчас я хочу сильнее углубиться в MLOps - написать свой курсец что ли?!🤔
#НеРеклама
🔥33👍3👎2🤔2
Я сейчас вам покажу, откуда на модель готовился оверфит! И, если бы за шесть часов до конца итераций не был нанесён превентивный early stopping по обучению катбуста по всем четырем фолдам — Я сейчас покажу, рэндом сид я зафиксировал и принёс — То они бы уронили нашу accuracy на привате. Не мы развязали этот лютый стекинг, у нас веса для блендинга чисты и без bias'а. Хорошо, что регуляризировали..
👍58🔥18👎6❤2🤔2😁1🎉1
🤼♀️ Давно не рассказывал про марафонцев.
На входе в марафон было 5 основных и 3 запасных команд. Сейчас среди активных ~4. Причем 3 из них вот-вот урвут себе медали/призовые или уже что-то урвали.
⚙️ Так вышло, что только пару дней назад к нам пришел в доступ сервак. До этого обходились иными ресурсами. Сейчас же все участники заряжены GPU и CPU ресурсами в приоритете срочности.
✌️Тем не менее, одна из команд мне особенно импонирует - они сейчас в топе Data Fusion от ВТБ. Не буду загадывать, но судя по их задиристости и подъехавшим мощностям - эти ребята заберут себе не меньше двух соток.
Моя задача на ближайшие три недели оставшегося времени - не дать им остановиться и забрать вообще весь банк.
#Моя_тима_фармит
На входе в марафон было 5 основных и 3 запасных команд. Сейчас среди активных ~4. Причем 3 из них вот-вот урвут себе медали/призовые или уже что-то урвали.
⚙️ Так вышло, что только пару дней назад к нам пришел в доступ сервак. До этого обходились иными ресурсами. Сейчас же все участники заряжены GPU и CPU ресурсами в приоритете срочности.
✌️Тем не менее, одна из команд мне особенно импонирует - они сейчас в топе Data Fusion от ВТБ. Не буду загадывать, но судя по их задиристости и подъехавшим мощностям - эти ребята заберут себе не меньше двух соток.
Моя задача на ближайшие три недели оставшегося времени - не дать им остановиться и забрать вообще весь банк.
#Моя_тима_фармит
👍11🔥5👎3
💡Идея
- Устраивать собесы по позициям из DS
- Фачить кандидатов с коллегами из DS
- Победитель (успешно ответивших на все) получает $100
- Собесы записывать и скидывать в канал
Update:
- Возможно будем брать только джунов, чтоб всю зп не слить на призовые😂😈 (нет)
Пиши в комменты, если хочешь попасть
- Устраивать собесы по позициям из DS
- Фачить кандидатов с коллегами из DS
- Победитель (успешно ответивших на все) получает $100
- Собесы записывать и скидывать в канал
Update:
- Возможно будем брать только джунов, чтоб всю зп не слить на призовые😂😈 (нет)
Пиши в комменты, если хочешь попасть
👍33🔥15👎2
😅Кого только не встретишь в Таиланде :)
🔥Kaggle Grand Master’а тут тоже отдыхают)
🌴Покатались по островам. Выпили по кокосу. Поболтали за DS. Обменялись идеями.
🔥Kaggle Grand Master’а тут тоже отдыхают)
🌴Покатались по островам. Выпили по кокосу. Поболтали за DS. Обменялись идеями.
🔥64👍9❤5😱5👎3
Подходит к концу мой почти трехмесячный тур заграницей. За это время я успеваю побывать в 4 странах. Сейчас делаю небольшую паузу и возвращаюсь в Москву (лишь на время)
За время тура:
- Разогнал нетворкинг
- Успел выиграть хак
- Запустил два пет-проекта
- Написал часть DS курса
- Записал вам 3 мок собеса
- Раз 80 искупался в бассейне
🎯Считаю теперь, что удаленка заграницей - это топчик. Одно из немногих, что сильно тебя бустит.
P.S. Пользуясь моментом, скажу, что в Таиланде открыты Apple Store’ы. А значит я могу привести тебе в Мск дефицитные один-два 🍎🍏 по рыночной цене по запросу. Пиши в лс.
За время тура:
- Разогнал нетворкинг
- Успел выиграть хак
- Запустил два пет-проекта
- Написал часть DS курса
- Записал вам 3 мок собеса
- Раз 80 искупался в бассейне
🎯Считаю теперь, что удаленка заграницей - это топчик. Одно из немногих, что сильно тебя бустит.
P.S. Пользуясь моментом, скажу, что в Таиланде открыты Apple Store’ы. А значит я могу привести тебе в Мск дефицитные один-два 🍎🍏 по рыночной цене по запросу. Пиши в лс.
🔥27👍9❤3👎1😱1
🔥Подъехала первая запись мок интервью по анализу данных.
🦹🏼♂️Налетайте!
✅Ссылка на запись
😎Совместно с Dzis Science
🦹🏼♂️Налетайте!
✅Ссылка на запись
😎Совместно с Dzis Science
YouTube
Типичное собеседование #1. Позиция Junior Data Scientist. Accepted!
Сегодня мы прособеседуем начинающего кандидата в Data Science.
Будет много вопросов по ML и статистике, посмотрим как кандидат с этим справится!
Канал Александра: t.me/datafeeling
Канал Андрея t.me/dzis_science
Таймкоды встречи:
0:00 - Расказ о кандидате…
Будет много вопросов по ML и статистике, посмотрим как кандидат с этим справится!
Канал Александра: t.me/datafeeling
Канал Андрея t.me/dzis_science
Таймкоды встречи:
0:00 - Расказ о кандидате…
🔥38👍11👎3