👨🚒Настоящие Kaggler'ы обучают модели на неочищенных данных и не говорят - "это только прототип", поэтому что так говорят только закомплексованные и неуверенные в себе аналитики. Если каглер решил, что хочет обучать ансамбль из 1000 моделей на данных с грязью из канавы, а не учить всего одну сильную на почищенных, то он не обязан никому ничего доказывать. Его воля несгибаема, как дамасская сталь, разум чист, как горный хрусталь, а рука быстра, как скорость стохастического градиентного спуска. Каглер всегда уверен в своём выборе и, если он хочет в продакшене модель на необоснованных эвристиках и рандомных фичах, значит, так нужно. Это и отличает сопливого, неуверенного в своей ориентации юнца от настоящего мужчины💪
#😅
#😅
🔥42😁15👍4🤩3😱1
#Aleron_фармит
За выходные и немного понедельник наконец-то составили и приоритизировали план + отработали пайплайн модели.🙈
Пока лично сам плетусь где-то в топ-500 из 2 000 участников.
🥇Очень хотим с тимой в голду поэтому цель на оставшиеся две недели стэкнуть 40 разных Bert'ов в единый ансамбль. Уже есть список😶🌫️
P.S. - одна только RoBerta-base требует на обучение около 7 часов. Но инференс очень быстрый - 10 минут. По-любому все успеем🙂🤥
#JigSaw
#Аминь
За выходные и немного понедельник наконец-то составили и приоритизировали план + отработали пайплайн модели.🙈
Пока лично сам плетусь где-то в топ-500 из 2 000 участников.
🥇Очень хотим с тимой в голду поэтому цель на оставшиеся две недели стэкнуть 40 разных Bert'ов в единый ансамбль. Уже есть список😶🌫️
P.S. - одна только RoBerta-base требует на обучение около 7 часов. Но инференс очень быстрый - 10 минут. По-любому все успеем🙂🤥
#JigSaw
#Аминь
🔥13👍8
✊Не бойся биться против тех, кто отрабатывал тюнинг тысячи разных моделей. Опасайся того, кто отрабатывал тюнинг одного бустинга, но 1000 раз 😅
#optuna_мама
#catboost_папа
#optuna_мама
#catboost_папа
👍30❤3🔥2🤩2😱1
👨🏻🌾#Aleron_фармит
Такс, еще одни выходные заканчиваются. И мы все еще не в топ-10% текущего JigSaw на Kaggle
🙃Заметил, что как-то резко наше место на лидер борде опустилось на пару сотен позиций🤔 Оказалось, кто-то опубликовал решение с высоким скором, но при этом с безумным оверфитом, как мне кажется. Скрин прилагаю =)
Хотя может это и не оверфит вовсе, а просто я хейтер🤷♀️
🤔Решили резко сменить стратегию и немного отойти от ансамбля бертов в сторону классических линейных регрессий💪. Скор подлетел😳 Будем с тимой пробовать дальше и верить своей валидации.
Такс, еще одни выходные заканчиваются. И мы все еще не в топ-10% текущего JigSaw на Kaggle
🙃Заметил, что как-то резко наше место на лидер борде опустилось на пару сотен позиций🤔 Оказалось, кто-то опубликовал решение с высоким скором, но при этом с безумным оверфитом, как мне кажется. Скрин прилагаю =)
Хотя может это и не оверфит вовсе, а просто я хейтер🤷♀️
🤔Решили резко сменить стратегию и немного отойти от ансамбля бертов в сторону классических линейных регрессий💪. Скор подлетел😳 Будем с тимой пробовать дальше и верить своей валидации.
👍14😁2
🔞Пост может содержать ненормативную лексику
😳На второй недели активной участия в чемпионате JigSaw на ранжирование текстов по уровню токсичности - поймал себя на мысли, что я понятия не имею, что такое токсичность.
Это вроде агрессия, но не совсем…
Похоже на гнев, но не он...
Как бы ирония, а вот нет…
Наличие матов ..., близко, но это лишь маркеры токсичности...
🤔Так что же такое эта ваша токсичность?!
🙈Учим модели тому, что сами не понимаем.
На скрине пример, где вроде бы все токсично, но добавление слова enjoy сразу делает его не токсичным.🤷♀️ Причем сложно поспорить. По смыслу действительно не токсично😄🤪🔫
😳На второй недели активной участия в чемпионате JigSaw на ранжирование текстов по уровню токсичности - поймал себя на мысли, что я понятия не имею, что такое токсичность.
Это вроде агрессия, но не совсем…
Похоже на гнев, но не он...
Как бы ирония, а вот нет…
Наличие матов ..., близко, но это лишь маркеры токсичности...
🤔Так что же такое эта ваша токсичность?!
🙈Учим модели тому, что сами не понимаем.
На скрине пример, где вроде бы все токсично, но добавление слова enjoy сразу делает его не токсичным.🤷♀️ Причем сложно поспорить. По смыслу действительно не токсично😄🤪🔫
🤔13😁2
😎Ооо, Сбер пересчитался на привате🎰. Поднялись на + 2 позиции вверх, что неплохо✅
Последние два дня у меня эйфория от количества надвигающихся или актуальных чемпионатов. Сейчас у вас тоже ее вызову!
1) На одном только Kaggle + 2 свежие соревы по CV и NLP, задачи прям как я люблю🐬👨⚕️
2) Сорева на Boosters от hhu все никак не дождется меня. Но пайплайн я уже зарядил.🪖
3) Тиммейты по запущенному IDAO 2022 уже тегают меня в чате, ждут когда меня JigSaw отпустит🚀
4) А тут еще и Data Fusion на 2 мульта прилетел🍋🍋
5) Так еще кент из Германии сказал, если мы в Global AI Challenge не урвем призовые, то мы больше не кенты 😳 Что ж, значит придется забрать весь банк💰🧞♂️
6) Более того, я мечтаю урвать крутой квадракоптер себе в сореве по детекции еды тут 🚁
Сезон начался⏱. Хоть отпуск бери и фарми на всю катушку. Чувствую, надо собирать еще несколько тим, чтоб везде успеть. Ох, какой же февраль будет жарким🔥🤹. Планирую везде войти в топы 💪🤠
Репости пост. Пусть твои кенты из DS тоже побеждают😉
Последние два дня у меня эйфория от количества надвигающихся или актуальных чемпионатов. Сейчас у вас тоже ее вызову!
1) На одном только Kaggle + 2 свежие соревы по CV и NLP, задачи прям как я люблю🐬👨⚕️
2) Сорева на Boosters от hhu все никак не дождется меня. Но пайплайн я уже зарядил.🪖
3) Тиммейты по запущенному IDAO 2022 уже тегают меня в чате, ждут когда меня JigSaw отпустит🚀
4) А тут еще и Data Fusion на 2 мульта прилетел🍋🍋
5) Так еще кент из Германии сказал, если мы в Global AI Challenge не урвем призовые, то мы больше не кенты 😳 Что ж, значит придется забрать весь банк💰🧞♂️
6) Более того, я мечтаю урвать крутой квадракоптер себе в сореве по детекции еды тут 🚁
Сезон начался⏱. Хоть отпуск бери и фарми на всю катушку. Чувствую, надо собирать еще несколько тим, чтоб везде успеть. Ох, какой же февраль будет жарким🔥🤹. Планирую везде войти в топы 💪🤠
Репости пост. Пусть твои кенты из DS тоже побеждают😉
👍19🔥4🤯3❤2
🎪Через 10 минут будет "цирк с конями"🤠
Финишировали в 8-й сотне из 2300 участников, но модель сделали стабильную🗿
Пока ждем, что нас подкинет вверх на ~300-400 позиций выше☝️ .
Хотели пихнуть 30-бертов, а по факту пихнули 5 линейных регрессий😂
Увы, ничего другого не помогало поднять скор🤷♀️
Ждем-с!🙈
#JigSaw 2022
#Aleron_фармит
UP: ждем до 3 часов👨🏻🦳
Финишировали в 8-й сотне из 2300 участников, но модель сделали стабильную🗿
Пока ждем, что нас подкинет вверх на ~300-400 позиций выше☝️ .
Хотели пихнуть 30-бертов, а по факту пихнули 5 линейных регрессий😂
Увы, ничего другого не помогало поднять скор🤷♀️
Ждем-с!🙈
#JigSaw 2022
#Aleron_фармит
UP: ждем до 3 часов👨🏻🦳
🔥14😱3
🥉Бронза !!! 😳
🙅♂️ Почти, но увы нет. Мы не поверили локальной валидации полностью и решили опираться на скор на лидер борде. Выбрали неверный финальный сабмишен🙃
🎳Как итог, вместо того чтобы подлететь на 600 мест вверх и залелеть в бронзу, мы выбрали неверный сабмит и слетели на 400 позиций вниз.😬
🤔Не знаю, что заставило меня сменить изначальную стратегию "стекать берты", но ансамбль ридж регрессий оказался по факту слабее, хотя подавал хорошие надежды.
🧗♀️Окей, пайплайн с Bert'ами я отработал, будем крушить в следующих NLP чемпионатах уже не с нуля😈
Тащили с @a_dzis 💪💪💪
#Aleron_фармит
#fails
🙅♂️ Почти, но увы нет. Мы не поверили локальной валидации полностью и решили опираться на скор на лидер борде. Выбрали неверный финальный сабмишен🙃
🎳Как итог, вместо того чтобы подлететь на 600 мест вверх и залелеть в бронзу, мы выбрали неверный сабмит и слетели на 400 позиций вниз.😬
🤔Не знаю, что заставило меня сменить изначальную стратегию "стекать берты", но ансамбль ридж регрессий оказался по факту слабее, хотя подавал хорошие надежды.
🧗♀️Окей, пайплайн с Bert'ами я отработал, будем крушить в следующих NLP чемпионатах уже не с нуля😈
Тащили с @a_dzis 💪💪💪
#Aleron_фармит
#fails
👍21🔥8👏4
Итак, я тут.
📈В ближайшие несколько месяцев надвигается обильный дождь из чемпионатов по анализу данных. Причем с крупными призовыми, лидербордом и другими прелестями соревновательного анализа данных. Я насчитал не меньше 10 штук. И это невероятный шанс прокачаться в анализе данных, при этом испытывая драйв от соревновательного духа. Упускать момент нельзя. Более того, вы часто пишите мне в личку с вопросами по типу - Как начать участвовать? Как выходить в лидеры чемпионатов, как это делаю я? Где взять команду? Как найти работу в сфере DS? А кто-то просто сходу зовет меня в тиму.
✅Окей, окей, окей - время решить ваши вопросы разом. Я объявляю марафон фарминга!
План у меня такой:
- Соберу группу ребят, объединю их в команды.
- С каждой тимой мы выберем чемпионаты, в которых будем участвовать следующие 3 месяца.
- Лично сам буду фармить с этими ребятами, обмениваясь экспертизой и максимизирую их шансы на победу.
🤔Но очевидно, что добавление одного меня в команду может не привести к успеху. Существует еще масса проблем: нехватка вычислительных мощностей, отсутствие офиса, дефицит средств на существование. Да и вообще - рамсить в индустрии анализа данных с экспертами в доменной области может быть не просто.
✅Окей, окей, окей - закрыть эти вопросы и сосредоточить внимание команды на победах вызвались ребята из redmadrobot.
Redmadrobot поддержит инфраструктурой и своей DS практикой тех ребят, кто готов бросить вызов сильным оппонентам и биться до победного конца, несмотря на сложности задач.
Круто? Ты этого ждал? Хочешь Влететь? Заполняй форму, докажи мне, что тебя стоит взять на борд. Единственное условие - придется пройти небольшой отбор. Сразу скажу, что "фрирайдеров" не возьмем, но тех кого возьмем, прокачаем📈
Ссылка на форму для отбора
Серия постов этого проекта будет носить хештег: #Моя_тима_фармит
📈В ближайшие несколько месяцев надвигается обильный дождь из чемпионатов по анализу данных. Причем с крупными призовыми, лидербордом и другими прелестями соревновательного анализа данных. Я насчитал не меньше 10 штук. И это невероятный шанс прокачаться в анализе данных, при этом испытывая драйв от соревновательного духа. Упускать момент нельзя. Более того, вы часто пишите мне в личку с вопросами по типу - Как начать участвовать? Как выходить в лидеры чемпионатов, как это делаю я? Где взять команду? Как найти работу в сфере DS? А кто-то просто сходу зовет меня в тиму.
✅Окей, окей, окей - время решить ваши вопросы разом. Я объявляю марафон фарминга!
План у меня такой:
- Соберу группу ребят, объединю их в команды.
- С каждой тимой мы выберем чемпионаты, в которых будем участвовать следующие 3 месяца.
- Лично сам буду фармить с этими ребятами, обмениваясь экспертизой и максимизирую их шансы на победу.
🤔Но очевидно, что добавление одного меня в команду может не привести к успеху. Существует еще масса проблем: нехватка вычислительных мощностей, отсутствие офиса, дефицит средств на существование. Да и вообще - рамсить в индустрии анализа данных с экспертами в доменной области может быть не просто.
✅Окей, окей, окей - закрыть эти вопросы и сосредоточить внимание команды на победах вызвались ребята из redmadrobot.
Redmadrobot поддержит инфраструктурой и своей DS практикой тех ребят, кто готов бросить вызов сильным оппонентам и биться до победного конца, несмотря на сложности задач.
Круто? Ты этого ждал? Хочешь Влететь? Заполняй форму, докажи мне, что тебя стоит взять на борд. Единственное условие - придется пройти небольшой отбор. Сразу скажу, что "фрирайдеров" не возьмем, но тех кого возьмем, прокачаем📈
Ссылка на форму для отбора
Серия постов этого проекта будет носить хештег: #Моя_тима_фармит
redmadrobot.ru
red_mad_robot - разработка цифровых решений для бизнеса
Создаём цифровые компании и продукты будущего для миллионов людей. Помогаем бизнесу внедрять AI | redmadrobot
🔥18👍7
😵💫Смотрю ваши заявки на марафон фарминга и думаю над заданием для второго отборочного этапа. Однако, это не мешает мне участвовать в этот момент еще где-то🚵♂️
Тем временем топ-3 в IDAO 2022 (по первому треку)
Предсказываю свойства кристаллов💎
🥊Планирую с тимой выйти в этом году в лидеры. В прошлом году не вышло, не фартануло.
Тем временем топ-3 в IDAO 2022 (по первому треку)
Предсказываю свойства кристаллов💎
🥊Планирую с тимой выйти в этом году в лидеры. В прошлом году не вышло, не фартануло.
🔥11
🔄Отсмотрел заявки. Решил, что полезно будет разобрать логичные вопросы по предстоящему марафону.
✅ Как будет проходить отбор?
Раз мне предстоит прокачивать ребят в соревновательном анализе данных, то отбирать надо по этому навыку. Поэтому, в качестве следующего отборочного испытания решено дать одно из текущих табличных соревнований на Kaggle. А дальше ранжировать участников по рейтингу. Так будет понятно, что представляет из себя каждый перед тем, как я смерджу их в команды.
✅ В чем интерес компании?
Как правило, предлагаемые задачи на чемпионатах сформулированы на основе потребностей бизнеса. Решение таких задач - это часто продукт или технология, которые потом компании могут использовать в своих нуждах или продавать своим клиентам. Более того, какое-то время назад я писал, что есть такая профессия - Kaggle фармить. И существуют компании, которые собирают отдельные для этого команды. Именно в развитии такой команды и заинтересованы ребята из redmadrobot. Команда, которая бьется на чемпионатах, а далее внедряет или применяет полученную экспертизу внутри компании.
✅ В чем мой интерес?
За последний год соревновательный анализ данных стал моим полноценным хобби. Хобби, на которое я сливаю все вечернее время после работы, а потом еще и выходные. На своем примере я доказал гипотезу, что прокачаться в DS можно не только на работе, в институте или на курсах, но и участвуя в чемпионатах. Даже больше скажу, за время чемпионатов я приобрел больше навыков, чем, работая в компаниях или решая домашки на курсах. Теперь хочу доказать, что соревновательный анализ данных - это крутая альтернатива для быстрого развития, которая помимо этого еще и драйвит.
✅ Когда результаты?
Задание отобранным участникам разошлем завтра. На выполнение будет неделя. Сегодня еще можно успеть стать участником - Ссылка на форму для отбора
#Моя_тима_фармит
✅ Как будет проходить отбор?
Раз мне предстоит прокачивать ребят в соревновательном анализе данных, то отбирать надо по этому навыку. Поэтому, в качестве следующего отборочного испытания решено дать одно из текущих табличных соревнований на Kaggle. А дальше ранжировать участников по рейтингу. Так будет понятно, что представляет из себя каждый перед тем, как я смерджу их в команды.
✅ В чем интерес компании?
Как правило, предлагаемые задачи на чемпионатах сформулированы на основе потребностей бизнеса. Решение таких задач - это часто продукт или технология, которые потом компании могут использовать в своих нуждах или продавать своим клиентам. Более того, какое-то время назад я писал, что есть такая профессия - Kaggle фармить. И существуют компании, которые собирают отдельные для этого команды. Именно в развитии такой команды и заинтересованы ребята из redmadrobot. Команда, которая бьется на чемпионатах, а далее внедряет или применяет полученную экспертизу внутри компании.
✅ В чем мой интерес?
За последний год соревновательный анализ данных стал моим полноценным хобби. Хобби, на которое я сливаю все вечернее время после работы, а потом еще и выходные. На своем примере я доказал гипотезу, что прокачаться в DS можно не только на работе, в институте или на курсах, но и участвуя в чемпионатах. Даже больше скажу, за время чемпионатов я приобрел больше навыков, чем, работая в компаниях или решая домашки на курсах. Теперь хочу доказать, что соревновательный анализ данных - это крутая альтернатива для быстрого развития, которая помимо этого еще и драйвит.
✅ Когда результаты?
Задание отобранным участникам разошлем завтра. На выполнение будет неделя. Сегодня еще можно успеть стать участником - Ссылка на форму для отбора
#Моя_тима_фармит
🔥12👍2
Старт дан🥳
Только что отправил последнее приглашение на второй этап отбора в марафон😤
❓Сколько заявок? Сколько отобрали?
Был приятно удивлен, что столько людей жаждет биться в чемпионатах. Пришло чуть больше 100 заявок. Отобрали на второй этап с небольшим запасом ~ 40 заявок. В марафон войдет ~15 лучших.
❓Как отбирали?
Первостепенными критериями были:
- Количество свободного времени
- Стартовый опыт / навыки
- Мотивация
Если человек "незаряженный", притом у него нет опыта работы или участия в соревнованиях, он делает ошибки в простых заданиях, но планирует побеждать за 5 часов в неделю, то тут уж ничего не поделаешь. Разогнать человека в таких условиях крайне тяжело. С таким набором выиграть можно только по воле случая. Однако, большинство участников - это прям бодрые ребята. Это либо хорошо натренированные программисты👨💻, либо заряженные фармить на фултайме самоучки👨🏻🌾, либо уже призеры каких-нибудь соревнований🤠.
❓На что еще смотрели при отборе?
После предварительной фильтрации - заявок по-прежнему осталось много, поэтому приоритет был отдан тем кандидатам, кто готов вкладывать достаточно времени, а также готов по итогам первого потока продолжить профессионально развиваться в этом направлении под крылом компании.
❓Что дальше?
Что ж, теперь ждем результаты через неделю. Все 40 «машин для убийств» режутся в сореве на Kaggle. Местным лидерам будет несладко, ведь на кану попадание в марафон, на котором мы создадим все условия для ребят, чтобы cфокусировать их уже на серьезных чемпионатах.
#Моя_тима_фармит
Только что отправил последнее приглашение на второй этап отбора в марафон😤
❓Сколько заявок? Сколько отобрали?
Был приятно удивлен, что столько людей жаждет биться в чемпионатах. Пришло чуть больше 100 заявок. Отобрали на второй этап с небольшим запасом ~ 40 заявок. В марафон войдет ~15 лучших.
❓Как отбирали?
Первостепенными критериями были:
- Количество свободного времени
- Стартовый опыт / навыки
- Мотивация
Если человек "незаряженный", притом у него нет опыта работы или участия в соревнованиях, он делает ошибки в простых заданиях, но планирует побеждать за 5 часов в неделю, то тут уж ничего не поделаешь. Разогнать человека в таких условиях крайне тяжело. С таким набором выиграть можно только по воле случая. Однако, большинство участников - это прям бодрые ребята. Это либо хорошо натренированные программисты👨💻, либо заряженные фармить на фултайме самоучки👨🏻🌾, либо уже призеры каких-нибудь соревнований🤠.
❓На что еще смотрели при отборе?
После предварительной фильтрации - заявок по-прежнему осталось много, поэтому приоритет был отдан тем кандидатам, кто готов вкладывать достаточно времени, а также готов по итогам первого потока продолжить профессионально развиваться в этом направлении под крылом компании.
❓Что дальше?
Что ж, теперь ждем результаты через неделю. Все 40 «машин для убийств» режутся в сореве на Kaggle. Местным лидерам будет несладко, ведь на кану попадание в марафон, на котором мы создадим все условия для ребят, чтобы cфокусировать их уже на серьезных чемпионатах.
#Моя_тима_фармит
redmadrobot.ru
Data Science
Создаём цифровые компании и продукты будущего для миллионов людей. Помогаем бизнесу внедрять AI | redmadrobot
🔥13👍2👏2🎉2
Решил поделиться результатами из формы🤫
Могу сказать, что в целом аудитория у меня "прошаренная". Остальные просто не выспались в тот день😴😅
Доволен тем, что добавил микро тестик в анкету. Хоть я и не жестил, но все равно кого-то подловил👮🏽♂️. Снял немного нагрузки, зато потом проще было принимать решения🧠
Кстати, некоторые HR'ы задают такие вопросы перед приглашением на собесы. Очень полезный лайфхак для скоринга.
Могу сказать, что в целом аудитория у меня "прошаренная". Остальные просто не выспались в тот день😴😅
Доволен тем, что добавил микро тестик в анкету. Хоть я и не жестил, но все равно кого-то подловил👮🏽♂️. Снял немного нагрузки, зато потом проще было принимать решения🧠
Кстати, некоторые HR'ы задают такие вопросы перед приглашением на собесы. Очень полезный лайфхак для скоринга.
👍17🤔5
👨🏻🌾Как помните, 40 марафонцев фармят сейчас текущую сореву на Kaggle. Финиш уже завтра.
🌊Все было гладко пока масло в огонь не подлили публичные решения, одно из которых занимает сейчас топ-5 на лидерборде. Это какие-то лютые блендинги из решений, опубликованных на форуме😂
⚔️Теперь ребятам придется это учесть, и выложиться еще сильнее, чтоб выбить скор повыше, иначе их просто срежут любители "copy and edit" 🙈😈
🧞♂️Я заинтересован в хороших результатах ребят, поэтому вот несколько моих мыслей, как перебороть публичный бленд:
🐠 Блендить можно с весами
🐬 Против блендинга только больший блендинг
🐋 Блендинг по фолдам это тоже блендинг
🐳 Чем различнее и сильнее модели, тем эффективнее блендинг
🦈 Стекинг сильнее блендинга
🎣 Стекать можно с фичами
🎏 Стекинг бывает разных уровней
#Моя_тима_фармит
🌊Все было гладко пока масло в огонь не подлили публичные решения, одно из которых занимает сейчас топ-5 на лидерборде. Это какие-то лютые блендинги из решений, опубликованных на форуме😂
⚔️Теперь ребятам придется это учесть, и выложиться еще сильнее, чтоб выбить скор повыше, иначе их просто срежут любители "copy and edit" 🙈😈
🧞♂️Я заинтересован в хороших результатах ребят, поэтому вот несколько моих мыслей, как перебороть публичный бленд:
🐠 Блендить можно с весами
🐬 Против блендинга только больший блендинг
🐋 Блендинг по фолдам это тоже блендинг
🐳 Чем различнее и сильнее модели, тем эффективнее блендинг
🦈 Стекинг сильнее блендинга
🎣 Стекать можно с фичами
🎏 Стекинг бывает разных уровней
#Моя_тима_фармит
🔥6👍3
🏆Чтобы писать для вас посты, мне приходится побеждать (себя в первую очередь)
🧞♂️Я конечно не новичок в ML, но на этих выходных пришлось несколько раз вспотеть, чтоб обойти >180 человек в сореве на Boosters от HH.ru. Надо было выявлять причины отклонения заявок.
😉Отобрался на второй этап (топ-20% участников). Дальше будем рамсить с лидерами на докерах.
🏎Позже расскажу про свой NLP пайплайн, он меня в этот раз порадовал =) 🧞♂️
🥳Всем успешной недели!
#Aleron_фармит
#head_hunter_ru
#multi_label_classification
🧞♂️Я конечно не новичок в ML, но на этих выходных пришлось несколько раз вспотеть, чтоб обойти >180 человек в сореве на Boosters от HH.ru. Надо было выявлять причины отклонения заявок.
😉Отобрался на второй этап (топ-20% участников). Дальше будем рамсить с лидерами на докерах.
🏎Позже расскажу про свой NLP пайплайн, он меня в этот раз порадовал =) 🧞♂️
🥳Всем успешной недели!
#Aleron_фармит
#head_hunter_ru
#multi_label_classification
👍23🔥2
#Трюк № 65 - локальная валидация
🤔Часто звучит фраза - trust your CV, но мало кто настраивает CV так, чтоб ей можно было верить. Есть тонкости. Уверен, люди про них даже не знают, хотя сотни раз слышали про CV.
😵💫Смотрю сейчас на лидеров соревнования. У ребят по 50, 70, 90 или даже > 100 попыток. Мне же хватило всего 9 (считая ошибочные) чтобы выйти в финал.
🙌И вот почему. Приложу скрин, где фиксировал хронику, как моя локальная валидация коррелирует с публичным скором. 100% корреляция!
👨🔬Это дало мне возможности без ошибочно экспериментировать и отбирать рабочие гипотезы. Как итог, очень резво поднимал скор с каждой попыткой, даже на LB сильно не опирался.
🤫Когда выложу свою решение, сможете посмотреть код валидации. Чаще всего это одна из разновидностей cross-валидации.Усредняй по фолдам!
#Алерон_фармит
#boosters_pro #hhu
😵💫Смотрю сейчас на лидеров соревнования. У ребят по 50, 70, 90 или даже > 100 попыток. Мне же хватило всего 9 (считая ошибочные) чтобы выйти в финал.
🙌И вот почему. Приложу скрин, где фиксировал хронику, как моя локальная валидация коррелирует с публичным скором. 100% корреляция!
👨🔬Это дало мне возможности без ошибочно экспериментировать и отбирать рабочие гипотезы. Как итог, очень резво поднимал скор с каждой попыткой, даже на LB сильно не опирался.
🤫Когда выложу свою решение, сможете посмотреть код валидации. Чаще всего это одна из разновидностей cross-валидации.
#boosters_pro #hhu
👍18🔥7
🥳 Финализировал списки марафонцев.
Из 40 человек отобрал 15 лучших. Примерно 10 человек не приступило к отборочному заданию, а несколько так запарились, что окружили топ-5. Скоро урвут себе кагловский мерч😎.
Итого, в сухом остатке 15 человек или 5 команд по 3 человека.
🕘 В течении пары дней проведу с ними контактную встречу, где снабдим ребят стартовым паком мощностей и другими плюшками.
Кстати, на Kaggle сейчас минимум 4 соревнования на CV и 2 на таблички🤤Будем в чем разгонять ребята до медалей все ближайшие 3 месяца.
#Моя_тима_фармит
#Сбросим_всех_топарей_вниз_вместе
Из 40 человек отобрал 15 лучших. Примерно 10 человек не приступило к отборочному заданию, а несколько так запарились, что окружили топ-5. Скоро урвут себе кагловский мерч😎.
Итого, в сухом остатке 15 человек или 5 команд по 3 человека.
🕘 В течении пары дней проведу с ними контактную встречу, где снабдим ребят стартовым паком мощностей и другими плюшками.
Кстати, на Kaggle сейчас минимум 4 соревнования на CV и 2 на таблички🤤Будем в чем разгонять ребята до медалей все ближайшие 3 месяца.
#Моя_тима_фармит
#Сбросим_всех_топарей_вниз_вместе
🔥15
😎Моя краткая история о том, как я попал в Х5 Retail Group. Смотри фотку =)
🤩С кайфом бы послушал истории, как вы попали на свою первую работу в DS (или как не попали, тоже люблю такие кейсы).
#СобесилМеняНеБабушкин
🤩С кайфом бы послушал истории, как вы попали на свою первую работу в DS (или как не попали, тоже люблю такие кейсы).
#СобесилМеняНеБабушкин
🔥7😁7