🏆 Data Feeling | AI – Telegram
🏆 Data Feeling | AI
15.9K subscribers
732 photos
222 videos
6 files
469 links
IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2
Download Telegram
🏆 Data Feeling | AI
Ситуация непростая. Для тех кто решил релокейтиться куда-нибудь вот вам мои мысли по личному опыту. С февраля я успел попробовать три страны для проживания. Турция, Казахстан и Таиланд. Если вы прям вот уж совсем в панике и уже выбираете куда можно поехать…
🙈 Ого, у нас тут с пацанами разворачивается настоящий фарм-кипишь. (138 и 140 строки)

🤠 Начинали фармить вместе, теперь фармим по разным тимам 💪

Идем в медали ноздря в ноздрю. Вот-вот доблендить еще парочку моделей и зайдем в бронзу, надеюсь.

👇 🙈😅Делайте ставки в комменты.
Кстати, мои приглашенные мастера в команду вообще не внесли вклада. Вот так вот и бери потом опытных.
🏆18👍4🔥2👎1
🏆 Data Feeling | AI
🙈 Ого, у нас тут с пацанами разворачивается настоящий фарм-кипишь. (138 и 140 строки) 🤠 Начинали фармить вместе, теперь фармим по разным тимам 💪 Идем в медали ноздря в ноздрю. Вот-вот доблендить еще парочку моделей и зайдем в бронзу, надеюсь. 👇 🙈😅Делайте…
Что ж. Финиш. Закрепились в HubMap в топ-150 из 1300 человек. Надо подняться всего лишь на 8 мест наверх и будет медалька.

Собрали ансамбль из 16 моделей. Ждем шейкапа наверх.

Ставьте 👍 или 👎 если верите что зайду с тимой в медали или не зайду соответственно.

Кстати, сегодня сходил на конференцию возобновившихся ML тренировок. Если буду активнее фармить возможно когда-нибудь там выступлю. Добрых снов😌

P.S - угадайте парня посередине 😅
👍141👎17🏆5
🏆 Data Feeling | AI
Что ж. Финиш. Закрепились в HubMap в топ-150 из 1300 человек. Надо подняться всего лишь на 8 мест наверх и будет медалька. Собрали ансамбль из 16 моделей. Ждем шейкапа наверх. Ставьте 👍 или 👎 если верите что зайду с тимой в медали или не зайду соответственно.…
Не повезло, не фартануло.

Корреляция между приватной выборкой и тестовой оказалось очень неплохой. Не заняв медальную зону сразу, мы не заняли ее и после шейкапа на привате.

Что зашло?
Систематичность. Мы почти каждый день созванивались с командой. Заполняли табличку гипотез. Приоретизировали и распределяли задачи.
Мощности. Повезло, что в этот раз было относительно не много проблем с GPU. Почти все время могли запускать что-то. Модели одного фолда учились всего по два-три часа.
Опыт. Множество технических проблем с архитектурой сеток и инфраструктурой решались быстро, либо еще быстрее командным бруд-форсом.

Какие вижу ошибки?
Секрет победы был прост. Надо было верно подобрать трешхолды для классов.
Поздно разгадали, какие архитектуры и приемы поднимают скор. Бленд двух моделей со скором 0.71 и 0.72 давал финальный скор в 0.76. То есть бери и просто бленди разные по природе модели. Всего у нас было 4 архитектуры. Стоило проверить больше.
Зацикливались. Вместо того чтобы идти дальше по списку гипотез, тратили время на бесперспективные улучшения уже сильных моделей.
Слабо изучили датасет. Данные как всегда с мусором, который в идеале почистить или переразметить. (Pseudo labeling)
Не решились закинуть модельку в Optuna на денек, чтоб провести эксперименты более массово.
Бленд с моделью мастеров по каким-то причинам только ухудшал скор. Возможно неверные трешхолдны на классы при смешивании моделей. Возможно, не тех мастеров взяли в тиму😅
Не успели добавить в бленд сильную модель наших друзей-аппонентов из поста выше. (Да, мы делились идеями через форум, но применить доп модели друг друга не смогли из-за неудобства разных подходов и недостатка времени.)
Под конец только пришла идея использовать в Test Time Augmentation еще и цвето-коррекцию.
Мало наресерчели оригинальных идей. Стоило заложить на это время.

🤔 В целом, если бы получили бронзу это бы погоды нам не сделало. Для титула "Мастер" нам нужны только золотые и серебряные медали. Будем решать теперь еще агрессивнее!
👍51🏆15🔥4👎32
👀 Тут на Kaggle приехала интересная биологическая задачка - Novozymes Enzyme Stability Prediction

😓 Предлагается по аминокислотной последовательности белка фиксированный длины предсказать температуру плавления.

🤓 В общем, просят реализовать AlphaFold от DeepMind на минималках. AlphaFold предсказывал 3D структуру, а тут все намного проще - надо всего лишь температуру плавления.

🤔 Что-то похожее я уже решал однажды в прошлой жизни биоинформатика. Посмотрел, как люди на форуме пытаются решить эту задачу и там какой-то детский сад. По типу tf-idf + модель. Очевидно, это никак не раскрывает свойства такого сложного 3D объекта как белок.

👨‍🚒 Решил, что буду участвовать. Хочу усилить свою команду и провести эксперимент. Ищу новых тиммейтов с биологическим бэкграундом!

👨🏻‍🌾 Я ищу именно тебя, если ты:
- Понимаешь основы молекулярной биологии. Отличаешь ДНК от аминокислот.
- Имеешь опыт аннотации белков.
- Любишь ресерчить статейки и даже слышал, как устроен AlphaFold.

🧞‍♂️ С меня вся ML часть. Ресурсы и личный соревновательный опыт. В планах пойти "каглерским" путем. Настакать фичей разной природы и дальше по классике ансамбль бустинга, сетки и линеек.

Пиши в личку, если тебе интересна задача и нужны медали на Kaggle! Думаю, что особенно актуально для тех кто переходит из биоинфы в DS/ML.
👍324👎4🔥4🤔3
Динамическое ценообразование любопытная вещь.

🤔 Интересно, это руками так подбирается или действительно есть алгоритм на такие случаи...

Москва - Алания.

Теперь в Сочи отдыхать снова дешевле, чем в Турции😳

Есть вариант еще - можно попасть в Казахстан. Кстати, вот чат по взаимопомощи в Казахстане.
😱27👍5👎4🤔3😁1
🏆 Data Feeling | AI
Динамическое ценообразование любопытная вещь. 🤔 Интересно, это руками так подбирается или действительно есть алгоритм на такие случаи... Москва - Алания. Теперь в Сочи отдыхать снова дешевле, чем в Турции😳 Есть вариант еще - можно попасть в Казахстан.…
Продолжаю восхищаться динамическим ценообразованием авиасейлс.

Оповещают о понижение цены на билет, хотя из билета просто убрали багаж. Мдам-с

А ведь какой-то гений маркетинга (продукт-менеджер) получает зп за придумку этой фичи.
😁45👍2👎1
Так, ну окей. Теперь я еще спокойнее и вот-вот буду радовать вас прикольными приемами и техниками в ML/DS снова.

Хотя пару дней назад думал, что буду делиться армейскими лайф-хаками и анекдотами.
🔥53😁12🏆5👎21
🥳 Идем дальше!

Пока люди активно паниковали и уезжали из РФ, мы с Дашей активно паниковали и писали для вас курсец. Мы собрали основные приемы, которые помогают успешнее искать работу.

🎯 Курс проведет вас "за ручку" через весь путь от подготовки резюме до получения оффера.

🥳 Мы только что опубликовали курс, но еще его не тестировали на других людях. У вас есть возможность пройти этот курс в первых рядах до основного релиза. Для этого напишите в комменты почему этот курс по получению оффера нужен именно вам? Авторы 10 самых релевантных и развернутых ответов получат автомобиль доступ к курсу со скидкой 91% (Меньше чисто технически сделать нельзя)

Ссылка на курс
👎61🔥34👍11🤔3
Пирсон не ловит нелинейные зависимости!

Все знают, для проверки линейной зависимости/корреляции между двумя переменными можно взять коэффициент корреляции Пирсона. Однако, что делать, если надо поймать что-то не линейное? Ответ не очевидный.

🚀 Не так давно узнал, про Phik корреляцию. Штука мощная. Посмотрите как Phik ловит сложные зависимости, где Пирсон теряется.

При генерации признаков такой подход позволяет не отсеивать более сложные зависимости, которые потом бустинги смогут уловить.
88👍36🔥8😱5👎1
Есть в моей карьере темное пятно, которое я обычно не раскрываю без необходимости.

😓 Работал в неплохой компании, где хорошо платили и мало требовали. Можно было сделать все свои задачи за несколько часов и оставшееся время заниматься изучением курсов, фармингом и прочим.

🏋️ Основная DS задача, которую мне приходилось решать в том месте - прогнозирование спроса. Задача понятная. Не первый раз решаемая. При достаточной сноровке решается быстро, лишь бы под рукой были готовые SQL-запросы нужные данные. Так вот, почему я не долго там пробыл?! Мне быстро стало скучно. И вот какие были предпосылки:

✍️ Несколько раз, когда мы представляли начальнику отвалидированные прогнозы ML модели, начальник каждый раз смотрел на графики прогнозов и говорил что-то типо: "Так, тут у вас прирост спроса в следующем месяце 5%, но, мне кажется, это много, давайте поставим 3%". По итогу таких встреч мы почти полностью исправляли цифры в отчете, заменяя data-driven результаты на from my boss's head driven результаты.

🛩 На валидации такой подход показывал метрики чуть хуже, но зато работал без обучения и прогнозировал моментально.

Вывод: ML методы важны, но опытные начальники важнее.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁101👍30🤔13🏆4👎32
Ну а что?! Можно себе и нетворкинг позволить

🤬 Сейчас много ребят из IT едут на удаленку в другие страны. У всех разные причины. Кто-то едет сам, кто-то в паре, кто-то с друзьями. Вижу в своем окружении много ребят, кто не решается поехать в какой-нибудь Таиланд, потому что ему просто на просто сложно ехать одному или есть бытовые вопросы, которые непонятно как решать. Я подумал, что это необычные проблемы, которые полезно обсудить.

🥳 А давайте сделаем небольшую неформальную встречу? Встречу для тех, кто ищет себе единомышленников для поездки? Кто-то ищет себе пару. Кто-то ищет просто друзей. Все решаемо одной качественной встречей. Идея такая - собрать 15 - 20 человек из IT и пообщаться.

🤫 Что будет? Соберемся в лофте на высоте 20-го этаже в центре Мск. Поиграем в настолки. Пообщаемся. Поедим пиццу. Поболтаем за IT, про карьеру. Затронем тему выгорания, релокейта и прочего. Приглашенные интересные гости выступят с небольшими спитчами на актуальны темы. Смотри картинку.

🙂 Это мероприятие для тебя, если:
- Твой возраст от 22
- Ты из сферы IT или около того.
- Планируешь релокейт в будущем
- Ты свободен вечером воскресенья в 17:00!

😏 Форма для заполнения тут. Мы постараемся собрать парней/девушек в пропорции 50/50 максимально схожих по интересам.

😈 Девушки бесплатно, с парней 2к за вход. Возможно это сексизм, зато мы с ребятами не разоримся на пицце и лофте)
Please open Telegram to view this post
VIEW IN TELEGRAM
👎10123👍18🔥3🤔2
Мало кто слышал про сегментацию временных рядов.

Задача не тривиальная, но когда твои временные рядочки вдруг аккуратно разбиваются по сегментам испытываешь кайф в чистом виде.
37🔥15👍10👎1🏆1
🏆 Data Feeling | AI
Ну а что?! Можно себе и нетворкинг позволить 🤬 Сейчас много ребят из IT едут на удаленку в другие страны. У всех разные причины. Кто-то едет сам, кто-то в паре, кто-то с друзьями. Вижу в своем окружении много ребят, кто не решается поехать в какой-нибудь…
Когда мы с Настей (@a_voitseshko) затеяли провести этот ламповой и неформальный мини эвентик, мы думали, что будет недобор девушек, но как же мы ошибались

🤔 Зачем идти?
- Вам не хватает общения
- Вам не хватает знакомств в IT
- Вам интересен релокейт
- Вы выгорели и хотите почилить в приятной компании

Встретимся в это воскресенье в 17:00 на Октябрьской.

Форма для заполнения: https://forms.gle/4ZCxApXv513CW2468
Please open Telegram to view this post
VIEW IN TELEGRAM
👎9😁9👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
👍57👎16😁9🔥53🤔3
Эх, желание суету навести ...

Или хотя бы написать статью про skill-set соревновательного Data Science 🤔

А то меня постоянно спрашивают, что надо уметь?! С чего начать? Вот вы сами, что думаете? Какие конкретные скиллы помогают улучшить скор в соревнованиях? Накидайте идей/мыслей в комментарии 🙏

Когда выкачу статью - вы удивитесь, но скиллов требуется много. Элементарно, но не каждый может задачу мульти-лейбла настроить сходу.

Фото чисто для привлечения внимания. Нейронки в моем телефоне уже с 2019 года что-то про меня знают.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👎31👍1
Потерял доступ к своему You-Tube каналу

В августе был небольшой кипишь, а именно МФТИ попал под санкции. Как итог - Google отозвал доступы к почтам. Физтеховский домен @phystech.edu перешел на сервера Яндекса.

До окончательной блокировки почт - я успел везде сменить свою почту на альтернативные. (В первую очередь начал конечно с же с Kaggle и Github).

🧐 Спустя неделю после блокировки решил залить новый видосик на ютуб для своей любимой аудитории. И тут понял, что доступа то теперь у меня нет! Почту басурманскую на яндексоидную я сменить не сменил. И восстановить не получается... Все сообщения в поддержку уходят в небытие юродивое. Летят куда-то за океан и не возвращаются.

🤖 В общем, сейчас в мыслях еще немного попрокрастинировать этот вопросик, и если решений не найдётся, то буду новый канал заводить. Ибо материал копится. Суета суетная в мире святого Data Science сама себя не наведет. Никто кроме Алерончика парням не расскажет, как медали фармить, да собесы в FAANG проходить на своем примере. Кто молодым и неопытным новичкам скажет, не покупать курсы от skillbox?!

🤔 Если вдруг сталкивались с таким, то накидайте советов, что делать? Иначе вам же потом на мой второй канал подписываться)
Please open Telegram to view this post
VIEW IN TELEGRAM
😱366😁6👍5👎4
🏆 Data Feeling | AI
Мало кто слышал про сегментацию временных рядов. Задача не тривиальная, но когда твои временные рядочки вдруг аккуратно разбиваются по сегментам испытываешь кайф в чистом виде.
Как некоторые уже поняли, это мы с тимой из red_mad_robot пытаемся рамсить на поприще нефтянки.

Задача: предсказывать время поломок на скважинах.
Данные: 100 гигов многомерных временных рядов. Сорева докерная, приходится ждать результатов по 2 часа.

Как всегда кидаю сюда скрин за сутки до соревнования. Вдруг выиграем?! Тогда вы хоть увидите как мы это сделали)
В любом случае, после я расскажу вам полезные лайф-хаки по увеличению скора. Временные ряды решаю не так часто, поэтому как назло, лучшие идеи приходят под конец соревнования.

Кстати, соревнование двух-этапное. Если сейчас 150к не заберем, то потом поборемся сразу за 300к.
Отберут первые 15 команд. Мы пока проходим. Если выиграем купим себе новую карточку на сервак.

#Rosneft_Challenge
👍27🏆7🔥5👎31🎉1
Media is too big
VIEW IN TELEGRAM
🧐 Если бы мне было меньше 20-ти (времена, когда на лето я ездил к бабуле😍), то я бы точно потратил месяц лета на изучение техники слепой печати (в обоих языках).

🙂 В общем, решили по фану с Настей (@a_voitseshko) снять видос про технику слепой печати. Некоторые люди не из IT искренне удивляются моему навыку набирать текст с закрытыми глазами, хотя я уже давно привык к нему и не считаю его редким. Однако, для меня этот скилл хороший маркер опыта.

🤨 Вот история: На 1-м курсе магистратуры я выбирал биоинформатическию лабу для написания диплома. Тогда мне очень хотелось освоить крутые фишечки из этой сферы. Так вот в одной из тех лаб, заметил, как мой потенциальный научрук набирает текст двумя указательными пальцами и не отводит взгляда от клавиатуры. При этом он обещал меня научить всем техническим штукам. Меня тогда эта деталь с набором текста сильно смутила, и я там не остался. Кто-то меня осудит за предвзятость, мол это не важно, но вот только мои одногруппники после той лабы так ничего толкового и не опубликовали. Совпадение?

🤪 Ждите, скоро прикольные видосик выпущу. Пока ловите фрагмент. На нем я после удаления зуба мудрости, поэтому немного странно говорю. Смотреть на х2!

🤨 А вы умеете писать 10-ю пальцами вслепую?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👎22👍162🤔2
Начинающий Алерончик входит в Data Science. Картина маслом.

Скрин от подписчика: @MaximAbrosimov
😁22🔥6👎32👍1