🏆 Data Feeling | AI – Telegram
🏆 Data Feeling | AI
15.9K subscribers
732 photos
222 videos
6 files
469 links
IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2
Download Telegram
Так, ну окей. Теперь я еще спокойнее и вот-вот буду радовать вас прикольными приемами и техниками в ML/DS снова.

Хотя пару дней назад думал, что буду делиться армейскими лайф-хаками и анекдотами.
🔥53😁12🏆5👎21
🥳 Идем дальше!

Пока люди активно паниковали и уезжали из РФ, мы с Дашей активно паниковали и писали для вас курсец. Мы собрали основные приемы, которые помогают успешнее искать работу.

🎯 Курс проведет вас "за ручку" через весь путь от подготовки резюме до получения оффера.

🥳 Мы только что опубликовали курс, но еще его не тестировали на других людях. У вас есть возможность пройти этот курс в первых рядах до основного релиза. Для этого напишите в комменты почему этот курс по получению оффера нужен именно вам? Авторы 10 самых релевантных и развернутых ответов получат автомобиль доступ к курсу со скидкой 91% (Меньше чисто технически сделать нельзя)

Ссылка на курс
👎61🔥34👍11🤔3
Пирсон не ловит нелинейные зависимости!

Все знают, для проверки линейной зависимости/корреляции между двумя переменными можно взять коэффициент корреляции Пирсона. Однако, что делать, если надо поймать что-то не линейное? Ответ не очевидный.

🚀 Не так давно узнал, про Phik корреляцию. Штука мощная. Посмотрите как Phik ловит сложные зависимости, где Пирсон теряется.

При генерации признаков такой подход позволяет не отсеивать более сложные зависимости, которые потом бустинги смогут уловить.
88👍36🔥8😱5👎1
Есть в моей карьере темное пятно, которое я обычно не раскрываю без необходимости.

😓 Работал в неплохой компании, где хорошо платили и мало требовали. Можно было сделать все свои задачи за несколько часов и оставшееся время заниматься изучением курсов, фармингом и прочим.

🏋️ Основная DS задача, которую мне приходилось решать в том месте - прогнозирование спроса. Задача понятная. Не первый раз решаемая. При достаточной сноровке решается быстро, лишь бы под рукой были готовые SQL-запросы нужные данные. Так вот, почему я не долго там пробыл?! Мне быстро стало скучно. И вот какие были предпосылки:

✍️ Несколько раз, когда мы представляли начальнику отвалидированные прогнозы ML модели, начальник каждый раз смотрел на графики прогнозов и говорил что-то типо: "Так, тут у вас прирост спроса в следующем месяце 5%, но, мне кажется, это много, давайте поставим 3%". По итогу таких встреч мы почти полностью исправляли цифры в отчете, заменяя data-driven результаты на from my boss's head driven результаты.

🛩 На валидации такой подход показывал метрики чуть хуже, но зато работал без обучения и прогнозировал моментально.

Вывод: ML методы важны, но опытные начальники важнее.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁101👍30🤔13🏆4👎32
Ну а что?! Можно себе и нетворкинг позволить

🤬 Сейчас много ребят из IT едут на удаленку в другие страны. У всех разные причины. Кто-то едет сам, кто-то в паре, кто-то с друзьями. Вижу в своем окружении много ребят, кто не решается поехать в какой-нибудь Таиланд, потому что ему просто на просто сложно ехать одному или есть бытовые вопросы, которые непонятно как решать. Я подумал, что это необычные проблемы, которые полезно обсудить.

🥳 А давайте сделаем небольшую неформальную встречу? Встречу для тех, кто ищет себе единомышленников для поездки? Кто-то ищет себе пару. Кто-то ищет просто друзей. Все решаемо одной качественной встречей. Идея такая - собрать 15 - 20 человек из IT и пообщаться.

🤫 Что будет? Соберемся в лофте на высоте 20-го этаже в центре Мск. Поиграем в настолки. Пообщаемся. Поедим пиццу. Поболтаем за IT, про карьеру. Затронем тему выгорания, релокейта и прочего. Приглашенные интересные гости выступят с небольшими спитчами на актуальны темы. Смотри картинку.

🙂 Это мероприятие для тебя, если:
- Твой возраст от 22
- Ты из сферы IT или около того.
- Планируешь релокейт в будущем
- Ты свободен вечером воскресенья в 17:00!

😏 Форма для заполнения тут. Мы постараемся собрать парней/девушек в пропорции 50/50 максимально схожих по интересам.

😈 Девушки бесплатно, с парней 2к за вход. Возможно это сексизм, зато мы с ребятами не разоримся на пицце и лофте)
Please open Telegram to view this post
VIEW IN TELEGRAM
👎10123👍18🔥3🤔2
Мало кто слышал про сегментацию временных рядов.

Задача не тривиальная, но когда твои временные рядочки вдруг аккуратно разбиваются по сегментам испытываешь кайф в чистом виде.
37🔥15👍10👎1🏆1
🏆 Data Feeling | AI
Ну а что?! Можно себе и нетворкинг позволить 🤬 Сейчас много ребят из IT едут на удаленку в другие страны. У всех разные причины. Кто-то едет сам, кто-то в паре, кто-то с друзьями. Вижу в своем окружении много ребят, кто не решается поехать в какой-нибудь…
Когда мы с Настей (@a_voitseshko) затеяли провести этот ламповой и неформальный мини эвентик, мы думали, что будет недобор девушек, но как же мы ошибались

🤔 Зачем идти?
- Вам не хватает общения
- Вам не хватает знакомств в IT
- Вам интересен релокейт
- Вы выгорели и хотите почилить в приятной компании

Встретимся в это воскресенье в 17:00 на Октябрьской.

Форма для заполнения: https://forms.gle/4ZCxApXv513CW2468
Please open Telegram to view this post
VIEW IN TELEGRAM
👎9😁9👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
👍57👎16😁9🔥53🤔3
Эх, желание суету навести ...

Или хотя бы написать статью про skill-set соревновательного Data Science 🤔

А то меня постоянно спрашивают, что надо уметь?! С чего начать? Вот вы сами, что думаете? Какие конкретные скиллы помогают улучшить скор в соревнованиях? Накидайте идей/мыслей в комментарии 🙏

Когда выкачу статью - вы удивитесь, но скиллов требуется много. Элементарно, но не каждый может задачу мульти-лейбла настроить сходу.

Фото чисто для привлечения внимания. Нейронки в моем телефоне уже с 2019 года что-то про меня знают.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👎31👍1
Потерял доступ к своему You-Tube каналу

В августе был небольшой кипишь, а именно МФТИ попал под санкции. Как итог - Google отозвал доступы к почтам. Физтеховский домен @phystech.edu перешел на сервера Яндекса.

До окончательной блокировки почт - я успел везде сменить свою почту на альтернативные. (В первую очередь начал конечно с же с Kaggle и Github).

🧐 Спустя неделю после блокировки решил залить новый видосик на ютуб для своей любимой аудитории. И тут понял, что доступа то теперь у меня нет! Почту басурманскую на яндексоидную я сменить не сменил. И восстановить не получается... Все сообщения в поддержку уходят в небытие юродивое. Летят куда-то за океан и не возвращаются.

🤖 В общем, сейчас в мыслях еще немного попрокрастинировать этот вопросик, и если решений не найдётся, то буду новый канал заводить. Ибо материал копится. Суета суетная в мире святого Data Science сама себя не наведет. Никто кроме Алерончика парням не расскажет, как медали фармить, да собесы в FAANG проходить на своем примере. Кто молодым и неопытным новичкам скажет, не покупать курсы от skillbox?!

🤔 Если вдруг сталкивались с таким, то накидайте советов, что делать? Иначе вам же потом на мой второй канал подписываться)
Please open Telegram to view this post
VIEW IN TELEGRAM
😱366😁6👍5👎4
🏆 Data Feeling | AI
Мало кто слышал про сегментацию временных рядов. Задача не тривиальная, но когда твои временные рядочки вдруг аккуратно разбиваются по сегментам испытываешь кайф в чистом виде.
Как некоторые уже поняли, это мы с тимой из red_mad_robot пытаемся рамсить на поприще нефтянки.

Задача: предсказывать время поломок на скважинах.
Данные: 100 гигов многомерных временных рядов. Сорева докерная, приходится ждать результатов по 2 часа.

Как всегда кидаю сюда скрин за сутки до соревнования. Вдруг выиграем?! Тогда вы хоть увидите как мы это сделали)
В любом случае, после я расскажу вам полезные лайф-хаки по увеличению скора. Временные ряды решаю не так часто, поэтому как назло, лучшие идеи приходят под конец соревнования.

Кстати, соревнование двух-этапное. Если сейчас 150к не заберем, то потом поборемся сразу за 300к.
Отберут первые 15 команд. Мы пока проходим. Если выиграем купим себе новую карточку на сервак.

#Rosneft_Challenge
👍27🏆7🔥5👎31🎉1
Media is too big
VIEW IN TELEGRAM
🧐 Если бы мне было меньше 20-ти (времена, когда на лето я ездил к бабуле😍), то я бы точно потратил месяц лета на изучение техники слепой печати (в обоих языках).

🙂 В общем, решили по фану с Настей (@a_voitseshko) снять видос про технику слепой печати. Некоторые люди не из IT искренне удивляются моему навыку набирать текст с закрытыми глазами, хотя я уже давно привык к нему и не считаю его редким. Однако, для меня этот скилл хороший маркер опыта.

🤨 Вот история: На 1-м курсе магистратуры я выбирал биоинформатическию лабу для написания диплома. Тогда мне очень хотелось освоить крутые фишечки из этой сферы. Так вот в одной из тех лаб, заметил, как мой потенциальный научрук набирает текст двумя указательными пальцами и не отводит взгляда от клавиатуры. При этом он обещал меня научить всем техническим штукам. Меня тогда эта деталь с набором текста сильно смутила, и я там не остался. Кто-то меня осудит за предвзятость, мол это не важно, но вот только мои одногруппники после той лабы так ничего толкового и не опубликовали. Совпадение?

🤪 Ждите, скоро прикольные видосик выпущу. Пока ловите фрагмент. На нем я после удаления зуба мудрости, поэтому немного странно говорю. Смотреть на х2!

🤨 А вы умеете писать 10-ю пальцами вслепую?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👎22👍162🤔2
Начинающий Алерончик входит в Data Science. Картина маслом.

Скрин от подписчика: @MaximAbrosimov
😁22🔥6👎32👍1
🏆 Data Feeling | AI
Как некоторые уже поняли, это мы с тимой из red_mad_robot пытаемся рамсить на поприще нефтянки. Задача: предсказывать время поломок на скважинах. Данные: 100 гигов многомерных временных рядов. Сорева докерная, приходится ждать результатов по 2 часа. Как…
🥳 Опача!

🤹‍♂️ Шейкап и наша тима red_mad_robot 🤖 в топ-5 по нефтянке.

🏆 Еще круто, что на 3-м месте команда Дзися (@dzis_science). Надо будет с ним теперь призовые поделить за идеи😅🤫)

🎪 В следующем туре вообще всех скинем😈💪 А то уже хочется новую карточку купить...

🚧 Второй этап будет с новой метрикой, он уже открыт и ждёт решений!
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆59👍11👎2🔥1
Обычно не люблю такое выкладывать, просто радуюсь и все, но тут особый случай 😅

А недавно задумался. Вот создал я группу с кучей HR-ов, а как вообще понять, что они нормально закрывают потребность в поиске?! 🤔

Оказывается, работает!
Я просто когда-то сделал пару верных кликов мышкой. А реальный человек остался на плаву, избежав кризиса. Моя душа довольна!

(не реклама)

Второй абзац про жену меня улыбнул) Как же сильно он ее любит! Не каждый знает про такой лайф-хак

Update:
или как написали в комментах «вайф-хак» 😂🙈
👍70😁17👎92🔥2😱1🏆1
Квартира в центре

Отчаялся искать, а сроки горят, поэтому пользуясь своим положением хочу оперативно среди своих найти жильцов в квартиру на Октябрьской, в которой прожил с кайфом с начала лета.

Коротко:
На полгода-год сдается оборудованная для комфортного проживания уютная однокомнатная квартира с хорошим ремонтом, расположенная в 1 минуте от метро Октябрьская (!). Балкон с приятным видом на Москву-Сити. 9 этаж. Свое парковочное место. Есть шлагбаум.

Идеально для любителей гулять по парку Горького.

В комнате имеются:
Широкая 2-х спальная кровать
Большой мягкий 2-х спальный диван
Кухня / Сан.узел
Холодильник, стиралка, мультиварка, микроволновка.
Большой шкаф
Компьютерное кресло
Два больших торшера (чтоб фармить по ночам с романтикой)

По оплате:
💵 Аренда + коммуналка = 46к / месяц

Писать в лс: @Aleron75

Очень хочу найти человека до завтрашнего вечера 🙏

БЕЗ КОМИССИИ И ЗАЛОГА


Update: жилец нашелся
👍37👎24🔥11🏆3
This media is not supported in your browser
VIEW IN TELEGRAM
Такс, ну все. Я снова в Таиланде🇹🇭

Чтоб попасть на Пхукет и не разориться на билетах пришлось посетить 4 страны за сутки.

Успел за пару дней качественно обосноваться. Заселился в апарты (18к), арендовал байк (5к), купил симку(0.6к). Теперь готов снова пилить контент и двигаться к титулу Kaggle мастера.

Ожидается, что проведу в Тае ~ год по языковой визе. Поэтому сразу же написал TODO лист дел на год. Планирую подготовиться тут к IELTS, пока хожу в языковую школу. Уже даже записался в спец. группу. Боже, как же я мечтал однажды приехать на острова чисто ради языковой практики 😍

Тут на острове сейчас просто толпы русских IT-ников. По ощущениям, каждый третий говорит по-русски. Каждый 5-й из них что-то мутит с криптой 🤑.

В общем, вам теперь иногда придется любоваться местными красотами Таиланда 🇹🇭 :) Не все же время мне только кодить 👨‍💻
🔥95👍316👎1
🏆 Data Feeling | AI
🥳 Опача! 🤹‍♂️ Шейкап и наша тима red_mad_robot 🤖 в топ-5 по нефтянке. 🏆 Еще круто, что на 3-м месте команда Дзися (@dzis_science). Надо будет с ним теперь призовые поделить за идеи😅🤫) 🎪 В следующем туре вообще всех скинем😈💪 А то уже хочется новую карточку…
Как закончилась Роснефть?)

😅 Как итог, во втором треки обеими командами мы потерпели фиаско =)

🤔 Прогнозирование временных рядов - это дело не простое. Сама по себе задача интересная, но временные ряды в этот раз не подались. Финишировали ~ топ-7 и после упали до топ-11.

🔥 Парадоксально для меня было то, что лучшее решение с катбустом требовало сильно меньше итераций, чем этого требовала локальная валидация. Это мы заметили случайно.

Пример: модель, обученная на 10 итерациях с плохим локальным скором, переплюнула на лидерборде модель обученную в 500 итераций с лучшим локальным скором... WTF? Этому не учат на классических курсах по Data Science 😄

🧠 Извлек урок. Возможно, для успеха в соревнованиях по временным рядам, особенно с шумными данными, хорошо заходит сильная регуляризация (max_splits, min_splits, min_leafs…) и умная фильтрация фичей (например permutation importance). Сразу в топ может и не пойдешь, но зато потом влетишь в топ на тесте.

😌 В целом - задача мне понравилась, но не разгадали какие-то киллер фичи. Докерные соревнования сильно замедляют проверку интересных гипотез (сегментация временных рядов).

Радует, что хотя бы из первого трека унесем немного призовых 🤑
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39🔥4👎2
🧞‍♂️ Давно не было мок собесов от меня!

Отличные новости для новичков, которые пробуют себя ML/DS!

Data Feeling примет участие в Tech Interview Fest от Solvery — первом марафоне онлайн собеседований на Junior позиции.(Писал про основателя в этом посте). Так вот, в фесте участвуют разные сообщества по 10 технологиям, а мы представляем ML

👉 Приглашаю одного из подписчиков моего канала стать участником и пройти собес онлайн на стриме 11 ноября в 19 00 по Москве 🤩

🤨 Как это будет?
- Я вместе с ментором Solvery — Джамилем Закировым (ML Engineer в EyeQ Inc.) проведем моковое собеседование на позицию Junior ML
- 1 час собеседование, и 30 минут — обратная связь + ответы на вопросы зрителей
Моковое собеседование — это как настоящее, только для тренировки

На мероприятие можно зарегистрироваться
🍿В качестве зрителя стрима
🥷 В качестве собеседуемого

Cобеседуемый будет выбран случайно и объявлен за несколько дней до проведения стрима, чтобы можно было подготовиться

Условия для участия в моковом собеседовании на Junior позицию:
- Ты мой подписчик (канал @datafeeling)
- Ты либо готовишься к первой работе, либо уже Junior специалист и хочешь оценить свои навыки
- Наличие тихого места🤫, камеры 📹 и стабильного интернета 🌐
- По желанию можно будет выбрать вакансию, по требованиям к которым хочешь провести собеседование.

🤨 Почему стоит принять участие?
- Получишь боевой опыт прохождения собеседования
- Участие в стриме - кейс, который отлично смотрится в резюме и демонстрирует софт скилы и уверенность в себе
- Обратная связь от менторов и возможность задать любые вопросы
- Просто кайфово проведешь время 😉

🤨 Почему стоит прийти зрителем?
- Посмотрите на пример реального собеседования
- Сможете задать вопросы ментору
- И да — кайфово и с пользой проведете время 😁

Записывайтесь по ссылке в качестве зрителя или участника, чтобы мероприятие добавилось в календарь, а накануне пришли напоминания

Участника объявим во вторник 8 ноября
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍8👎3