🏆 Data Feeling | AI – Telegram
🏆 Data Feeling | AI
15.9K subscribers
732 photos
222 videos
6 files
469 links
IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2
Download Telegram
Чтобы выиграть «соревнование», нужно участвовать в «соревнованиях».

Как богатейшие люди мира добились своих успехов? Они прежде всего участвовали.

Работая на высоких должностях со сладкими условиями, мы сами того не понимая - бездействуем. Мы лишь наблюдаем за тем, как участвуют в соревновании большие начальники. Мы помогаем выиграть им, но сами едва ли сдвинулись со старта.

Любые попытки участия в «соревновании» дают тебе ненулевые шансы выиграть. В ином случае - ты не выиграешь гарантированно.
👍57👎4
🏆 Data Feeling | AI
💡Идея Провести стрим со знакомыми из IT, кто успешно перебрался зарубеж и продолжает трудиться там. Насчитал 7 кейсов (Кипр🇨🇾, Турция🇹🇷, Таиланд🇹🇭, Черногория🇲🇪, Германия🇩🇪, Америка🇺🇸, Канада🇨🇦). Организую стрим, только если у вас есть желание послушать.…
🤩Вот можете же, если захотите!

⚙️Ок, я вас услышал. Обдумаю формат и проведу несколько стримов с записью в ближайшее время. Интересующие вопросы кидайте сюда. Базовые вопросы по переездам закрою сам
🎉22👎7🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Постепенно улучшаю свой тайм-менеджмент.

👨‍🚒 Пытаюсь дробить работу на интервалы в 45 минут. Для бОльшего комфорта отказался от таймера в пользу вот этого песочного чуда.

🤔 Оказывается, у меня фетиш на переворачивание песочных часов руками. Приятнее, чем тыкать по сенсору.

⁉️Через пару недель расскажу - норм тема или фигня
👍47🔥6🤔4👎1
😎 Продолжаю прокачивать свой тайм-менеджмент.

🥳 Теперь у меня еще больше времени на Kaggle

😘 P.S - Х5 было одним из лучших мест, где мне приходилось тащить таски. Увы, кризис никого не щадит, так бы побыли вместе подольше.
👍21😱8👎1
👀 Присматриваюсь к интересным вакансиям. Подумываю вот, а не сменить ли мне сферу деятельности....

🤔 Судя по 1.5М просмотров за ~7 месяцев, понимаешь, что популярно сейчас далеко не IT. Сейчас на хайпе другое

🤫 На вид профессия даже романтичнее, чем работа таксистов
🔥32👎9🤔2
🏁 Мой трехмесячный марафон фарминга подошел к концу.

Плеяда соревнований закончилась под эгидой DataFussion contest от ВТБ. В рамках основной задачи марафонцам предстояло решить проблему матчинга пользователей на основе данных о банковских транзакиях и данных о кликстриме.

Дополнительную сложность вносил лимит по времени на докер контейнер и тп. Лучшей тиме немного не хватило до призовых мест в основной задаче, но удалось взять серебро (а также 50 к и мерч) в номинации "публичное решение". В финальном решении марафонцы нагенерировали фичей, отобрали наиболее важные и на полученных векторах обучили catboost😻. Из прикольного, попробовали сетки и даже подход с SAX-PAA для временных рядов, но не выстрелило. В топе как всегда лютый блендинг 😍

🤖🤑Следующие три месяца лучшие ребята будут фармить соревы уже на ставке в Red Mad Robot 🤑🤖

🧠🤔Своими личными выводами и мыслями поделюсь позже
👍33👎1
Моя аудитория напрямую влияет на жизнь моего канала!

Мы тут с Андреем спорим как следующий выпуск назвать.

⚽️ Сам сюжет такой - на вход попадает 6 джунов и каждый раунд вопросов по DS мы отсеиваем одного самого слабого джуна. До этого выпуски назывались по типу _Типичное собеседование__Позиция__Результат_.

🎨 Как назвать эти выпуски? Ведь собес на 6 ждунов типичным собесом уже точно не назовешь.

🎰 Крч, кидайте/выбирайте варианты в комменты. Я выберу тот, за который больше всего проголосуют другие.

🤔Версия Андрея - "Мы собесили 6 джунов. Они орали".
👍21🔥10👎2
🚀 Ловите пушку!

Новый выпуск типичного собеседования по Data Science.

⚔️ В этот раз встретились с опытным DS кандидатом и матерым хакатонщиком - Иваном из Сбера. Идеальный выпуск, чтоб посмотреть в обеденный перерыв. Ваня держался очень хорошо, но что-то пошло не так…

👨‍💻 Кстати, после этой встречи, решили с Ваней поучаствовать совместно в ближайших чемпионатах. Посмотрим что из этого выйдет. Расскажу про совместные результаты позже.


Совместно с t.me/dzis_science
👍11🔥11🤔2👎1
Работать Data Scientist’ом:

🤔 Ожидание: решаешь крутые и важные задачи, увеличивая прибыль компании. Находишь точки роста с помощью data-driven подхода и легко выявляешь «золотые гипотезы».


🙂 Реальность: отбиваешься от просьб студентов решить задачки в сессию 🤷‍♀️
29👍12😱6👎1
🙊 Ауффф! Знаковый день в моей жизни!🙈

😱 Приняли мою научную статью в журнал уровня Q2. Первая! В прошлый жизни я был биоинформатиком ежжи🤫. Вот доходят отголоски.

👨‍🔬Теперь True Scientist! Теперь и на PhD будет проще попасть в долину🤔

🧝‍♂️ Тему исследования даже называть не стану, чтоб не пугать людей🧛‍♂️. Чтоб вы понимали, я трижды был вписан ранее в биологические статьи, но каждый раз что-то шло не так, и исследования стопорились🤷‍♀️. В этот раз хватило сил и удачи.

Одна из целей на год выполнена!🤪
👍77🔥35🎉8👎2
Как проверить, что ты True DS?!

👉 Если ты можешь из текстового датасета BERT'ом извлечь эмбеддинги предложений 👉 дальше пихнуть в бустинг 👉 выбить высокие метрики для задачи мульти-классификации... При этом проворачиваешь все это дело за < 30 минут☝️, то ты красавчик🤠

Это я вчера на летную школу в Сириус отбирался. В прошлом году мне очень понравилось.
👍38👎9🔥51
Наткнулся с тимой на любопытный факап модели, пока фармили чемпионат.

Бустинг опирается сильнее всего на рандомно-сгенерированные признаки при этом дает очень высокую точность ~70% accuracy для 10 классов

😳🙅‍♂️Это к вопросу о том, что деревья умеют находить закономерности даже в шуме. На рисунке типичный Feature Importance.

Мдамс... дата саенс такой дата саенс...

Чтоб такого не было, используйте Permutation Importance
🤔24👍15
💡идея для фрод стартапа

🧠 Написать сетку, которая вместо тебя размечает данные на сервисах разметки по типу Толоки

🤔 Сегментацию, насколько знаю, сетки уже очень хорошо решают - почему бы на этом не заработать?!

U-net крутится, бабки мутятся
🤔14👍10👎2🔥1
пока фармил очередной чемпионат, сгенерировал ~800 hand-made фичей.

Вы только посмотрите, как красиво это выглядит со стороны😍

Если не всматриваться в текст, можно увидеть лица. (та самая структура данных, про которую все говорят 😂)

#feature_engineering_king
24👍6🤔4👎3🔥2
🤔 Ни разу еще не высказывался про отношение к IT курсам.

🤫 С высоты преподавания в МФТИ и на базе еще 5-ти онлайн школ, скажу, что онлайн курсы действительно помогают прокачаться и получить IT профессию. Особенно, если эти курсы готовишь и читаешь ты сам.
👍58👎3🤔3😱2
This media is not supported in your browser
VIEW IN TELEGRAM
Если вы забыли, как должен выглядит вид из вашего офиса, то вот…

Это я в гости к red_mad_robot зашел.

Какой вид у вас?
🔥25👎5👍4
Стабильно захожу в бронзу.

⚔️ Ради професильонального роста и тонуса периодически тренируюсь решать нестандартные задачи.

🎳 В последних двух чемпионтах на boosters.pro из-за недостатка времени не выбился в лидеры, зато пока решал, набрался прикольного опыта и написал кучу вспомогательных фрагментов для дальнейшего переиспользования. Один чемпионат заменяет несколько месяцев/лет работы в компании.

Из интересного:
- Расширил свой кругозор в анализе ошибок модели. Теперь буду хитрее подходить к генерации фичей и поиску gold features. Полезно читать статьи, даже если не хочется.
- Ощутил насколько сильно дает прирост блендинг моделей в задачах мульти-классификации.

Из более интересного:
Кажется, иногда выиграть без погружения в доменную область просто нереально. Несколько сильных доменных фичей может заменить 10 моделей и часы/дни подбора гипер-параметров.

🎰 За летние месяцы сделаю акцент на Kaggle. Там призовые так просто не урвешь, зато толк от медалей больше. Поднимает статус твоего профиля.
👍51👎4🔥1
#зашквары

😍 Меня часто веселят маркетинговые заголовки онлайн-школ.

😱 Вот один из них: "Создайте искусственный интеллект сами! 20–22 ..." - За три дня? ИИ?! Серьезно?! Так просто?!

🤷‍♀️ Весь мир пока не смог, а ты сейчас за два дня бах и сделаешь свой искусственный интеллект, и пупок даже не развяжется.

🤔 Жалко наивных людей, кто на этот маркетинг ведется. Я за прозрачность. Писали бы уже хоть явно про машинное обучение.
🔥26👎9👍6😱2
🚀 Запуск "Хочу крутой оффер 2.0"

Наш эксперимент с разгоном группы 4-х человек оказался успешным. Один участник уже вот-вот умчит в Германию, а остальные имеют отшлифованные резюме, привычку каждый день откликаться на вакансии и отсутствие страха перед периодическими собесами на английском. Для них оффер это уже вопрос времени.

😎 Ты тоже можешь дойти до оффера в $50к+ в год.
Мы систематизировали тренировки: участники пробегут марафон 30-дневных заданий, что поможет проработать все аспекты поиска работы зарубежом. Под присмотром 4-х опытных наставников.

‼️ Ты имеешь все шансы попасть в набор, если:
- У тебя разговорный английский (B1+)
- Твой уровень > Junior+ (опыт работы от 1 года)
- Ты готов уделять программе минимум 2 часа в день в течение месяца
- Имеешь $250 или $800 (в зависимости, насколько интенсивно ты хочешь, чтоб мы командой тебя "мучали")

А если, окажется, что ты "машина", и за месяц накосишь самые "жирные" офферы, то мы вернём тебе деньги

Подробности о программе
Подать заявку
Старт 27.06
🔥34👎9👍7
Это я чилю и жду пока мою тиму топовых DS’ов шейкапнет на привате в голду🥇и мы пойдем потом на радостях в бар 🙋‍♂️🍷

В противном случае новую сореву начнем фармить 🤷‍♀️
14👍5👎3😱1
Вчера закончился очередной компетишен по NLP на Kaggle.

⚔️ Суть задачи была в определение схожести двух текстов исходя из контекста.

🤔 Пока решали, столкнулись с проблемой, которую вижу не первый раз. Проверив кучу гипотез и натренировав десятки моделей, мы откладывали вопрос стекинга решений до последних дней.

🤷‍♀️ Как итог, вылезла куча подводный камней и впихнуть 20 BERT-моделей в стекинг за сутки физически просто не смогли. В итоге, тупо поблендили все, но эффекта это сильного не принесло. Из 2К участников, остались в ~ топ-300. Стекайте заранее!

🤔 Вторая проблема - это распыление.
Выиграть можно только если полностью фокусируешься на одной задаче. Иначе все чемпионаты превращаются в безпризовое участие.

Всем хорошей недели! Ждите новый выпуск собесов)
👍42👎114🔥1