🏆 Data Feeling | AI – Telegram
🏆 Data Feeling | AI
15.9K subscribers
732 photos
222 videos
6 files
469 links
IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Такс, ну все. Я снова в Таиланде🇹🇭

Чтоб попасть на Пхукет и не разориться на билетах пришлось посетить 4 страны за сутки.

Успел за пару дней качественно обосноваться. Заселился в апарты (18к), арендовал байк (5к), купил симку(0.6к). Теперь готов снова пилить контент и двигаться к титулу Kaggle мастера.

Ожидается, что проведу в Тае ~ год по языковой визе. Поэтому сразу же написал TODO лист дел на год. Планирую подготовиться тут к IELTS, пока хожу в языковую школу. Уже даже записался в спец. группу. Боже, как же я мечтал однажды приехать на острова чисто ради языковой практики 😍

Тут на острове сейчас просто толпы русских IT-ников. По ощущениям, каждый третий говорит по-русски. Каждый 5-й из них что-то мутит с криптой 🤑.

В общем, вам теперь иногда придется любоваться местными красотами Таиланда 🇹🇭 :) Не все же время мне только кодить 👨‍💻
🔥95👍316👎1
🏆 Data Feeling | AI
🥳 Опача! 🤹‍♂️ Шейкап и наша тима red_mad_robot 🤖 в топ-5 по нефтянке. 🏆 Еще круто, что на 3-м месте команда Дзися (@dzis_science). Надо будет с ним теперь призовые поделить за идеи😅🤫) 🎪 В следующем туре вообще всех скинем😈💪 А то уже хочется новую карточку…
Как закончилась Роснефть?)

😅 Как итог, во втором треки обеими командами мы потерпели фиаско =)

🤔 Прогнозирование временных рядов - это дело не простое. Сама по себе задача интересная, но временные ряды в этот раз не подались. Финишировали ~ топ-7 и после упали до топ-11.

🔥 Парадоксально для меня было то, что лучшее решение с катбустом требовало сильно меньше итераций, чем этого требовала локальная валидация. Это мы заметили случайно.

Пример: модель, обученная на 10 итерациях с плохим локальным скором, переплюнула на лидерборде модель обученную в 500 итераций с лучшим локальным скором... WTF? Этому не учат на классических курсах по Data Science 😄

🧠 Извлек урок. Возможно, для успеха в соревнованиях по временным рядам, особенно с шумными данными, хорошо заходит сильная регуляризация (max_splits, min_splits, min_leafs…) и умная фильтрация фичей (например permutation importance). Сразу в топ может и не пойдешь, но зато потом влетишь в топ на тесте.

😌 В целом - задача мне понравилась, но не разгадали какие-то киллер фичи. Докерные соревнования сильно замедляют проверку интересных гипотез (сегментация временных рядов).

Радует, что хотя бы из первого трека унесем немного призовых 🤑
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39🔥4👎2
🧞‍♂️ Давно не было мок собесов от меня!

Отличные новости для новичков, которые пробуют себя ML/DS!

Data Feeling примет участие в Tech Interview Fest от Solvery — первом марафоне онлайн собеседований на Junior позиции.(Писал про основателя в этом посте). Так вот, в фесте участвуют разные сообщества по 10 технологиям, а мы представляем ML

👉 Приглашаю одного из подписчиков моего канала стать участником и пройти собес онлайн на стриме 11 ноября в 19 00 по Москве 🤩

🤨 Как это будет?
- Я вместе с ментором Solvery — Джамилем Закировым (ML Engineer в EyeQ Inc.) проведем моковое собеседование на позицию Junior ML
- 1 час собеседование, и 30 минут — обратная связь + ответы на вопросы зрителей
Моковое собеседование — это как настоящее, только для тренировки

На мероприятие можно зарегистрироваться
🍿В качестве зрителя стрима
🥷 В качестве собеседуемого

Cобеседуемый будет выбран случайно и объявлен за несколько дней до проведения стрима, чтобы можно было подготовиться

Условия для участия в моковом собеседовании на Junior позицию:
- Ты мой подписчик (канал @datafeeling)
- Ты либо готовишься к первой работе, либо уже Junior специалист и хочешь оценить свои навыки
- Наличие тихого места🤫, камеры 📹 и стабильного интернета 🌐
- По желанию можно будет выбрать вакансию, по требованиям к которым хочешь провести собеседование.

🤨 Почему стоит принять участие?
- Получишь боевой опыт прохождения собеседования
- Участие в стриме - кейс, который отлично смотрится в резюме и демонстрирует софт скилы и уверенность в себе
- Обратная связь от менторов и возможность задать любые вопросы
- Просто кайфово проведешь время 😉

🤨 Почему стоит прийти зрителем?
- Посмотрите на пример реального собеседования
- Сможете задать вопросы ментору
- И да — кайфово и с пользой проведете время 😁

Записывайтесь по ссылке в качестве зрителя или участника, чтобы мероприятие добавилось в календарь, а накануне пришли напоминания

Участника объявим во вторник 8 ноября
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍8👎3
И вот как с таким бороться?)

🤷‍♀️ Мое имя, такая же аватарка как у меня. Пишет знакомому. Просит перевод в крипте.

🥸 Потом никому ничего не докажешь. Полная мимикрия под меня, если бы не слово «нету»

😕 Будьте осторожны. Какой-то новый вид мошенничества
Please open Telegram to view this post
VIEW IN TELEGRAM
😱44👎3
🏆 Data Feeling | AI
Video message
Помните мою нетворкинг сессию?

🔥 В общем, она реально огненная получилась. И ребята были интересные с разнообразным опытом, и пиццу поели, и мини лекции на около IT-е темы послушали. Кто-то смог даже работу найти после. Все как хотелось! Возможно еще когда-нибудь такое устрою.

А пока ловите первую запись выступления. Вы же не зря просили записывать?! На нем Настя (@semolina_channel) делится своими дополнительными нестандартными методами организации работы команды. Мне зашло =)

😜 Запись: Мемы как инструмент для эффективной работы команды

Темы выступлений были нестандартные. Было два главных критерия:
- Темы плохо гугляться
- Темы актуальны


P.S. - Если снова буду делать ивент, то в следующий раз Маша (@mashkka_ds) тоже выступит!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥6👎2
Химерная аугментация данных

🧠 Вот все знают, что набор изображений можно бесплатно расширить, сделав простые преобразования картинки. Например, если зеркально отразить картинку с котиком, то получим того же котика, но для нейронных сетей это будет уже совсем новый котик.

🤨 Однако, часто при аугментациях мыслят в пределах одной картинки, но как вам идея мыслить в пределах одного класса? Ведь так можно же сделать химерного котика!

Удивительно, но в некоторых задачах если правильно настроить обучение, то такая аугментация докидывает в точности. Тонкость только в том, чтоб при обучении модели скор для таких гибридов считался с меньшим весом, относительно картинок без смешивания.

Дважды прикольно, что такое работает не только для картинок, но и для текстов и прочего. И плевать, что новых объектов не существует в реальности, важно сделать обобщенную модель, и это техника помогает этого добиться тоже.

P.S. - Надеюсь, вы славно отметили Хэллоуин!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍40🔥15🤔4👎1😱1
Есть два стула - Класс 0 и класс 4.

Какую фичу сгенерировать, чтоб лучше различать эти два класса между собой?!

Модель сама не вывозит, хочу помочь ей явно.
🤔8🔥3👍2👎1
🏆 Data Feeling | AI
Помните мою нетворкинг сессию? 🔥 В общем, она реально огненная получилась. И ребята были интересные с разнообразным опытом, и пиццу поели, и мини лекции на около IT-е темы послушали. Кто-то смог даже работу найти после. Все как хотелось! Возможно еще когда…
Кстати, свое выступление на нетворк-сессии тоже удалось записать.

Обсудил с аудиторий взаимно-общие проблемы - что не так с мессенджерами и браузерами. И конечно, как минимизировать информационный шум вокруг, выиграв при этом дополнительное время в сутках.

Ссылка на выступление
🔥11👍5👎51😱1
Я парень простой, вижу в тг каналах постоянную рекламу - отписываюсь!
😁32👍15👎4😱2🔥1
🏆 Data Feeling | AI
Я парень простой, вижу в тг каналах постоянную рекламу - отписываюсь!
Кстати, про рекламу

😳 Тут недавно случай произошел. Несколько смышленых школьников нашли способ покупать Telegram Premium сильно дешевле официальной цены в РФ. И понятное дело, начали активно перепродавать со скидкой другим.

🧐 Почему я об этому пишу? Несколько дней назад купил ради теста у одних таких ребят премиум акк. Подумал, вау - реально хитрая лазейка для экономии. Мол, 150 рублей и у тебя премиум на год. Уже даже подумал запостить сюда рекламу этой "схемы". Однако, решил пару дней подождать и не нарушать свой принцип - не делать рекламу в личной блоге.

😎 Как итог, лавочку раскрыли, а купленные таким образом подписки аннулировали. Однако, схема мне понравилась, но видимо - халявы не будет...
Please open Telegram to view this post
VIEW IN TELEGRAM
😁16👍3👎3
Чем больше участвую в соревнованиях, тем больше убеждаюсь, что классические приемы, которым учат на курсах по Data Science часто не работают.

😉 В классических курсах, тебя учат обучать модель на таких данных, которые точно встретятся в тесте.

😆 В реальных боевых или соревновательных условиях - это часто не так. А если это нет так, то надо делать модель более обобщенной.

😱 Простейший пример - early stopping, с помощью которого находят оптимальное время обучения модели. Так вот, хорошей практикой, при участии в соревнованиях, является остановка обучения модели на более ранних стадиях. Так можно откалибровать локальную валидацию по отложенной выборке на лидер борде и не допустить переобучения под тренировочную выборку.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍60🔥6👎3🏆1
Девушки, занимающиеся Data Science, просто сверх сексуальны
🔥87👎55😁17🤔148👍6🏆1
У меня для вас две новости.
Хорошая и не очень.

😈 Та что не очень, вот:
Please open Telegram to view this post
VIEW IN TELEGRAM
👎22😁6👍3
😇 Хорошая новость:

А уже сегодня — 11 ноября в 19:00 по мск пройдет стрим с моковым собеседованием на Junior ML позицию в рамках Tech Interview Fest

😈 Провожу собеседование я вдоем с ментором SolveryДжамилем Закировым (ML Engineer в EyeQ Inc.)

Сегодня анонсируем участника от сообщества
Им стал Никита Дильман 🎉🥂

Присоединяйтесь в качестве зрителя, поддержите Никиту, а также задайте свои вопросы мне и Джамилю в конце стрима. Можете накидать их сюда под постом даже =)

Регистрируйтесь в качестве зрителя по ссылке

Кайфового дня!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍9👎1🎉1
Меня одного уже достал своей навязчивой рекламой этот Алекс Рубанов?!?!?!

Принципиально уже никогда не куплю его продукты😂

Чертовы инфо-цЫганы!
🔥29😁18👎2
🏆 Data Feeling | AI
Картинка, как маленький спойлер. Какая модель лучше и почему? 😈 Ссылка на интервью на ютуб. Уже идет!
😈Простой вопрос, который для меня казался очевидным, сходу почти никто не осилил.

😘 Да, верно угадывают, что вторая модель может нестабильно работать в случае пропусков или выбросов. Однако, никто не сказал, как пофиксить эту проблему. Хотя вчерашний собеседуемый в целом догадался🤫

🥳 В общем, такую проблему можно исправить регуляризацией.
В случае нейронок это дропаут, в случае бустингов это уменьшение процента признаков на дерево.

😜 Тюним: colsample_bytree / feature_fraction и другие похожие по смыслу параметры. Смысл заставить модель опираться сильнее на менее важные признаки. Способов масса.


🧐 Какой ваш любимый гипер-параметр в бустингах?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42👎4🤔3😱1
Иногда хочу постить свои мысли вот так. Переворчивать тренды на биржах одним только твитом, как Илон Маск.

Нравится?
👎97👍43😁26
Устал видеть длинные "сопли" в чужих ноутбуках. Поэтому вот вам лайфхак как сделать установку либ в Jupyter Notebook'ах аккуратнее, если вы стеснялись спросить.

Способ не единственный, но мне этого хватает.
👍114👎16🔥11
После пары моих постов (этого и этого), все чаще люди начинают спрашивать у меня про Таиланд.

Кажется, мне не избежать поста про Тай. Придется все-таки побыть немного в роли тайского амбассадора и рассказать больше про свой опыт пребывания тут. В противном случае, моя личка лопнет скоро без универсального ответа.

Окей, сейчас расскажи немного как тут живется и почему я выбрали именно Таиланд на ближайший год, а не другую страну.

Вообще, я бы не подумал про это писать, но на этих выходных - был прикольный момент. Поехал небольшой компанией на Краби (погуглите, если никогда не видели, что это). Пока фотографировали коптером местные красоты с катера, я спросил своего приятеля Игоря: "А почему ты решил рвануть в Тай?" Ответ был по типу - твой пост про сравнение Турции, Казахстана и Таиланда навел меня на этим мысли.

Мне было чертовски приятно это слышать, что я пишу то что откликается в некоторых. Хотя никого агитировать не планировал, но по счастливому лицу Игоря было понятно, что он не промахнулся. К тому же, мне очень не хватало тут Физтехов первые пару недель.

Мне вообще приятно, когда удается навести людей на верные мысли или сделать удачный выбор. Например удачный сабмит🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32👎9