🏆 Data Feeling | AI – Telegram
🏆 Data Feeling | AI
15.9K subscribers
732 photos
222 videos
6 files
469 links
IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
👍57👎16😁9🔥53🤔3
Эх, желание суету навести ...

Или хотя бы написать статью про skill-set соревновательного Data Science 🤔

А то меня постоянно спрашивают, что надо уметь?! С чего начать? Вот вы сами, что думаете? Какие конкретные скиллы помогают улучшить скор в соревнованиях? Накидайте идей/мыслей в комментарии 🙏

Когда выкачу статью - вы удивитесь, но скиллов требуется много. Элементарно, но не каждый может задачу мульти-лейбла настроить сходу.

Фото чисто для привлечения внимания. Нейронки в моем телефоне уже с 2019 года что-то про меня знают.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👎31👍1
Потерял доступ к своему You-Tube каналу

В августе был небольшой кипишь, а именно МФТИ попал под санкции. Как итог - Google отозвал доступы к почтам. Физтеховский домен @phystech.edu перешел на сервера Яндекса.

До окончательной блокировки почт - я успел везде сменить свою почту на альтернативные. (В первую очередь начал конечно с же с Kaggle и Github).

🧐 Спустя неделю после блокировки решил залить новый видосик на ютуб для своей любимой аудитории. И тут понял, что доступа то теперь у меня нет! Почту басурманскую на яндексоидную я сменить не сменил. И восстановить не получается... Все сообщения в поддержку уходят в небытие юродивое. Летят куда-то за океан и не возвращаются.

🤖 В общем, сейчас в мыслях еще немного попрокрастинировать этот вопросик, и если решений не найдётся, то буду новый канал заводить. Ибо материал копится. Суета суетная в мире святого Data Science сама себя не наведет. Никто кроме Алерончика парням не расскажет, как медали фармить, да собесы в FAANG проходить на своем примере. Кто молодым и неопытным новичкам скажет, не покупать курсы от skillbox?!

🤔 Если вдруг сталкивались с таким, то накидайте советов, что делать? Иначе вам же потом на мой второй канал подписываться)
Please open Telegram to view this post
VIEW IN TELEGRAM
😱366😁6👍5👎4
🏆 Data Feeling | AI
Мало кто слышал про сегментацию временных рядов. Задача не тривиальная, но когда твои временные рядочки вдруг аккуратно разбиваются по сегментам испытываешь кайф в чистом виде.
Как некоторые уже поняли, это мы с тимой из red_mad_robot пытаемся рамсить на поприще нефтянки.

Задача: предсказывать время поломок на скважинах.
Данные: 100 гигов многомерных временных рядов. Сорева докерная, приходится ждать результатов по 2 часа.

Как всегда кидаю сюда скрин за сутки до соревнования. Вдруг выиграем?! Тогда вы хоть увидите как мы это сделали)
В любом случае, после я расскажу вам полезные лайф-хаки по увеличению скора. Временные ряды решаю не так часто, поэтому как назло, лучшие идеи приходят под конец соревнования.

Кстати, соревнование двух-этапное. Если сейчас 150к не заберем, то потом поборемся сразу за 300к.
Отберут первые 15 команд. Мы пока проходим. Если выиграем купим себе новую карточку на сервак.

#Rosneft_Challenge
👍27🏆7🔥5👎31🎉1
Media is too big
VIEW IN TELEGRAM
🧐 Если бы мне было меньше 20-ти (времена, когда на лето я ездил к бабуле😍), то я бы точно потратил месяц лета на изучение техники слепой печати (в обоих языках).

🙂 В общем, решили по фану с Настей (@a_voitseshko) снять видос про технику слепой печати. Некоторые люди не из IT искренне удивляются моему навыку набирать текст с закрытыми глазами, хотя я уже давно привык к нему и не считаю его редким. Однако, для меня этот скилл хороший маркер опыта.

🤨 Вот история: На 1-м курсе магистратуры я выбирал биоинформатическию лабу для написания диплома. Тогда мне очень хотелось освоить крутые фишечки из этой сферы. Так вот в одной из тех лаб, заметил, как мой потенциальный научрук набирает текст двумя указательными пальцами и не отводит взгляда от клавиатуры. При этом он обещал меня научить всем техническим штукам. Меня тогда эта деталь с набором текста сильно смутила, и я там не остался. Кто-то меня осудит за предвзятость, мол это не важно, но вот только мои одногруппники после той лабы так ничего толкового и не опубликовали. Совпадение?

🤪 Ждите, скоро прикольные видосик выпущу. Пока ловите фрагмент. На нем я после удаления зуба мудрости, поэтому немного странно говорю. Смотреть на х2!

🤨 А вы умеете писать 10-ю пальцами вслепую?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👎22👍162🤔2
Начинающий Алерончик входит в Data Science. Картина маслом.

Скрин от подписчика: @MaximAbrosimov
😁22🔥6👎32👍1
🏆 Data Feeling | AI
Как некоторые уже поняли, это мы с тимой из red_mad_robot пытаемся рамсить на поприще нефтянки. Задача: предсказывать время поломок на скважинах. Данные: 100 гигов многомерных временных рядов. Сорева докерная, приходится ждать результатов по 2 часа. Как…
🥳 Опача!

🤹‍♂️ Шейкап и наша тима red_mad_robot 🤖 в топ-5 по нефтянке.

🏆 Еще круто, что на 3-м месте команда Дзися (@dzis_science). Надо будет с ним теперь призовые поделить за идеи😅🤫)

🎪 В следующем туре вообще всех скинем😈💪 А то уже хочется новую карточку купить...

🚧 Второй этап будет с новой метрикой, он уже открыт и ждёт решений!
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆59👍11👎2🔥1
Обычно не люблю такое выкладывать, просто радуюсь и все, но тут особый случай 😅

А недавно задумался. Вот создал я группу с кучей HR-ов, а как вообще понять, что они нормально закрывают потребность в поиске?! 🤔

Оказывается, работает!
Я просто когда-то сделал пару верных кликов мышкой. А реальный человек остался на плаву, избежав кризиса. Моя душа довольна!

(не реклама)

Второй абзац про жену меня улыбнул) Как же сильно он ее любит! Не каждый знает про такой лайф-хак

Update:
или как написали в комментах «вайф-хак» 😂🙈
👍70😁17👎92🔥2😱1🏆1
Квартира в центре

Отчаялся искать, а сроки горят, поэтому пользуясь своим положением хочу оперативно среди своих найти жильцов в квартиру на Октябрьской, в которой прожил с кайфом с начала лета.

Коротко:
На полгода-год сдается оборудованная для комфортного проживания уютная однокомнатная квартира с хорошим ремонтом, расположенная в 1 минуте от метро Октябрьская (!). Балкон с приятным видом на Москву-Сити. 9 этаж. Свое парковочное место. Есть шлагбаум.

Идеально для любителей гулять по парку Горького.

В комнате имеются:
Широкая 2-х спальная кровать
Большой мягкий 2-х спальный диван
Кухня / Сан.узел
Холодильник, стиралка, мультиварка, микроволновка.
Большой шкаф
Компьютерное кресло
Два больших торшера (чтоб фармить по ночам с романтикой)

По оплате:
💵 Аренда + коммуналка = 46к / месяц

Писать в лс: @Aleron75

Очень хочу найти человека до завтрашнего вечера 🙏

БЕЗ КОМИССИИ И ЗАЛОГА


Update: жилец нашелся
👍37👎24🔥11🏆3
This media is not supported in your browser
VIEW IN TELEGRAM
Такс, ну все. Я снова в Таиланде🇹🇭

Чтоб попасть на Пхукет и не разориться на билетах пришлось посетить 4 страны за сутки.

Успел за пару дней качественно обосноваться. Заселился в апарты (18к), арендовал байк (5к), купил симку(0.6к). Теперь готов снова пилить контент и двигаться к титулу Kaggle мастера.

Ожидается, что проведу в Тае ~ год по языковой визе. Поэтому сразу же написал TODO лист дел на год. Планирую подготовиться тут к IELTS, пока хожу в языковую школу. Уже даже записался в спец. группу. Боже, как же я мечтал однажды приехать на острова чисто ради языковой практики 😍

Тут на острове сейчас просто толпы русских IT-ников. По ощущениям, каждый третий говорит по-русски. Каждый 5-й из них что-то мутит с криптой 🤑.

В общем, вам теперь иногда придется любоваться местными красотами Таиланда 🇹🇭 :) Не все же время мне только кодить 👨‍💻
🔥95👍316👎1
🏆 Data Feeling | AI
🥳 Опача! 🤹‍♂️ Шейкап и наша тима red_mad_robot 🤖 в топ-5 по нефтянке. 🏆 Еще круто, что на 3-м месте команда Дзися (@dzis_science). Надо будет с ним теперь призовые поделить за идеи😅🤫) 🎪 В следующем туре вообще всех скинем😈💪 А то уже хочется новую карточку…
Как закончилась Роснефть?)

😅 Как итог, во втором треки обеими командами мы потерпели фиаско =)

🤔 Прогнозирование временных рядов - это дело не простое. Сама по себе задача интересная, но временные ряды в этот раз не подались. Финишировали ~ топ-7 и после упали до топ-11.

🔥 Парадоксально для меня было то, что лучшее решение с катбустом требовало сильно меньше итераций, чем этого требовала локальная валидация. Это мы заметили случайно.

Пример: модель, обученная на 10 итерациях с плохим локальным скором, переплюнула на лидерборде модель обученную в 500 итераций с лучшим локальным скором... WTF? Этому не учат на классических курсах по Data Science 😄

🧠 Извлек урок. Возможно, для успеха в соревнованиях по временным рядам, особенно с шумными данными, хорошо заходит сильная регуляризация (max_splits, min_splits, min_leafs…) и умная фильтрация фичей (например permutation importance). Сразу в топ может и не пойдешь, но зато потом влетишь в топ на тесте.

😌 В целом - задача мне понравилась, но не разгадали какие-то киллер фичи. Докерные соревнования сильно замедляют проверку интересных гипотез (сегментация временных рядов).

Радует, что хотя бы из первого трека унесем немного призовых 🤑
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39🔥4👎2
🧞‍♂️ Давно не было мок собесов от меня!

Отличные новости для новичков, которые пробуют себя ML/DS!

Data Feeling примет участие в Tech Interview Fest от Solvery — первом марафоне онлайн собеседований на Junior позиции.(Писал про основателя в этом посте). Так вот, в фесте участвуют разные сообщества по 10 технологиям, а мы представляем ML

👉 Приглашаю одного из подписчиков моего канала стать участником и пройти собес онлайн на стриме 11 ноября в 19 00 по Москве 🤩

🤨 Как это будет?
- Я вместе с ментором Solvery — Джамилем Закировым (ML Engineer в EyeQ Inc.) проведем моковое собеседование на позицию Junior ML
- 1 час собеседование, и 30 минут — обратная связь + ответы на вопросы зрителей
Моковое собеседование — это как настоящее, только для тренировки

На мероприятие можно зарегистрироваться
🍿В качестве зрителя стрима
🥷 В качестве собеседуемого

Cобеседуемый будет выбран случайно и объявлен за несколько дней до проведения стрима, чтобы можно было подготовиться

Условия для участия в моковом собеседовании на Junior позицию:
- Ты мой подписчик (канал @datafeeling)
- Ты либо готовишься к первой работе, либо уже Junior специалист и хочешь оценить свои навыки
- Наличие тихого места🤫, камеры 📹 и стабильного интернета 🌐
- По желанию можно будет выбрать вакансию, по требованиям к которым хочешь провести собеседование.

🤨 Почему стоит принять участие?
- Получишь боевой опыт прохождения собеседования
- Участие в стриме - кейс, который отлично смотрится в резюме и демонстрирует софт скилы и уверенность в себе
- Обратная связь от менторов и возможность задать любые вопросы
- Просто кайфово проведешь время 😉

🤨 Почему стоит прийти зрителем?
- Посмотрите на пример реального собеседования
- Сможете задать вопросы ментору
- И да — кайфово и с пользой проведете время 😁

Записывайтесь по ссылке в качестве зрителя или участника, чтобы мероприятие добавилось в календарь, а накануне пришли напоминания

Участника объявим во вторник 8 ноября
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍8👎3
И вот как с таким бороться?)

🤷‍♀️ Мое имя, такая же аватарка как у меня. Пишет знакомому. Просит перевод в крипте.

🥸 Потом никому ничего не докажешь. Полная мимикрия под меня, если бы не слово «нету»

😕 Будьте осторожны. Какой-то новый вид мошенничества
Please open Telegram to view this post
VIEW IN TELEGRAM
😱44👎3
🏆 Data Feeling | AI
Video message
Помните мою нетворкинг сессию?

🔥 В общем, она реально огненная получилась. И ребята были интересные с разнообразным опытом, и пиццу поели, и мини лекции на около IT-е темы послушали. Кто-то смог даже работу найти после. Все как хотелось! Возможно еще когда-нибудь такое устрою.

А пока ловите первую запись выступления. Вы же не зря просили записывать?! На нем Настя (@semolina_channel) делится своими дополнительными нестандартными методами организации работы команды. Мне зашло =)

😜 Запись: Мемы как инструмент для эффективной работы команды

Темы выступлений были нестандартные. Было два главных критерия:
- Темы плохо гугляться
- Темы актуальны


P.S. - Если снова буду делать ивент, то в следующий раз Маша (@mashkka_ds) тоже выступит!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥6👎2
Химерная аугментация данных

🧠 Вот все знают, что набор изображений можно бесплатно расширить, сделав простые преобразования картинки. Например, если зеркально отразить картинку с котиком, то получим того же котика, но для нейронных сетей это будет уже совсем новый котик.

🤨 Однако, часто при аугментациях мыслят в пределах одной картинки, но как вам идея мыслить в пределах одного класса? Ведь так можно же сделать химерного котика!

Удивительно, но в некоторых задачах если правильно настроить обучение, то такая аугментация докидывает в точности. Тонкость только в том, чтоб при обучении модели скор для таких гибридов считался с меньшим весом, относительно картинок без смешивания.

Дважды прикольно, что такое работает не только для картинок, но и для текстов и прочего. И плевать, что новых объектов не существует в реальности, важно сделать обобщенную модель, и это техника помогает этого добиться тоже.

P.S. - Надеюсь, вы славно отметили Хэллоуин!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍40🔥15🤔4👎1😱1
Есть два стула - Класс 0 и класс 4.

Какую фичу сгенерировать, чтоб лучше различать эти два класса между собой?!

Модель сама не вывозит, хочу помочь ей явно.
🤔8🔥3👍2👎1
🏆 Data Feeling | AI
Помните мою нетворкинг сессию? 🔥 В общем, она реально огненная получилась. И ребята были интересные с разнообразным опытом, и пиццу поели, и мини лекции на около IT-е темы послушали. Кто-то смог даже работу найти после. Все как хотелось! Возможно еще когда…
Кстати, свое выступление на нетворк-сессии тоже удалось записать.

Обсудил с аудиторий взаимно-общие проблемы - что не так с мессенджерами и браузерами. И конечно, как минимизировать информационный шум вокруг, выиграв при этом дополнительное время в сутках.

Ссылка на выступление
🔥11👍5👎51😱1
Я парень простой, вижу в тг каналах постоянную рекламу - отписываюсь!
😁32👍15👎4😱2🔥1
🏆 Data Feeling | AI
Я парень простой, вижу в тг каналах постоянную рекламу - отписываюсь!
Кстати, про рекламу

😳 Тут недавно случай произошел. Несколько смышленых школьников нашли способ покупать Telegram Premium сильно дешевле официальной цены в РФ. И понятное дело, начали активно перепродавать со скидкой другим.

🧐 Почему я об этому пишу? Несколько дней назад купил ради теста у одних таких ребят премиум акк. Подумал, вау - реально хитрая лазейка для экономии. Мол, 150 рублей и у тебя премиум на год. Уже даже подумал запостить сюда рекламу этой "схемы". Однако, решил пару дней подождать и не нарушать свой принцип - не делать рекламу в личной блоге.

😎 Как итог, лавочку раскрыли, а купленные таким образом подписки аннулировали. Однако, схема мне понравилась, но видимо - халявы не будет...
Please open Telegram to view this post
VIEW IN TELEGRAM
😁16👍3👎3
Чем больше участвую в соревнованиях, тем больше убеждаюсь, что классические приемы, которым учат на курсах по Data Science часто не работают.

😉 В классических курсах, тебя учат обучать модель на таких данных, которые точно встретятся в тесте.

😆 В реальных боевых или соревновательных условиях - это часто не так. А если это нет так, то надо делать модель более обобщенной.

😱 Простейший пример - early stopping, с помощью которого находят оптимальное время обучения модели. Так вот, хорошей практикой, при участии в соревнованиях, является остановка обучения модели на более ранних стадиях. Так можно откалибровать локальную валидацию по отложенной выборке на лидер борде и не допустить переобучения под тренировочную выборку.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍60🔥6👎3🏆1
Девушки, занимающиеся Data Science, просто сверх сексуальны
🔥87👎55😁17🤔148👍6🏆1