🏆 Data Feeling | AI – Telegram
🏆 Data Feeling | AI
15.9K subscribers
732 photos
222 videos
6 files
469 links
IT предприниматель и препод 🧑‍🏫
ex-ML лидер в Dodo Brands 🦤🍕
Прокачиваю людей в Data Science 🚀
Победитель Stepik Awards 🏆
Kaggle Expert 🤹‍♀️
Создатель @Speakadora_bot @big_llm_course

РКН https://clik.now/datafeeling
Алерон @Ale_v2
Download Telegram
Вчера закончился очередной компетишен по NLP на Kaggle.

⚔️ Суть задачи была в определение схожести двух текстов исходя из контекста.

🤔 Пока решали, столкнулись с проблемой, которую вижу не первый раз. Проверив кучу гипотез и натренировав десятки моделей, мы откладывали вопрос стекинга решений до последних дней.

🤷‍♀️ Как итог, вылезла куча подводный камней и впихнуть 20 BERT-моделей в стекинг за сутки физически просто не смогли. В итоге, тупо поблендили все, но эффекта это сильного не принесло. Из 2К участников, остались в ~ топ-300. Стекайте заранее!

🤔 Вторая проблема - это распыление.
Выиграть можно только если полностью фокусируешься на одной задаче. Иначе все чемпионаты превращаются в безпризовое участие.

Всем хорошей недели! Ждите новый выпуск собесов)
👍42👎114🔥1
Вот есть модели Text2Text (GPT-3)
Есть уже Text2Image (DALL-E)

🤔 А когда будет уже Sound2Image? Можно было бы наорать под запись и потом посмотреть, какая картинка получится. Вроде же изи задумка. На фильмах можно обучить такую модель. Звуки китов не расшифрует, но по звуку воды сгенерирует картинки водопадов и тп.

🤐 Вариант со Speech2Text, а затем Text2Image не предлагать!

😴 Это я расфантазировался, пока готовил лекцию по обзору последних достижений в нейронках. Кстати, похожую картинку поста, сгенерированную нейронкой из текста “киберпанк город” планирую повесить дома на стене. Выглядит прям кайфово.
👍25👎3🔥3🤔1
🤷‍♀️ Тяжелый пациент

- Здравствуйте, мне бы модель отвалидировать, чем поможете?
- Начните с классического Train-Test Split
- А можно, чтоб оценка была несмещенная?
- Могу посоветовать K-Fold Validation.
- А если у меня в данных есть временная ось?
- Тогда берите Time Series K-Fold Validation
- Там еще есть группы, которые не должны пересекаться!
- Нестрашно, есть Grouped Time Series K-Fold Validation
- Ой, про дисбаланс таргета еще забыл!!!
- Ок, воткните Stratified Grouped Time Series K-Fold Validation
- Вы не поняли! Eще важно нормальное распределение фичей
- О, у нас как раз осталась последняя Bootstrap Stratified Grouped Time Series K-Fold Validation
- Здорово! А это учитывает шум в данных?
- Нет, но вот Robust Bootstrap Stratified Grouped Time Series K-Fold Validation ...
- А устаревание объектов во времени учтет?
- Sample Weighted Through Time Robust Bootstrap Stratified Grouped Time Series K-Fold Validation
- Ой, сложно, я, пожалуй, просто Train-Test Split возьму.
👍90🤔19🔥16👎51🎉1
Ты собесы вообще проходишь? А зарубеж? А на английском?
А когда начнешь? А знаешь, что "там" зп не сравнимы с РФ?

Кто тебя сдвинет с места, если не я и моя тима?!

Время сбора заявок на марафон "Хочу крутой оффер 2.0" подоходит к концу ⌛️
Это значит, что уже завтра я со своей командой начну отбирать мини группу. Суть марафона проста. Ребята тренируются проходить собесы. По ходу дела мы закрываем их слабые места. Ломаем языковой барьер и прорабатываем прочие слабости по типу кодинга и тд.

Сбор анкет закроем сегодня в 21:00 по Москве. Поэтому не спи!
Вот анкета. Вот программа

Помни, что это не бесплатно!
От $250, но если Ты способный, мы вернем деньги!
👍22👎8
Не смог не написать.

Еще один знаковый день в моей жизнь. Я открыл ИП.

Запустили с кентами стартапчик в сфере аналитики чужих данных. Оказалось, что без ИП даже первые тесты и продажи запустить не сможем 🤷‍♀️

Кстати, идею проекта мы придумали, пока был в Турции. Спасибо турецкому чаю и ворк спейсам в отелях. Нетворкинг в путешествиях это кайф 😎

🤔 Преп ли я дрожащий или право запустить стартап имею!?
👍46🔥11👎5🎉2
Ребята с вышкой все время умничают, что в DS нужна "математика", но стоит капнуть глубже, оказывается, что это не математика, а вышмат.

В реальной повседневной работе я каждый день использую математику. Притом очень часто, но это далеко не вышмат. Никакие интегралы не считаю, детерминанты матриц не ищу, а нужные формулы и алгоритмы мне оперативнее загуглить.

Решил накидать чек-лист из 30 простых математических фактов, без понимания которых тебе точно будет сложно в DS. Мощь вышмата не принижаю, но на старте все сильно проще, чем кажется.

Через пару дней закину статью на Хабр.
👍127🔥23👎6
Не успели разгрести заявки на марафон, как кто-то уже получает оффер до начала 😳

🤔 Получается, на Junior DS тоже релокейтят, если хорошо показать себя. Мотивация для джунов. Почитайте историю парня в комментах 🔥

Что ж, есть еще одно вакантное место. Заполняй анкету

*шутка про ауру*
👍26👎3🔥1
Постепенно разгоняюсь в CV

🏁 Сегодня огласили результаты соревы от VisionLabs по верификации моделей машин.

Из особенностей:
- В сореве не были выданы данные для обучения, лишь примеры датасетов с машинами 😳
- Было достаточно сильные лимиты на инференс модели. (Блендить тут все подряд было нельзя 😢)

Секрет успеха, имхо:
- Количество/качество собранных данных
- Удачный лосс (arcface)
- Хороший бэгбон (EfficientNet).

Разбор решений победителей можно глянуть тут

На левой картинке лб меня даже не видно, т.к сперва решение едва влезло в топ-15, а на привате закинуло в топ-7.

🤔 Еще приятный факт, решение с 6-го места, это ребята, которые участвовали в "марафоне по фармингу" и теперь работают в Red_Mad_Robot. Действительно прокачиваю, значит?!
👍32🔥5👎21
Мы явно недооцениваем простой взгляд коллег на свои баги
👍41🔥4👎2🤔1
В предверии статьи, где я прямым текстом пишу, что в «Data Science не нужна математика» дайте-ка сделаю пост, где я с красным дипломом Физтеха. Так у меня будет ссылка на аргумент, что я все-таки что-то понимаю в математических сферах, а не просто рандомный чел с улицы.

Update: поставил публикацию на утро вторника
🔥72👍2210👎9🎉6
Да уж, вот это жаркие баталии вы устроили 😳

Ловите статью. Надеюсь, она добавит мотивации новичкам!

Смысл статьи очень прост. Нужда в глубоких знания математики сильно зависит от контекста.

Да, математика хорошо помогает, но какая математика? И кому именно она нужна? А в каких ситуациях?

Зная эти ответы, можно намного качественнее распорядиться своим бесценными временем. Так ты не успеешь потерять мотивацию до того, как начнешь работать в этой сфере. Особенно актуально, если входишь в IT после 30 лет.

😊 Буду рад лайкам статьи на Хабре. Cильно запарился с оформлением в этот раз.
👍69🔥18👎6🤔1
🧞‍♂️ Вырвали бронзу на Kaggle!🥉

😳 Три недели решали задачу сегментации. Учили разные вариации Unet'ов. Не все успели проверить. Успели проиграть на паблике, но стабильные модели при шейкапе поднимает на привате наверх 👆🤪💪

👨🏻‍🌾🥉 Как итог в топ-96 из ~1560

Еще одна моя цель на этот год выполнена. Затащил себя и двух новичков в первую бронзу.

🤠 Дальше будем биться за золото! Чемпионатов прикольных сейчас в обилии, а скиллов прибавилось изрядно.

😱 Один из самых больших шафлов наверх в этой сореве

🤔 Eсли посмотреть на лидеров этой соревы, то там какие-то бешеные скопления мастеров и грендастеров

📈 Спасибо Redmadrobot за поддержку.
👍42🔥25🎉7👎2😱1
Поправьте меня, если я не прав
🔥54👎16👍4🤔1
"...Голландию с ее корпорацией ASML догнать невозможно, а без машин ASML невозможно создать конкурентно способную микросхему. От ASML зависят Apple, Samsung и Intel..."

Это, конечно, мне было известно, но вот от чего реально вчера обомлел - их руководитель (Senior Director) с русскими корнями. Более того, он выходец из моего вуза (Физтех).

Дважды необычно было узнать этот факт в беседе с моим товарищем не из России, закончившим тут магистратуру.

По паре лет Банин поработал в нескольких российских РАН'ах, потом что-то понял и вот уже 26-й год он разгоняет ASML, не оставляя шанса другим странам догнать. Впечатляет!
👍62🔥21👎7🎉4
Закройте все вкладки в браузере, сделайте своему мозгу приятно
🔥55🤔117👎7😱6👍4🎉1
Алерон, что фармишь сейчас? Как там соревы? Возьмешь в тиму? Куда посоветуешь влететь? В картинки уже залетел? А в American Express уже в топе? Что сейчас учишь? Голду в этот раз возьмешь?

🤝 Забились с очень заряженными парнями забрать голду в сореве от American Express. Тут сейчас очень горячо🔥

🏆 Однажды, я уже хорошо показал себя в задаче кредитного скоринга. Однако, в этот раз речь не про таблички, а про многомерные временные ряды.

😕 Остается еще месяц, но лб уже такой плотный, что вдыхать сложно. Не так часто вижу больше 2к участников, а тут уже больше 3к. Все рванули стакать бустинги. Топ двигается каждый час 🤠

🧠 По количеству попыток лидеров видно, что они не теряют шанса и на максималках используют попытки.

📈 Ситуацию усложняет возможность сабмитить .csv файлы, а значит блендить можно в производственных масштабах!

🤔 Вангую, чтоб дернуть чемпионат и скинуть лидеров вниз, придется выложиться на 105% и сблендить не один десяток моделей.

💪😈 Го приват-шейринг в комменты!
👍20👎14🔥5😱1
🌃 Стал счастливым обладателем доступа к Dalle-2. Не могу остановиться. Некоторые арты мне достаточно сильно щекочут фантазию 🎆🤤🥶😱

Сгенерировал уже много прикольный кейсов, качество просто космос 🏞😍

👇🌉 Пишите в комменты, что хотели бы отрисовать. Полет фантазии тут безграничен. Буду кидать сгенерированные пикчи! 🤩

👨‍🎤👨‍🎨 Превратим комментарии в арт-выставку!🏞🌄🏙🌅

(Без политики, есть фильтр)

@datafeeling
🔥56👍8😱2
Отсняли сегодня с Андреем новый выпуск собеса. Назвали: "100 Data Science вопросов Мидлу". Скоро зальем!🔥

Спрашивали в формате "плохой и хороший полицейский". Угадайте, кто был плохим полицейским ?😳
🔥108👎1
🏆 Data Feeling | AI
Отсняли сегодня с Андреем новый выпуск собеса. Назвали: "100 Data Science вопросов Мидлу". Скоро зальем!🔥 Спрашивали в формате "плохой и хороший полицейский". Угадайте, кто был плохим полицейским ?😳
Если этот пост наберет 100 реакций, то я сразу же выкладываю новый выпуск. Он получился очень качественным 🔥

Update:

Ловите заслуженный выпуск: 100 Data Science вопросов мидлу

Мучаем в этот раз Романа с Физтеха/ШАДа/Сбера в очень интенсивном режиме. Самый удачный выпуск снятый одним кадром.
👍164🔥42👎4🎉3🤔2
🏆 Data Feeling | AI
🌃 Стал счастливым обладателем доступа к Dalle-2. Не могу остановиться. Некоторые арты мне достаточно сильно щекочут фантазию 🎆🤤🥶😱 Сгенерировал уже много прикольный кейсов, качество просто космос 🏞😍 👇🌉 Пишите в комменты, что хотели бы отрисовать. Полет фантазии…
Вчера я окончательно убедился, что ИИ заменит дизайнеров уже завтра скоро.

Пока генерировал для вас арты, натренировался создавать настоящие шедевры дизайна с помощью Dalle-2.

Не могу поверить, что это делает машина! Да еще и за несколько секунд! Кто-нибудь вообще понимает, что это настоящая революция?!

😍🤤 Эстетическое наслаждение можно получить в моей статье на Хабр: Дизайнеры больше не нужны

P.S - на картинке я воспроизвожу постер для Redmadrobot. Директор юнита был впечатлен. Сказал, зря постер покупали. Надо было у меня оптом брать.

@datafeeling
👍61👎11😱73🔥2
Еще один знаменательный день в моей жизни.

Я топ-1 в рейтинге Хабра

Мне хватило 5 качественных статей, чтоб стать первым. Много ли людей может таким похвастать?!

Подробнее о своих мыслях и что этому всему сопутствовало расскажу уже позже. Сейчас просто хочу запечатлеть этот момент. Ложусь спать с полным душевным удовлетворением. Какой же это кайф... быть первым.
🎉156👍50🔥15👎63😱1