🏆 Data Feeling | AI
Мало кто слышал про сегментацию временных рядов. Задача не тривиальная, но когда твои временные рядочки вдруг аккуратно разбиваются по сегментам испытываешь кайф в чистом виде.
Как некоторые уже поняли, это мы с тимой из red_mad_robot пытаемся рамсить на поприще нефтянки.
Задача: предсказывать время поломок на скважинах.
Данные: 100 гигов многомерных временных рядов. Сорева докерная, приходится ждать результатов по 2 часа.
Как всегда кидаю сюда скрин за сутки до соревнования. Вдруг выиграем?! Тогда вы хоть увидите как мы это сделали)
В любом случае, после я расскажу вам полезные лайф-хаки по увеличению скора. Временные ряды решаю не так часто, поэтому как назло, лучшие идеи приходят под конец соревнования.
Кстати, соревнование двух-этапное. Если сейчас 150к не заберем, то потом поборемся сразу за 300к.
Отберут первые 15 команд. Мы пока проходим. Если выиграем купим себе новую карточку на сервак.
#Rosneft_Challenge
Задача: предсказывать время поломок на скважинах.
Данные: 100 гигов многомерных временных рядов. Сорева докерная, приходится ждать результатов по 2 часа.
Как всегда кидаю сюда скрин за сутки до соревнования. Вдруг выиграем?! Тогда вы хоть увидите как мы это сделали)
В любом случае, после я расскажу вам полезные лайф-хаки по увеличению скора. Временные ряды решаю не так часто, поэтому как назло, лучшие идеи приходят под конец соревнования.
Кстати, соревнование двух-этапное. Если сейчас 150к не заберем, то потом поборемся сразу за 300к.
Отберут первые 15 команд. Мы пока проходим. Если выиграем купим себе новую карточку на сервак.
#Rosneft_Challenge
👍27🏆7🔥5👎3❤1🎉1
Media is too big
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👎22👍16❤2🤔2
🏆 Data Feeling | AI
Как некоторые уже поняли, это мы с тимой из red_mad_robot пытаемся рамсить на поприще нефтянки. Задача: предсказывать время поломок на скважинах. Данные: 100 гигов многомерных временных рядов. Сорева докерная, приходится ждать результатов по 2 часа. Как…
🥳 Опача!
🤹♂️ Шейкап и наша тима red_mad_robot🤖 в топ-5 по нефтянке.
🏆 Еще круто, что на 3-м месте команда Дзися (@dzis_science). Надо будет с ним теперь призовые поделить за идеи😅🤫)
🎪 В следующем туре вообще всех скинем😈💪 А то уже хочется новую карточку купить...
🚧 Второй этап будет с новой метрикой, он уже открыт и ждёт решений!
🤹♂️ Шейкап и наша тима red_mad_robot
🏆 Еще круто, что на 3-м месте команда Дзися (@dzis_science). Надо будет с ним теперь призовые поделить за идеи😅🤫)
🎪 В следующем туре вообще всех скинем😈💪 А то уже хочется новую карточку купить...
🚧 Второй этап будет с новой метрикой, он уже открыт и ждёт решений!
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆59👍11👎2🔥1
Обычно не люблю такое выкладывать, просто радуюсь и все, но тут особый случай 😅
А недавно задумался. Вот создал я группу с кучей HR-ов, а как вообще понять, что они нормально закрывают потребность в поиске?! 🤔
Оказывается, работает!
Я просто когда-то сделал пару верных кликов мышкой. А реальный человек остался на плаву, избежав кризиса. Моя душа довольна!
(не реклама)
Второй абзац про жену меня улыбнул) Как же сильно он ее любит! Не каждый знает про такой лайф-хак
Update:
или как написали в комментах «вайф-хак» 😂🙈
А недавно задумался. Вот создал я группу с кучей HR-ов, а как вообще понять, что они нормально закрывают потребность в поиске?! 🤔
Оказывается, работает!
Я просто когда-то сделал пару верных кликов мышкой. А реальный человек остался на плаву, избежав кризиса. Моя душа довольна!
(не реклама)
Второй абзац про жену меня улыбнул) Как же сильно он ее любит! Не каждый знает про такой лайф-хак
Update:
или как написали в комментах «вайф-хак» 😂🙈
👍70😁17👎9❤2🔥2😱1🏆1
Квартира в центре
Отчаялся искать, а сроки горят, поэтому пользуясь своим положением хочу оперативно среди своих найти жильцов в квартиру на Октябрьской, в которой прожил с кайфом с начала лета.
Коротко:
На полгода-год сдается оборудованная для комфортного проживания уютная однокомнатная квартира с хорошим ремонтом, расположенная в 1 минуте от метро Октябрьская (!). Балкон с приятным видом на Москву-Сити. 9 этаж. Свое парковочное место. Есть шлагбаум.
Идеально для любителей гулять по парку Горького.
В комнате имеются:
✅ Широкая 2-х спальная кровать
✅ Большой мягкий 2-х спальный диван
✅ Кухня / Сан.узел
✅ Холодильник, стиралка, мультиварка, микроволновка.
✅ Большой шкаф
✅ Компьютерное кресло
✅ Два больших торшера (чтоб фармить по ночам с романтикой)
По оплате:
💵 Аренда + коммуналка = 46к / месяц
Писать в лс: @Aleron75
Очень хочу найти человека до завтрашнего вечера 🙏
БЕЗ КОМИССИИ И ЗАЛОГА
Update: жилец нашелся
Отчаялся искать, а сроки горят, поэтому пользуясь своим положением хочу оперативно среди своих найти жильцов в квартиру на Октябрьской, в которой прожил с кайфом с начала лета.
Коротко:
На полгода-год сдается оборудованная для комфортного проживания уютная однокомнатная квартира с хорошим ремонтом, расположенная в 1 минуте от метро Октябрьская (!). Балкон с приятным видом на Москву-Сити. 9 этаж. Свое парковочное место. Есть шлагбаум.
Идеально для любителей гулять по парку Горького.
В комнате имеются:
✅ Широкая 2-х спальная кровать
✅ Большой мягкий 2-х спальный диван
✅ Кухня / Сан.узел
✅ Холодильник, стиралка, мультиварка, микроволновка.
✅ Большой шкаф
✅ Компьютерное кресло
✅ Два больших торшера (чтоб фармить по ночам с романтикой)
По оплате:
💵 Аренда + коммуналка = 46к / месяц
Писать в лс: @Aleron75
Очень хочу найти человека до завтрашнего вечера 🙏
БЕЗ КОМИССИИ И ЗАЛОГА
Update: жилец нашелся
👍37👎24🔥11🏆3
This media is not supported in your browser
VIEW IN TELEGRAM
Такс, ну все. Я снова в Таиланде🇹🇭
Чтоб попасть на Пхукет и не разориться на билетах пришлось посетить 4 страны за сутки.
Успел за пару дней качественно обосноваться. Заселился в апарты (18к), арендовал байк (5к), купил симку(0.6к). Теперь готов снова пилить контент и двигаться к титулу Kaggle мастера.
Ожидается, что проведу в Тае ~ год по языковой визе. Поэтому сразу же написал TODO лист дел на год. Планирую подготовиться тут к IELTS, пока хожу в языковую школу. Уже даже записался в спец. группу. Боже, как же я мечтал однажды приехать на острова чисто ради языковой практики 😍
Тут на острове сейчас просто толпы русских IT-ников. По ощущениям, каждый третий говорит по-русски. Каждый 5-й из них что-то мутит с криптой 🤑.
В общем, вам теперь иногда придется любоваться местными красотами Таиланда 🇹🇭 :) Не все же время мне только кодить 👨💻
Чтоб попасть на Пхукет и не разориться на билетах пришлось посетить 4 страны за сутки.
Успел за пару дней качественно обосноваться. Заселился в апарты (18к), арендовал байк (5к), купил симку(0.6к). Теперь готов снова пилить контент и двигаться к титулу Kaggle мастера.
Ожидается, что проведу в Тае ~ год по языковой визе. Поэтому сразу же написал TODO лист дел на год. Планирую подготовиться тут к IELTS, пока хожу в языковую школу. Уже даже записался в спец. группу. Боже, как же я мечтал однажды приехать на острова чисто ради языковой практики 😍
Тут на острове сейчас просто толпы русских IT-ников. По ощущениям, каждый третий говорит по-русски. Каждый 5-й из них что-то мутит с криптой 🤑.
В общем, вам теперь иногда придется любоваться местными красотами Таиланда 🇹🇭 :) Не все же время мне только кодить 👨💻
🔥95👍31❤6👎1
🏆 Data Feeling | AI
🥳 Опача! 🤹♂️ Шейкап и наша тима red_mad_robot 🤖 в топ-5 по нефтянке. 🏆 Еще круто, что на 3-м месте команда Дзися (@dzis_science). Надо будет с ним теперь призовые поделить за идеи😅🤫) 🎪 В следующем туре вообще всех скинем😈💪 А то уже хочется новую карточку…
Как закончилась Роснефть?)
😅 Как итог, во втором треки обеими командами мы потерпели фиаско =)
🤔 Прогнозирование временных рядов - это дело не простое. Сама по себе задача интересная, но временные ряды в этот раз не подались. Финишировали ~ топ-7 и после упали до топ-11.
🔥 Парадоксально для меня было то, что лучшее решение с катбустом требовало сильно меньше итераций, чем этого требовала локальная валидация. Это мы заметили случайно.
Пример: модель, обученная на 10 итерациях с плохим локальным скором, переплюнула на лидерборде модель обученную в 500 итераций с лучшим локальным скором... WTF? Этому не учат на классических курсах по Data Science😄
🧠 Извлек урок. Возможно, для успеха в соревнованиях по временным рядам, особенно с шумными данными, хорошо заходит сильная регуляризация (max_splits, min_splits, min_leafs…) и умная фильтрация фичей (например permutation importance). Сразу в топ может и не пойдешь, но зато потом влетишь в топ на тесте.
😌 В целом - задача мне понравилась, но не разгадали какие-то киллер фичи. Докерные соревнования сильно замедляют проверку интересных гипотез (сегментация временных рядов).
Радует, что хотя бы из первого трека унесем немного призовых🤑
Пример: модель, обученная на 10 итерациях с плохим локальным скором, переплюнула на лидерборде модель обученную в 500 итераций с лучшим локальным скором... WTF? Этому не учат на классических курсах по Data Science
🧠 Извлек урок. Возможно, для успеха в соревнованиях по временным рядам, особенно с шумными данными, хорошо заходит сильная регуляризация (max_splits, min_splits, min_leafs…) и умная фильтрация фичей (например permutation importance). Сразу в топ может и не пойдешь, но зато потом влетишь в топ на тесте.
Радует, что хотя бы из первого трека унесем немного призовых
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39🔥4👎2
🧞♂️ Давно не было мок собесов от меня!
Отличные новости для новичков, которые пробуют себя ML/DS!
Data Feeling примет участие в Tech Interview Fest от Solvery — первом марафоне онлайн собеседований на Junior позиции.(Писал про основателя в этом посте). Так вот, в фесте участвуют разные сообщества по 10 технологиям, а мы представляем ML
👉 Приглашаю одного из подписчиков моего канала стать участником и пройти собес онлайн на стриме 11 ноября в 19 00 по Москве 🤩
🤨 Как это будет?
- Я вместе с ментором Solvery — Джамилем Закировым (ML Engineer в EyeQ Inc.) проведем моковое собеседование на позицию Junior ML
- 1 час собеседование, и 30 минут — обратная связь + ответы на вопросы зрителей
Моковое собеседование — это как настоящее, только для тренировки
На мероприятие можно зарегистрироваться
🍿В качестве зрителя стрима
🥷 В качестве собеседуемого
Cобеседуемый будет выбран случайно и объявлен за несколько дней до проведения стрима, чтобы можно было подготовиться
Условия для участия в моковом собеседовании на Junior позицию:
- Ты мой подписчик (канал @datafeeling)
- Ты либо готовишься к первой работе, либо уже Junior специалист и хочешь оценить свои навыки
- Наличие тихого места🤫, камеры 📹 и стабильного интернета 🌐
- По желанию можно будет выбрать вакансию, по требованиям к которым хочешь провести собеседование.
🤨 Почему стоит принять участие?
- Получишь боевой опыт прохождения собеседования
- Участие в стриме - кейс, который отлично смотрится в резюме и демонстрирует софт скилы и уверенность в себе
- Обратная связь от менторов и возможность задать любые вопросы
- Просто кайфово проведешь время 😉
🤨 Почему стоит прийти зрителем?
- Посмотрите на пример реального собеседования
- Сможете задать вопросы ментору
- И да — кайфово и с пользой проведете время 😁
Записывайтесь по ссылке в качестве зрителя или участника, чтобы мероприятие добавилось в календарь, а накануне пришли напоминания
✅ Участника объявим во вторник 8 ноября
Отличные новости для новичков, которые пробуют себя ML/DS!
Data Feeling примет участие в Tech Interview Fest от Solvery — первом марафоне онлайн собеседований на Junior позиции.(Писал про основателя в этом посте). Так вот, в фесте участвуют разные сообщества по 10 технологиям, а мы представляем ML
👉 Приглашаю одного из подписчиков моего канала стать участником и пройти собес онлайн на стриме 11 ноября в 19 00 по Москве 🤩
- Я вместе с ментором Solvery — Джамилем Закировым (ML Engineer в EyeQ Inc.) проведем моковое собеседование на позицию Junior ML
- 1 час собеседование, и 30 минут — обратная связь + ответы на вопросы зрителей
Моковое собеседование — это как настоящее, только для тренировки
На мероприятие можно зарегистрироваться
🍿В качестве зрителя стрима
🥷 В качестве собеседуемого
Cобеседуемый будет выбран случайно и объявлен за несколько дней до проведения стрима, чтобы можно было подготовиться
Условия для участия в моковом собеседовании на Junior позицию:
- Ты мой подписчик (канал @datafeeling)
- Ты либо готовишься к первой работе, либо уже Junior специалист и хочешь оценить свои навыки
- Наличие тихого места🤫, камеры 📹 и стабильного интернета 🌐
- По желанию можно будет выбрать вакансию, по требованиям к которым хочешь провести собеседование.
- Получишь боевой опыт прохождения собеседования
- Участие в стриме - кейс, который отлично смотрится в резюме и демонстрирует софт скилы и уверенность в себе
- Обратная связь от менторов и возможность задать любые вопросы
- Просто кайфово проведешь время 😉
- Посмотрите на пример реального собеседования
- Сможете задать вопросы ментору
- И да — кайфово и с пользой проведете время 😁
Записывайтесь по ссылке в качестве зрителя или участника, чтобы мероприятие добавилось в календарь, а накануне пришли напоминания
✅ Участника объявим во вторник 8 ноября
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍8👎3
И вот как с таким бороться?)
🤷♀️ Мое имя, такая же аватарка как у меня. Пишет знакомому. Просит перевод в крипте.
🥸 Потом никому ничего не докажешь. Полная мимикрия под меня, если бы не слово «нету»
😕 Будьте осторожны. Какой-то новый вид мошенничества
🤷♀️ Мое имя, такая же аватарка как у меня. Пишет знакомому. Просит перевод в крипте.
Please open Telegram to view this post
VIEW IN TELEGRAM
😱44👎3
🏆 Data Feeling | AI
Video message
Помните мою нетворкинг сессию?
🔥 В общем, она реально огненная получилась. И ребята были интересные с разнообразным опытом, и пиццу поели, и мини лекции на около IT-е темы послушали. Кто-то смог даже работу найти после. Все как хотелось! Возможно еще когда-нибудь такое устрою.
✅ А пока ловите первую запись выступления. Вы же не зря просили записывать?! На нем Настя (@semolina_channel) делится своими дополнительными нестандартными методами организации работы команды. Мне зашло =)
😜 Запись: Мемы как инструмент для эффективной работы команды
Темы выступлений были нестандартные. Было два главных критерия:
- Темы плохо гугляться
- Темы актуальны
P.S. - Если снова буду делать ивент, то в следующий раз Маша (@mashkka_ds) тоже выступит!
🔥 В общем, она реально огненная получилась. И ребята были интересные с разнообразным опытом, и пиццу поели, и мини лекции на около IT-е темы послушали. Кто-то смог даже работу найти после. Все как хотелось! Возможно еще когда-нибудь такое устрою.
✅ А пока ловите первую запись выступления. Вы же не зря просили записывать?! На нем Настя (@semolina_channel) делится своими дополнительными нестандартными методами организации работы команды. Мне зашло =)
Темы выступлений были нестандартные. Было два главных критерия:
- Темы плохо гугляться
- Темы актуальны
P.S. - Если снова буду делать ивент, то в следующий раз Маша (@mashkka_ds) тоже выступит!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥6👎2
Химерная аугментация данных
🧠 Вот все знают, что набор изображений можно бесплатно расширить, сделав простые преобразования картинки. Например, если зеркально отразить картинку с котиком, то получим того же котика, но для нейронных сетей это будет уже совсем новый котик.
🤨 Однако, часто при аугментациях мыслят в пределах одной картинки, но как вам идея мыслить в пределах одного класса? Ведь так можно же сделать химерного котика!
✅ Удивительно, но в некоторых задачах если правильно настроить обучение, то такая аугментация докидывает в точности. Тонкость только в том, чтоб при обучении модели скор для таких гибридов считался с меньшим весом, относительно картинок без смешивания.
✅✅ Дважды прикольно, что такое работает не только для картинок, но и для текстов и прочего. И плевать, что новых объектов не существует в реальности, важно сделать обобщенную модель, и это техника помогает этого добиться тоже.
P.S. - Надеюсь, вы славно отметили Хэллоуин!
🧠 Вот все знают, что набор изображений можно бесплатно расширить, сделав простые преобразования картинки. Например, если зеркально отразить картинку с котиком, то получим того же котика, но для нейронных сетей это будет уже совсем новый котик.
✅ Удивительно, но в некоторых задачах если правильно настроить обучение, то такая аугментация докидывает в точности. Тонкость только в том, чтоб при обучении модели скор для таких гибридов считался с меньшим весом, относительно картинок без смешивания.
✅✅ Дважды прикольно, что такое работает не только для картинок, но и для текстов и прочего. И плевать, что новых объектов не существует в реальности, важно сделать обобщенную модель, и это техника помогает этого добиться тоже.
P.S. - Надеюсь, вы славно отметили Хэллоуин!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍40🔥15🤔4👎1😱1
🏆 Data Feeling | AI
Помните мою нетворкинг сессию? 🔥 В общем, она реально огненная получилась. И ребята были интересные с разнообразным опытом, и пиццу поели, и мини лекции на около IT-е темы послушали. Кто-то смог даже работу найти после. Все как хотелось! Возможно еще когда…
Кстати, свое выступление на нетворк-сессии тоже удалось записать.
✅ Обсудил с аудиторий взаимно-общие проблемы - что не так с мессенджерами и браузерами. И конечно, как минимизировать информационный шум вокруг, выиграв при этом дополнительное время в сутках.
Ссылка на выступление
✅ Обсудил с аудиторий взаимно-общие проблемы - что не так с мессенджерами и браузерами. И конечно, как минимизировать информационный шум вокруг, выиграв при этом дополнительное время в сутках.
Ссылка на выступление
YouTube
Дополнительные 3 часа в сутках или как выключить информационный шум. Александр Миленькин
Лайфхаки организации рабочего пространства в мессенджерах и браузере и другие рекомендации по устранению информационного шума. Запись выступления нетворкинг сессии.
Телеграм канал Александра: https://news.1rj.ru/str/datafeeling
Телеграм канал Александра: https://news.1rj.ru/str/datafeeling
🔥11👍5👎5❤1😱1
Я парень простой, вижу в тг каналах постоянную рекламу - отписываюсь!
😁32👍15👎4😱2🔥1
🏆 Data Feeling | AI
Я парень простой, вижу в тг каналах постоянную рекламу - отписываюсь!
Кстати, про рекламу
😳 Тут недавно случай произошел. Несколько смышленых школьников нашли способ покупать Telegram Premium сильно дешевле официальной цены в РФ. И понятное дело, начали активно перепродавать со скидкой другим.
🧐 Почему я об этому пишу? Несколько дней назад купил ради теста у одних таких ребят премиум акк. Подумал, вау - реально хитрая лазейка для экономии. Мол, 150 рублей и у тебя премиум на год. Уже даже подумал запостить сюда рекламу этой "схемы". Однако, решил пару дней подождать и не нарушать свой принцип - не делать рекламу в личной блоге.
😎 Как итог, лавочку раскрыли, а купленные таким образом подписки аннулировали. Однако, схема мне понравилась, но видимо - халявы не будет...
Please open Telegram to view this post
VIEW IN TELEGRAM
😁16👍3👎3
Чем больше участвую в соревнованиях, тем больше убеждаюсь, что классические приемы, которым учат на курсах по Data Science часто не работают.
😉 В классических курсах, тебя учат обучать модель на таких данных, которые точно встретятся в тесте.
😆 В реальных боевых или соревновательных условиях - это часто не так. А если это нет так, то надо делать модель более обобщенной.
😱 Простейший пример - early stopping, с помощью которого находят оптимальное время обучения модели. Так вот, хорошей практикой, при участии в соревнованиях, является остановка обучения модели на более ранних стадиях. Так можно откалибровать локальную валидацию по отложенной выборке на лидер борде и не допустить переобучения под тренировочную выборку.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍60🔥6👎3🏆1
Девушки, занимающиеся Data Science, просто сверх сексуальны
🔥87👎55😁17🤔14❤8👍6🏆1
Please open Telegram to view this post
VIEW IN TELEGRAM
👎22😁6👍3
А уже сегодня — 11 ноября в 19:00 по мск пройдет стрим с моковым собеседованием на Junior ML позицию в рамках Tech Interview Fest✊
Сегодня анонсируем участника от сообщества
Им стал Никита Дильман 🎉🥂
Присоединяйтесь в качестве зрителя, поддержите Никиту, а также задайте свои вопросы мне и Джамилю в конце стрима. Можете накидать их сюда под постом даже =)
Регистрируйтесь в качестве зрителя по ссылке
Кайфового дня!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍9👎1🎉1