🏄 Соревновательный Data Science | Kaggle | Чемпионаты – Telegram
🏄 Соревновательный Data Science | Kaggle | Чемпионаты
3.2K subscribers
301 photos
55 videos
2 files
301 links
Соревновательный Data Science - сообщество тех, кто побеждает или только учится побеждать в ML чемпионатах👨‍💻

Наш курс на Stepik:
https://stepik.org/a/108888

Чат:
https://news.1rj.ru/str/+UeIeCRykqYEwY2Y6

Для предложений и вопросов: @Aleron_1
Download Telegram
Forwarded from Aparin (Георгий Апарин)
написал статью о том как мы с Артёмом экзопланеты искали

время чтения - 6 минут 30 секунд

upd: постить в вк было ошибкой, у кого-то не грузятся фотографии. с ноута или с браузерной версии проблем быть не должно
❤‍🔥96
Forwarded from ML Baldini • Nikita Boyandin (Nikita Boyandin)
#kaggle #road1k

1. Описание и ограничения😈
Вышла очень крутое по мысли соревнование на kaggle, посвященное шахматам. Главной целью организаторы ставят сместить фокус с вычислений методом грубой силы на элегантный и эффективный дизайн. То есть, они дают минимум ресурсов💀(буквально 5 MB памяти и 64 КБ сжатой памяти), при этом сохраняя правила, которые привычны нам на chess.com, такие как 3 повтора хода - ничья, 50 ходов без взятия - ничья, также дебюты выбираются из случайного набора, а матч идет 10с.

2. Оценка💪
Всего есть 5 сабмитов каждый день, на приватный лидерборд идет 2 сабмита, которые вы выберете. Каждая заявка будет играть эпизоды (игры) против других ботов в таблице лидеров, имеющих схожий рейтинг навыков🍿. Со временем рейтинги навыков будут расти с победами, падать с поражениями или выравниваться при ничьих🐒.

Каждая заявка имеет предполагаемый рейтинг мастерства, который моделируется гауссовой функцией N(μ,σ2)😠, где μ — предполагаемый навык, а σ — неопределенность этой оценки, которая со временем будет уменьшаться.

Начальный рейтинг для каждого бота будет 600😓, и каждый раз будет запускаться новый эпизод.

3. Система рейтинга🤓
После завершения эпизода мы обновим оценку рейтинга для всех ботов в эпизоде. Если одна пара ботов победила, увеличим их μ и уменьшим μ противника — если результат был ничьей, то сдвигается значения μ ближе к их среднему значению. Обновления будут иметь величину относительно отклонения от ожидаемого результата на основе предыдущих значений μ, а также относительно неопределенности каждого бота σ. Также уменьшается члены σ относительно количества информации, полученной в результате. Счет, с которым ваш бот выигрывает или проигрывает эпизод, не влияет на обновления рейтинга навыков.


4. Итоги😢
Сделана отличная система на leaderboard, где ты можешь посмотреть игры других агентов. Неплохой призовой фонд в 50 тысяч вечно зеленых🤑))) Поэтому для всех любителей шахмат эта сорева станет отдушиной, а также потыкать reinforcement learning тоже достаточно интересно😈.

Лучшие ноутбуки⬅️:
https://www.kaggle.com/code/wguesdon/littledeepblue
https://www.kaggle.com/code/jocelyndumlao/ruy-l-pez-gaussian-chess-mastery

Ну что ж, самое время немного поиграть в RL💗?)
Please open Telegram to view this post
VIEW IN TELEGRAM
24
Дайджест соревнований до конца года (при необходимости будет пополняться):

[ХАК] ФИЦ
Даты: 29.11 - 4.12 (рег. до 26.11)
🔜 [NLP] Кейс 2 - БухПульс - Разработать алгоритм сбора обратной связи от пользователей сервисе «Бухэксперт8».
🔜 [CV] Кейс 3 - Классификации опор ЛЭП по фото.
🔜 [NLP] Кейс 4 - Погонщик нейронок - Как можно быстрее сделать react приложение по макету из Figma, используя любые ИИ помощники.
🔜 [NLP] Кейс 5 - Оценка уровня экспертности по резюме.
🔜 [NLP] Кейс 6 - Контекстный перевод названий научных работ.
🔜 [TS] Кейс 7 - Прогнозирование бизнес драйверов (трафик людей, количество чеков, количество проданных товаров и т.д).
🔜 [CV] Кейс 8 - Формирование фото и видео контента с использованием нейросетей на основе биографии и фото персоны.
🔜 [CV] Кейс 9 - Разработка алгоритма трекинга людей в видеопотоке с нескольких камер.
🔜 [NLP] Кейс 11 - Симуляция записи в расписание.
🔜 [CV] Кейс 12 - Сервис для ведения реестра зеленых насаждений города Москвы: подсчета их количества, определения породы и пр. по фото.
🔜 [CV] Кейс 14 - Определение доступа на объект с использованием модели распознавания лиц.
🔜 [NLP] Кейс 15 - Семантический делитель текстов.
🔜 [CLF] Кейс 17 - Стартовый (профилактический) комплаенс: предотвращение рисков с помощью AI.
🔜 [NLP] Кейс 20 - Цифровой помощник юриста.
💰 Приз: 6 000 000 р.
🏀 Участие: команда 2-6 человек
🌐 Формат: отборочный этап - онлайн, финал - офлайн (Москва)

[ХАК] Норникель: интеллектуальные горизонты
Даты: 6.12 - 8.12 (рег. до 2.12)
🔜 [TS] Трек 1 - Флотомашина времени. Поиск наиболее эффективных диапазонов работы оборудования для повышения извлечения руды.
🔜 [CV] Трек 2 - Грязные дела. Разработать метод определения степени загрязнения кадра, чтобы обеспечить надежную работу камер на производстве.
🔜 [NLP] Трек 3 - Мультимодальные RAG модели. Разработка RAG системы для поиска информации в текстовых документах и картинках.
💰 Приз: 1 500 000 р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн

[ХАК] Совкомбанк SecureHack
Даты: 6.12 - 15.12 (рег. до 4.12)
🔜 [NLP] Задача - необходимо создать продукт, который позволит разработчикам, аналитикам информационной безопасности и проектным менеджерам оценивать безопасность своих проектов, сервисов, задач на основе входных данных и предоставлять заключения с практическими рекомендациями по улучшению.
💰 Приз: 300 000 р.
🏀 Участие: команда 1-3 человек
🌐 Формат: онлайн

[ХАК] ТерраЛинк Code Fest
Даты: 9.12 - 15.12 (рег. до 6.12)
🔜 [NLP] Задача 1. Цифровой ассистент пользователя для исполнения функциональных команд.
🔜 [NLP] Задача 2. Нейросеть для проверки соответствия документации стандартам компании с выявлением рисков и отклонений.
🔜 [NLP] Задача 3. Нейросеть по распознавание текста (OCR), классификация документов, автоматическое извлечение данных, проверка орфографии, пунктуации, соответствии СТО компании.
💰 Приз: 600 000 р.
🏀 Участие: команда 2-5 человек
🌐 Формат: онлайн
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62
👨‍💻 Привет, чемпионы! СТРИМУ БЫТЬ!

В четверг в 17:00 будем говорить про то самое соревнование CryoET Object Detection и как собрать неплохой стартер для врыва в его leaderboard.

😈 Рассказывает: Артём @cosheimil

Соревнование на 3d детекцию по облаку точек. Имея тип белка - вам надо выделить его координаты (x, y, z) 🫨
Метрика соревнования: FBeta

Приходите в четверг получать мотивацию фармить медальки и постигать новые горизонты - всех ждем!😎

Отлично поговорили. Вопросы можете задавать под этим постом. Мы призовём Артёма к ответу! :)
Please open Telegram to view this post
VIEW IN TELEGRAM
1511❤‍🔥1
Media is too big
VIEW IN TELEGRAM
Запись стрима про соревнование CryoET Object Detection "как собрать неплохой стартер для врыва в его leaderboard"

😈 от Артём @cosheimil 🥉
Please open Telegram to view this post
VIEW IN TELEGRAM
👍65❤‍🔥3
🧑‍💻 Хакатон от «Норникеля» — «Интеллектуальные горизонты».

💸 Призовой фонд — 1,5 млн рублей

🎳 Какая задача?
Реальные кейсы: автоматизация, анализ данных, экология — можно поработать над чем-то, что реально влияет на индустрию.

🤗 Для кого?
Если ты разработчик, аналитик или просто любишь находить нестандартные решения, то это шанс применить свои знания и сделать что-то крутое. Команда не обязательна — помогут собрать.

Когда?
Пройдет 6-8 декабря, формат онлайн. Регистрируйся до 2 декабря!
Привет, Чемпионы! 🏆

Осталось 3 дня до окончания HUGE SALE на Stepik!

Все наши курсы тоже участвуют в акции:

🏅Легендарный соревновательный DS

🧠 Курс по LLM - номинант на Stepik Awards 2024

🧑‍💻 Программирование с помощью нейросеток
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉3❤‍🔥1😁1
😏 Мы знаем, что ты уже давно хочешь прокачаться в Generative AI. Теперь ты можешь это сделать всего за 5 дней.

Привет, чемпионы! Google и Kaggle подготовили для вас интенсивный курсец, который в ноябре проходил в режиме live-сессий, а теперь доступен в виде записей и материалов, идеально структурированных для самостоятельного обучения в комфортном темпе.

🏄 Каждый день — новый шаг к мастерству. Самое важное:

День 1: Основы LLM и искусство промпт-инжиниринга: узнайте, как эволюционировали большие языковые модели и научитесь эффективно взаимодействовать с ними.

День 2: Эмбеддинги и векторные базы данных: погрузитесь в методы создания эмбеддингов и их применение в реальных задачах.

День 3: Генеративные AI-агенты: освойте создание сложных AI-агентов и их интеграцию в существующие системы.

День 4: Специализированные LLM для различных доменов: изучите, как создавать и применять модели для специфических областей, таких как медицина или безопасность.

День 5: MLOps для Generative AI: научитесь адаптировать практики MLOps для генеративного AI и использовать инструменты Vertex AI.

😎Что вас ждет? Курс включает теоретические материалы, ценную практику и записи живых сессий с экспертами Google. Теперь вы можете пройти курс в своём темпе и углубить знания в области GenAI.

Подробнее: 5-Day Gen AI Intensive Course with Google Learn Guide

🧑‍💻 Сразу после программирование с помощью генеративных нейросеток
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥75👍1💯1
This media is not supported in your browser
VIEW IN TELEGRAM
😁128
👾 Стать чемпионом по мемам? 🤨

Это конкурс на лучший мем до полуночи!

Привет, чемпионы! Настало время проявить ваш креатив в полной мере. Если вы вкачивали свою мемную мышцу в этом году наравне с прогрессом по нашим курсам, врывайтесь в конкурс мемов и боритесь за доступ к нашим топовым курсам! 😎

🔮 Что нужно сделать?

👍 Stepik устраивает конкурс мемов.

🤓 Предлагайте свои мемы про наши курсы по AI-программированию, LLM-продуктам, или соревновательный DS.
🤓 Мемы могут быть связанные со Степиком, о ваших впечатлениях от AI, ваших экспериментов или забавных моментах из курсов!
🤓 Запостите мем в комментариях к этому посту с хэштегом #StepikMemes2024.

💡 Призы:
1. Выбор редакции: доступ к одному из наших курсов на выбор.
2. Главный приз: если ваш мем выиграет конкурс степика, то вы получите полный пакет из всех трёх курсов.

🔥 Сроки:
Приём мемов сегодня (11 декабря, до 13:00!)
Итоги объявим в районе 12 декабря, когда степик объявит итоги.

🎯 Ресурсы для вдохновения:
Не стесняйтесь использовать наш контент, мемы, логотипы или идеи с курсов!

Покажите, на что способны! 🤖

upd: продлили до 11 декабря 13 часов дня.
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍4
🚫 Почему ты никогда не выиграешь в соревнованиях на Kaggle?

Понаблюдали с командой за игроками в индустрии и выделили несколько причин, почему большинство специалистов по анализу данных не имеют каких-либо успехов в соревновательном data science.

Самая злодейская причина:
ты - «любитель рассказывать истории». Очень популярный тип людей, который всегда найдет причину слиться перед непростой задачей, предварительно придумав историю…

Истории про то, почему он/она не может участвовать или что-то не выигрывает. Обычно это истории рода - «Нет времени», «Сложно выиграть», «Плохой датасет или странная задача», «Результат зависит от случайности» или «Нет мотивации».

Если разобраться, то на самом деле под любой такой «историей» скрывается обычный наивный страх. Страх, что все увидят, что по итогу соревнования ты оказался ниже остальных. А раз так, то зачем это вообще тебе нужно? Проще перенести ответственность с себя на недостаток времени, загруз по работе, семью или просто волю случая.

Самое страшное, что такое поведение переносится на все остальные сферы жизни. Человек проживает свою единственную жизнь, так и не начав действовать.
НЕ начал идти к своим желаниям, НЕ нашел хобби, которое приносит доход, НЕ завел отношения или семью, НЕ начать путешествовать.

Придумать историю «почему я не могу ..» в разы проще истории «я это сделаю, потому что ...». А ведь жизнь у нас одна!

И даже нам самим намного интереснее слушать, как у кого-то получилось. Есть миллион неинтересных историй, почему студента отчислили, но интересна та одна, как студент смог удержаться, обучаясь там, где непросто.

Что делать? Ловить себя «за руку», когда твой внутренний «сказочник» начинает рассказывать историю, почему ты сегодня опять не можешь.

Ты можешь все! И получится у тебя все! И даже если не в этот раз, так в следующий, но действовать надо уже сейчас! Начать с малого и сделать первый шаг. Проснись!

И через время люди будут смотреть на тебя как на безумца, который каким-то чудесным образом смог. 🤯

А ты просто перестал рассказывать самому себе «истории». И уже ты спросишь окружение: «А почему вы не попробовали?» И люди вокруг начнут рассказывать тебе свои истории: «почему они не..».

Какой твой следующий шаг чтобы начать выигрывать?
Please open Telegram to view this post
VIEW IN TELEGRAM
27💯10😁3❤‍🔥1👍1
🏄 Соревновательный Data Science | Kaggle | Чемпионаты
🚫 Почему ты никогда не выиграешь в соревнованиях на Kaggle? Понаблюдали с командой за игроками в индустрии и выделили несколько причин, почему большинство специалистов по анализу данных не имеют каких-либо успехов в соревновательном data science. Самая…
Что делать, если долго не получается выиграть на Kaggle? Вот вам история о поиске успеха

👍 Представь, ты — участник соревнований на Kaggle. Ты уже несколько раз пытался вырваться в топ лидерборда, но каждый раз не хватает совсем чуть-чуть до золотой медали. Сидишь за компом, смотришь на свои результаты и думаешь: «Почему я не могу прокачать свой скилл до нужного уровня?»

Глава 1: Путь к пониманию
В один из вечеров, когда ты снова застрял в своих проектах, решил, что пора разобраться, что же не так. Открыл свои старые работы и увидел, что в каждом из них были свои косяки. В одном проекте ты забил на предобработку данных, в другом — не заморочился с кросс-валидацией. Это было как озарение: «А что, если я смогу выжать из своих неудач что-то полезное?»

Глава 2: В поисках знаний
Ты понял, что пора прокачать свои знания. Начал гуглить, смотреть видосы и изучать успешные решения других участников. Каждый раз, когда находил что-то новое, чувствовал, как твоя уверенность растет. Ты начал применять эти фишки в своих проектах, и это стало твоим новым источником вдохновения.

Глава 3: Сила сообщества
Однажды наткнулся на этот канал или наш курс, или на обсуждения про Kaggle в интернете, где участники делились своими историями успеха и фейлами. Ты решил задать вопрос: «Парни, что вы делали, когда не могли долго выиграть или прокачать навык?» Ответы были разные, но все сводились к одному: «Не бойся просить о помощи и учиться новому у других». Это стало для тебя сигналом — ты начал активно участвовать в обсуждениях и искать напарников для совместной работы.

Глава 4: Пробуя новое
С новыми знаниями и поддержкой комьюнити ты решил попробовать другой подход. Начал работать над более простыми задачами, чтобы прокачать свои навыки. Каждый раз, когда завершал проект, чувствовал, что становишься лучше. Ты начал эффективно оптимизировать гипер-параметры градиентных бустингов, экспериментировать с фиче-инжинирингом и применять методы ансамблирования.

Глава 5: Успех и неудачи
Твоя настойчивость начала приносить плоды. Ты начал занимать более высокие позиции в соревнованиях, и вскоре оказался на пороге своей первой золотой медали. Но даже если не добился желаемого результата, ты понял, что каждая неудача — это возможность для роста. Ты научился ценить процесс и кайфовать от каждого шага на этом пути.

Заключение: Путь продолжается
Теперь, когда смотришь на свои достижения, понимаешь, что успех — это не только медали и награды. Это опыт, знания и связи, которые ты приобрел на этом пути. Ты продолжаешь участвовать в соревнованиях, учиться и развиваться, и знаешь, что каждый новый проект — это еще одна возможность стать круче.

👾 Так что, если ты чувствуешь, что не хватает до золотой медали, помни: твой путь — это не только о победах, но и о том, как ты растешь и развиваешься как специалист. Каждый шаг, который ты делаешь, приближает тебя к твоей цели.

Давай, не останавливайся! А мы тебе в этом поможем!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍86😁1
🫡 Вы попросили, мы сделали

2️⃣ Последняя и самая сочная возможность за год.

3️⃣ Если вы ждали момента начать разносить чемпионаты по машинному обучению максимально эффективно, то вот вам наша поддержка.

4️⃣ Промокод HAPPYNEWYEAR на 40%, который каждый день будет терять силу на 10%.

🤖 Больше не держите в голове просто идею. Зачем-то же вы сюда пришли?! Участвуйте! Прекратите откладывать и залетайте прям сейчас! К тому же скоро мы запустим новые командные активности для участников 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥91
Media is too big
VIEW IN TELEGRAM
👍 Разбор решений с AvitoTech ML Cup 2024

Делимся разбором решений со свежего чемпионата по Data Science от AvitoTech по рекомендации наиболее релевантных рекламных объявлении.

Задача соревнования
Разработать модель, которая сможет рекомендовать пользователю наиболее релевантную рекламу на основе реальных данных после анонимизации. Модель должна предсказывать вероятность того, что пользователь кликнет на рекламное объявление, исходя из его характеристик и предпочтений.

Призовой фонт 600к. Смотрите разбор, чтоб понять, как можно было залутать призовых перед новогодними праздниками.

🤗 Все, кто знал про cuDF из курса оказались в числе лидеров.
Please open Telegram to view this post
VIEW IN TELEGRAM
1😁6👍41🦄1
🥳 Чемпионы, поздравляем вас всей командой наступающим новым годом!

🐍 Желаем вам еще больше драйва от Data Science чемпионатов в 25-м году и чтобы вас подкидывало на привате только наверх!

Новогодняя магия иногда случается поэтому вот вам последний жирный промик на все наши курсы в этом году OLIVYE Действуем несколько часов.

🦜 Легендарный курс по соревновательному Data Science.

🧑‍💻 Программирование с помощью нейросеток

🦜 Создание проектов на основе AI технологий на LLM курсе
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉541👍1