В ожидании результатов небольшой ликбез по соревновательному датасайнс, т.к. новички и гуманитарии, скорее всего, не поняли мой сленг.
На соревнованиях организаторы предоставляют тренировочные данные (на которых участники обучают модели) и публичные тестовые данные (на которых участники тестируют свои модели).
На основании метрик, полученных на публичных тестовых данных формируется лидерборд (ЛБ), который также называется публичным или public (паблик).
В конце соревнования организаторы предоставляют приватный тестовый набор данных и дают небольшое количество времени для того, чтобы участники оценили свои модели на этих данных и отправили результаты. На этих результатах строится приватный лидерборд (private или просто приват).
Итоговый результат формируется из результата команды на приватном лидерборде, иногда еще вклад вносит финальный питч, но это уже зависит от соревнования.
Надеюсь, стало чуть понятнее 😌
#ИсторияАдмина
На соревнованиях организаторы предоставляют тренировочные данные (на которых участники обучают модели) и публичные тестовые данные (на которых участники тестируют свои модели).
На основании метрик, полученных на публичных тестовых данных формируется лидерборд (ЛБ), который также называется публичным или public (паблик).
В конце соревнования организаторы предоставляют приватный тестовый набор данных и дают небольшое количество времени для того, чтобы участники оценили свои модели на этих данных и отправили результаты. На этих результатах строится приватный лидерборд (private или просто приват).
Итоговый результат формируется из результата команды на приватном лидерборде, иногда еще вклад вносит финальный питч, но это уже зависит от соревнования.
Надеюсь, стало чуть понятнее 😌
#ИсторияАдмина
❤6
RuCode 2 место, задача нормализации адресов 🍒
Было бы очень радостно, если бы в последние 2 часа не упустили первое место в задаче нормализации адресов и третье место в табличной задаче.
Ну да ладно, ждем защиту 14 октября в физтехе
Было бы очень радостно, если бы в последние 2 часа не упустили первое место в задаче нормализации адресов и третье место в табличной задаче.
Ну да ладно, ждем защиту 14 октября в физтехе
🔥9👍1🤔1
Итак, главные новости сегодняшнего дня:
1. За пару минут до конца привата, мы заслали решение, которое вырвало первое место
2. Отрыв от второго места 0.00005, жесть
3. Финал оказался в Екатеринбурге, а не в Долгопрудном :(((
4. По первой задаче поднимаемся с 5 на 4 место, т.к. 4 место дисквалифицировали
5. Сегодня иду на Оппенгеймера 😎😎😎
1. За пару минут до конца привата, мы заслали решение, которое вырвало первое место
2. Отрыв от второго места 0.00005, жесть
3. Финал оказался в Екатеринбурге, а не в Долгопрудном :(((
4. По первой задаче поднимаемся с 5 на 4 место, т.к. 4 место дисквалифицировали
5. Сегодня иду на Оппенгеймера 😎😎😎
👍7🔥2
Дорогие подписчики, от своих слов я не отказываюсь. Как только канал пробивает 100 подписчиков, я провожу голосование за возвращение 💩 в реакции :)
Ждемс
Ждемс
😢5🔥2👍1🤩1
#ИсторияАдмина
А что, собственно говоря, происходит у админа в ВУЗе? Из интересного сейчас реализую бота в ВК, который детектирует объекты на фото.
На самом деле, достаточно интересный предмет. Ну скажите, когда б я еще
- Пилил бота
- Пихал в него логгирование
- Писал к нему тесты
- Рисовал граф бота и строил граф пользовательских запросов
- Деплоил все это
И тд и тп, так что неплохо
В целом, в этом и вижу пользу уника - расширение кругозора. Пускай ВУЗ не даст мне хороших МЛ-скилов, зато даст вычмаш, сисадмин- и бэкенд- навыки, ну и матеша, куда без неё 😎
А что, собственно говоря, происходит у админа в ВУЗе? Из интересного сейчас реализую бота в ВК, который детектирует объекты на фото.
На самом деле, достаточно интересный предмет. Ну скажите, когда б я еще
- Пилил бота
- Пихал в него логгирование
- Писал к нему тесты
- Рисовал граф бота и строил граф пользовательских запросов
- Деплоил все это
И тд и тп, так что неплохо
В целом, в этом и вижу пользу уника - расширение кругозора. Пускай ВУЗ не даст мне хороших МЛ-скилов, зато даст вычмаш, сисадмин- и бэкенд- навыки, ну и матеша, куда без неё 😎
👍9😁1
Предлагаю в такую мерзкую погоду немного отвлечься)
Желательно в рамках приличия, т.к. хочу транслировать в комменты
t.me/questianonbot?start=1397630247
Желательно в рамках приличия, т.к. хочу транслировать в комменты
t.me/questianonbot?start=1397630247
Telegram
Анонимные вопросы
Напиши мне анонимный вопрос!
👍2😱1
🏆 Барабанная дробь... Объявляем финалистов трека «Искусственный интеллект» в этом сезоне
Задача «Нормализация адреса»
🏅 Лига начинающих
1 - Команда «Ильдар Бикмаматов»
2 - Pop().Usk
3 - ML reference
🏅 Лига продвинутых
1 - mr MISISter
2 - Polevoi_AI_MISIS
3 - BigBallЗабираем топ1 RuCode 7.0 (Mr MISISter), официально 😎😎😎
🔥18👍1🎉1
#ИсторияАдмина
Почему машин лернинг это не просто
и почему надо анализировать данные, особенно, в соревновательном DataScience?
Да, зачастую, если фичи (данные) не представляют собой какие-то физические величины или временные ряды, они могут не иметь никакой зависимости между собой и быть распределены черти как.
Но взглянуть хотя бы на pairplot (график зависимости одной фичи от другой попарно для всех фичей) однозначно стоит, особенно, если признаков не пипец много.
И вот здесь, шикарный пример - первая задача рукода. Описана она очень высокоуровнево, но, по замыслу, там зашита интересная физико-геометрическая задачка. На графиках построены попарные зависимости некоторых фичей и, о да, они (см. графики где красные точки) образуют какую-то функцию, которую градиентный бустинг, при всей моей любви к нему, нормально не поймает.
Что можно сделать? Ну, как минимум, сгенерировать новую фичу, которая бы объединяла в себе эти две фичи. Например, перейти в полярные координаты и получить две новые фичи: аргумент полярной координаты (угол наклона вектора, проведенного от точки (0, 0) до заданной точки, к оси икс) и длина вектора.
В результате, сразу увеличиваем метрику на лидерборде почти на 5%.
Анализируйте данные 💅
Почему машин лернинг это не просто
from catboost import CatBoostRegressor
model = CatBoostRegressor()
model.fit().predict()и почему надо анализировать данные, особенно, в соревновательном DataScience?
Да, зачастую, если фичи (данные) не представляют собой какие-то физические величины или временные ряды, они могут не иметь никакой зависимости между собой и быть распределены черти как.
Но взглянуть хотя бы на pairplot (график зависимости одной фичи от другой попарно для всех фичей) однозначно стоит, особенно, если признаков не пипец много.
И вот здесь, шикарный пример - первая задача рукода. Описана она очень высокоуровнево, но, по замыслу, там зашита интересная физико-геометрическая задачка. На графиках построены попарные зависимости некоторых фичей и, о да, они (см. графики где красные точки) образуют какую-то функцию, которую градиентный бустинг, при всей моей любви к нему, нормально не поймает.
Что можно сделать? Ну, как минимум, сгенерировать новую фичу, которая бы объединяла в себе эти две фичи. Например, перейти в полярные координаты и получить две новые фичи: аргумент полярной координаты (угол наклона вектора, проведенного от точки (0, 0) до заданной точки, к оси икс) и длина вектора.
В результате, сразу увеличиваем метрику на лидерборде почти на 5%.
Анализируйте данные 💅
❤6🤯5👎1🔥1
Побеждаем в Фонде Смелых Идей Mars. В рамках конкурса разработали лучшее диджитал решение для экосистемы
🥳🥳🥳
🥳🥳🥳
❤16👍1🎉1
Друзья, за последнее время нас стало значительно больше, поэтому я решил провести небольшую перекличку.
Большая просьба голосовать по максимуму, т.к. от этого будет зависеть контент 💆♂️
Большая просьба голосовать по максимуму, т.к. от этого будет зависеть контент 💆♂️
Final Results
60%
Я ML/DS/AI
32%
Я прогаю, но не МЛ
8%
Я гумманитарий
Дорогие подписчики. Завтра защита Рукода. Сижу пишу четвертую историю админа :)
Вобщем, к чему это я. Нас 99 человек... До рубежа остался 1 боец. Сможем до завтра? 🥺
Вобщем, к чему это я. Нас 99 человек... До рубежа остался 1 боец. Сможем до завтра? 🥺
👍8
💩5
#ИсторияАдмина
Любишь МЛ, люби и алгосы вывозить. Грустно, конечно, но это факт.
И нет, я сейчас не про собесы. Да, на них часто спрашивают за алгосы, но этот пост про другое.
Построить оптимальный маршрут автомобиля/автобуса/танкера/поезда - да чего угодно. Кто-то побежит обучать графовую нейронку или кетбуст, а кто-то вспомнит про алгоритмы кратчайших путей в графе (дейкстра).
Нормализовать входящий адрес (город Москва улиц. Одуванчиковая 6 -> г. Москва, ул. Одуванчиковая д. 6). Кто-то пойдет обучать ЛЛМ, а кто-то вспомнит про Бор или Корасика и бахнет автомат.
Часто бывает так, что решают алгосы, а не МЛ, поэтому важно смотреть на задачу с разных сторон.
Так было залутано первое место на Рукоде 😎
Наше решение можно посмотреть тут 👇
https://github.com/Kasuich/rucode-final-solution-c/tree/main
Любишь МЛ, люби и алгосы вывозить. Грустно, конечно, но это факт.
И нет, я сейчас не про собесы. Да, на них часто спрашивают за алгосы, но этот пост про другое.
Построить оптимальный маршрут автомобиля/автобуса/танкера/поезда - да чего угодно. Кто-то побежит обучать графовую нейронку или кетбуст, а кто-то вспомнит про алгоритмы кратчайших путей в графе (дейкстра).
Нормализовать входящий адрес (город Москва улиц. Одуванчиковая 6 -> г. Москва, ул. Одуванчиковая д. 6). Кто-то пойдет обучать ЛЛМ, а кто-то вспомнит про Бор или Корасика и бахнет автомат.
Часто бывает так, что решают алгосы, а не МЛ, поэтому важно смотреть на задачу с разных сторон.
Так было залутано первое место на Рукоде 😎
Наше решение можно посмотреть тут 👇
https://github.com/Kasuich/rucode-final-solution-c/tree/main
GitHub
GitHub - Kasuich/rucode-final-solution-c
Contribute to Kasuich/rucode-final-solution-c development by creating an account on GitHub.
🔥9❤1👍1👎1