sup people, скоро небольшая обнова по каналу. Опять почистил, что поменялось за это время?
10th Evraz hack 🙊
31th Raif hack 🙈
Все так же развиваюсь в мл
В чем обнова?
1. Посчитал, что оставлять просто ссылки никому не интересно и это никак не развивает канал. Поэтому это будет что то типо личный блог. Я буду выкладывать конспекты с хакатонов, каких то собственных заметок. Некоторые решения вы можете получить только на хакатонах, поэтому будет польза.😱😱
2. Вторая обнова наиболее полезная, я хочу что бы в моем канале возможно появилось взаимодействие с kaggle👻, что бы мы собрали небольшое комьюнити👨👩👦 людей для продвижения друг-друга и развития.🧭 Возможно я слишком идеализирую. Но если вы будете качественно подготавливать ноутбуки, то мы можем быстрее учиться друг у друга.
В пятницу подготовлю первый пост, соберу максимум инфы с прошедших хаков, уверен вы многого не знали
10th Evraz hack 🙊
31th Raif hack 🙈
Все так же развиваюсь в мл
В чем обнова?
1. Посчитал, что оставлять просто ссылки никому не интересно и это никак не развивает канал. Поэтому это будет что то типо личный блог. Я буду выкладывать конспекты с хакатонов, каких то собственных заметок. Некоторые решения вы можете получить только на хакатонах, поэтому будет польза.😱😱
2. Вторая обнова наиболее полезная, я хочу что бы в моем канале возможно появилось взаимодействие с kaggle👻, что бы мы собрали небольшое комьюнити👨👩👦 людей для продвижения друг-друга и развития.🧭 Возможно я слишком идеализирую. Но если вы будете качественно подготавливать ноутбуки, то мы можем быстрее учиться друг у друга.
В пятницу подготовлю первый пост, соберу максимум инфы с прошедших хаков, уверен вы многого не знали
❤2
Как я собирался хакатоны выигрывать
Передаю свой личный опыт в том где я ошибался и какие инструменты использовал.Ссылка на пост
Пост содержит различные методы и инструменты включая несколько методов о которых вы скорее всего не знали.
Я пытался описать каждый метод и суть его использования, разобрал применение несколько методов, которые на начальном этапе не понятны многим. Так же приложил много ссылок, которые посчитал очень полезными для понимания и выхода на новый уровень.
Архитектура ML-Проекта
Иногда буду постить подготовительную инфу к постам D:#info
Одно дело, делать посты с информацией, другое показывать на практике
Следующий пост разбор ML решения соревнования на kaggle
Tabular Playground Series - Nov 2021 [Part 1]
EDA, нелинейные данные, большая размерность и baseline модель. В ноутбуке я постарался приложить полезные ссылки. Если вам понравилось или помогло мое решение, то поставьте лайк на kaggle.Читать подробнее
Гайд по анализу данных
Если вы не знаете как анализировать, какие графики использовать или просто хотите изучить какие то новые продвинутые методы, то этот пост то что вам нужно. Если вы не найдете ответы в посте, то точно у вас не останется вопросов при изучении приложенных ссылок на материалы.Читать тут
Стандарты в Data Science
CRISP-DM
CRISP-DM
Это, наверное, самая известная методология, которая имеет расшифровку [Cross-Industry Standard Process for Data Mining]KDD
Идея состоит в том, что бы разделить разработку на определенные разделы подзадач. Как говорят аналитики из 'Яндекс' - Разделяй и властвуй.
Состоит методология из 6 частей
* Понимание проблемы ( Business Understanding )
* Понимание данных ( Data Understanding )
* Подготовка данных ( Data Preparation )
* Моделирование ( Modeling )
* Оценка ( Solution Evaluation )
* Развертывание ( Deployment )
Это безусловно не самая лучшая методология, но стоит внедрить ее в ваш pet-project, competition или любой другой проект, если вы еще не внедрили ее.
Knowledge Discovery in Databases - это вторая методология о которой я хотел бы рассказать, она не задает набор методов обработки или пригодные для анализа алгоритмы, он определяет последовательность действий, которую необходимо выполнить для того, чтобы из исходных данных получить знания. Данный подход универсальный и не зависит от предметной области, что является его несомненным достоинством.SEMMA
* Сбор данных ( Data Mining )
* Подготовка данных ( Data Preparation )
* Трансформация данных ( Data Transformation )
* Моделирование ( Modeling )
* Постобработка данных ( Post Data Preparation & Interpretation )
В отличие от другого широко используемого стандарта Data Mining, CRISP-DM, SEMMA фокусируется на задачах моделирования, не затрагивая бизнес-аспекты. Тем не менее, этот стандарт позиционируется как унифицированный межотраслевой подход к итеративному процессу интеллектуального анализа данных.
* Сбор данных ( Data Mining )
* Исследование ( Explore data analysis )
* Модификация ( Data Modification )
* Моделирование ( Modeling )
* Оценка ( Solution Evaluation )