Что-то совсем из базового, но сегодня на инвидуальной консультации студент спросил про средства визуализации, которые датасаентист использует.
Были разговоры про Power BI и Tableau, насколько они нужны. Сразу скажу, что эти инструменты нужны спецам с названием в должности "ЧТО-ТО_ТАМ аналитик", но гораздо реже спецу по DS.
Ну, а если и пригодится, то на рабочем месте уже узнаете.
Тем не менее, уметь грамотно визуализировать данные нужно. Даже если это не прямая ваша обязанность, то при исследовании и анализе данных это будет полезно, поэтому периодически, кроме моделей и способов обработки данных, буду кидать статьи по визуализации.
Начнём с визуализации категориальных величин.
Были разговоры про Power BI и Tableau, насколько они нужны. Сразу скажу, что эти инструменты нужны спецам с названием в должности "ЧТО-ТО_ТАМ аналитик", но гораздо реже спецу по DS.
Ну, а если и пригодится, то на рабочем месте уже узнаете.
Тем не менее, уметь грамотно визуализировать данные нужно. Даже если это не прямая ваша обязанность, то при исследовании и анализе данных это будет полезно, поэтому периодически, кроме моделей и способов обработки данных, буду кидать статьи по визуализации.
Начнём с визуализации категориальных величин.
Medium
8 easy plotting categorical variables with seaborn for Pandas Dataframe
8 methods to take a quick look at your data graphically
🔥6👍2
Ещё статейка, но на мою любимую тему - NLP.
Здесь достаточно любопытно сравниваются различные крупные модели для решения задачи сравнения текстов по схожести. Без учителя.
Мне это нравится, поэтому посмотрите.
Некоторые модели, например USE, можно использовать в качестве бейслайна для решения более сложных задач.
Как только разберусь со своими задачками, то организую встречу, где покажу, как USE мне помог занять призовое место на соревновании.
Здесь достаточно любопытно сравниваются различные крупные модели для решения задачи сравнения текстов по схожести. Без учителя.
Мне это нравится, поэтому посмотрите.
Некоторые модели, например USE, можно использовать в качестве бейслайна для решения более сложных задач.
Как только разберусь со своими задачками, то организую встречу, где покажу, как USE мне помог занять призовое место на соревновании.
Medium
Unsupervised creation of interpretable sentence representations
For sentence similarity/document search applications
🔥5
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Разложение временного ряда на компоненты
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
6 Декабря (Вторник) в 19:00 по МСК
Программа практикума:
🔹Алгоритм SSA
🔹Применение его на практике
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
6 Декабря (Вторник) в 19:00 по МСК
Программа практикума:
🔹Алгоритм SSA
🔹Применение его на практике
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
👍1
Кто у нас тут любит анализ финансовых данных?
Человек статью написал, где представленны открытые датасеты по финансам.
Может пригодиться.
Не благодарите! Или благодарите 😉
Человек статью написал, где представленны открытые датасеты по финансам.
Может пригодиться.
Не благодарите! Или благодарите 😉
Medium
Free Financial Data Sources
The following are some of the financial data sources I have come across. These sources are free and really helpful to explore financial…
🔥4
Думаю, тут уже все знают, как я люблю графы.
Если кто-то тоже испытывает интерес, если уж не такой, как у меня, но хотя бы небольшой, то гляньте сюда.
Там небольшая статья, как создать и проанализировать граф.
Скажу честно, я предпочитаю своими инструментами всё обрабатывать, но networkx реально крутая библиотека.
И граф построить можно, и расстояние рассчитать можно. В общем, чудо какое-то.
Рекомендую использовать параллельно с моим любимым курсом по дискретным структурам, чтобы с графами жить на одной волне.
Если кто-то тоже испытывает интерес, если уж не такой, как у меня, но хотя бы небольшой, то гляньте сюда.
Там небольшая статья, как создать и проанализировать граф.
Скажу честно, я предпочитаю своими инструментами всё обрабатывать, но networkx реально крутая библиотека.
И граф построить можно, и расстояние рассчитать можно. В общем, чудо какое-то.
Рекомендую использовать параллельно с моим любимым курсом по дискретным структурам, чтобы с графами жить на одной волне.
Medium
Graphs and Networks in Python
With Networkx
👍1
Вчера прошло моё выступление на конференции FIT-M.
Благодарю всех, кто пришёл на мероприятие 🙏🏼☀️
Благодарю всех, кто пришёл на мероприятие 🙏🏼☀️
👏11
Не только математикой и алгоритмами наша жизнь полна, а ещё и оформлением.
Думаю, все из нас так или иначе сталкивались с Markdown.
Так вот, тут есть интересная шпаргалка-мануал по тому, как что можно делать.
Успехов 🙌🏼
Думаю, все из нас так или иначе сталкивались с Markdown.
Так вот, тут есть интересная шпаргалка-мануал по тому, как что можно делать.
Успехов 🙌🏼
Gist
Руководство по оформлению Markdown файлов
Руководство по оформлению Markdown файлов. GitHub Gist: instantly share code, notes, and snippets.
👍6
Спешу к вам с темой, про которую я не говорил особо. Если только самую капельку.
Это геоаналитика!
Что это такое? Это когда главная роль в принятии решения - местоположение. Если очень коротко.
Конечно, там присутствуют многие косвенные признаки, но подробней вы сможете узнать о этом тут.
Это геоаналитика!
Что это такое? Это когда главная роль в принятии решения - местоположение. Если очень коротко.
Конечно, там присутствуют многие косвенные признаки, но подробней вы сможете узнать о этом тут.
Хабр
Геоаналитика с помощью Python и открытых данных: пошаговое руководство
Каждый бизнес желает знать, где сидит фазан целевая аудитория Всем привет! Геоаналитика преследует меня вот уже 3 года, скоро пойдет 4-й. Начиналось все в компании Тандер (Магнит), где я в роли одного...
🔥6👏1
Конкурс UPGReat ПРОЧтение.
Заняли 3е место.
Потрясающая задача, достойные решения мои и других участников.
Задача состояла в глубоком анализе текстов сочинений ЕГЭ по русскому, литературе, истории и обществознанию.
Нахождение причинно-следственных связей, логических и орфографических ошибок.
Было круто!
Заняли 3е место.
Потрясающая задача, достойные решения мои и других участников.
Задача состояла в глубоком анализе текстов сочинений ЕГЭ по русскому, литературе, истории и обществознанию.
Нахождение причинно-следственных связей, логических и орфографических ошибок.
Было круто!
🔥8👍1
Ещё одна интересная статья про алгоритмы на графах.
В ней узнаете про поиск пути (кратчайшего и не очень) от одной точки в другую.
Очень круто, например, чтобы строить ассоциативные ряды, если граф такого рода.
Путь синтаксический или пишите свою игру стратегию, и нужно путь юнитам формировать от А до Б.
В общем, полезно, друзья!
Основы информатики ;)
В ней узнаете про поиск пути (кратчайшего и не очень) от одной точки в другую.
Очень круто, например, чтобы строить ассоциативные ряды, если граф такого рода.
Путь синтаксический или пишите свою игру стратегию, и нужно путь юнитам формировать от А до Б.
В общем, полезно, друзья!
Основы информатики ;)
Хабр
Поиск в глубину, поиск в ширину, алгоритмы Дейкстры и А* — это один и тот же алгоритм
Антон Тмур Наставник курса " Алгоритмы и структуры данных " В алгоритмических задачах на графах мы часто используем четыре известных алгоритма. Два из них — это алгоритмы обхода графа: Поиск в ширину...
🔥4
Forwarded from Data Science by REBRAIN
Открытый практикум Data Analyst by Rebrain: Построение модели оценки оттока клиента
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
20 Декабря (Вторник) в 19:00 по МСК
Программа практикума:
🔹Узнаем почему важно компаниям строить такие модели
🔹Рассмотрим процесс подготовки данных
🔹Обучим модель машинного обучения для прогноза
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.
Успевайте зарегистрироваться. Количество мест строго ограничено!
👉Регистрация
Время проведения:
20 Декабря (Вторник) в 19:00 по МСК
Программа практикума:
🔹Узнаем почему важно компаниям строить такие модели
🔹Рассмотрим процесс подготовки данных
🔹Обучим модель машинного обучения для прогноза
Кто ведет?
Артур Сапрыкин - Data Scientist, AI исследователь, предприниматель, автор курсов по машинному обучению, преподаватель.