Я у мамы аналитик – Telegram
Я у мамы аналитик
2.81K subscribers
77 photos
2 files
244 links
Как могу анализирую материалы на тему работы с данными:
- инфраструктура и инструменты;
- роли и компетенции аналитиков;
- продуктовый подход к аналитике;
- роль аналитики в создании и развитии продуктов.

Обратная связь @s_valuev, рекламу не размещаю
Download Telegram
Парни из Белоруссии с помощью машинного обучения научились по снимкам со спутников определять на карте с/х поля и угадывать, что на них посажено.

По-моему, очень крутой пример того, как применять современные методы анализа к данным из открытых источников и создавать на этом бизнес (у них эта технология является частью продукта для фермеров).

Жаль, данных по России нет, чтобы вживую проверить, как работает.

Ссылка:
https://map.onesoil.ai/2018
Если освободилось много времени из-за удалёнки (у меня, например, нет) то можно еще посмотреть цикл лекций "Анализ данных на Python в примерах и задачах". Слышал несколько хороших отзывов про него, ну и преподаватель (по моему мнению) неплохо рассказывает (я медленно, но все-таки их смотрю).

Ссылки на ютуб:
- первая;
- вторая.
Мощная (как по содержанию, так и по размеру) статья про рекомендательные системы для ритейла, освещает:
- терминологию;
- алгоритмы;
- основные метрики;
- специфику, собственно, ритейла.

Ссылка:
https://habr.com/ru/post/494468/
Небольшой и ёмкий обзор Data Science как профессии и Data Scientist как профессионала. Внутри много ссылок на основные понятия, концепты, полезные материалы.

Ссылка:
https://www.kdnuggets.com/2019/10/good-data-scientist-beginner-guide.html
А во второй части статьи можно почитать про основные этапы проектов по аналитике данных.

Выцепил для себя 2 инструмента анализа данных, с которыми можно познакомиться поближе: Orange и Knime. Еще один, Rapid Miner, судя по всему, перестали распространять по Free модели.

Ссылка:
https://www.kdnuggets.com/2020/04/guide-data-science-build-data-project.html
Небольшое погружение в концепцию управления данными DataGovernance на примере кейса Ростелекома. Автор рассказывает про основные цели, результаты внедрения и инструменты (что интересно, используют Python и Django, а не коробочное решение, объяснение тоже присуствует).

Ссылка:
https://habr.com/ru/company/rostelecom/blog/495934/
Если есть желание потрогать Tableau собственными руками и вы еще этого не делали - самое время.
Ребятки открывают на 90 дней бесплатный доступ к своим курсам:
https://www.tableau.com/learn/training/elearning.

Есть также 14-дневный триал на само приложение Tableau Desktop (на том же официальном сайте), а также бесплатная альтернатива с порезанной функциональностью в облаке (https://public.tableau.com/s/).
В последнее время, у меня чаще на фоне играют подкасты, чем музыка.

Из последнего больше всего запомнилось интервью Ивана Замесина со специалистом по машинному обучению из Яндекса, который занимается разработкой self-drive - самоуправляющегося автомобиля.

Интересно послушать про сложности и задачи в подобного рода инновационных проектах.

Ссылка:
https://www.youtube.com/watch?v=nPpXXWy_gQg
Искали на работе способы визуализировать в Power BI данные из Redis, в итоге нашёл коннектор на cdata. Он работает, правда не поддерживает нативные запросы (можно дописать на чем-нибудь типа python).
Еще из минусов - триал на 30 дней.

С другой стороны, для коротких проектов или исследований подходит неплохо. Помимо этого, есть еще много кастомных коннекторов (к примеру, для Elasticsearch), которые могут пригодиться.

Полный список:
https://www.cdata.com/powerbi/
Божественная статья про визуализацию данных, внутри которой можно найти:
- небольшой экскурс в историю;
- примеры хороших и плохих визуализаций (в том числе, примеры манипуляций и искажения данных);
- обобщённый взгляд на процесс визуализации;
- внушительный список дополнительных материалов в конце статьи.

Из-за объёма читать лучше на свежую голову.

Ссылка:
https://towardsdatascience.com/the-power-of-visualization-in-data-science-1995d56e4208
Немного ранее мы читали про Data Governance, пришла пора дополнить общую картину аналитического мира информацией о платформах управления данными.

В обзоре можно почитать про:
- общее назначение;
- виды;
- основные компоненты
- существующие решения на рынке.

Ссылка:
https://habr.com/ru/company/ruvds/blog/500028/
Давно хотел поделиться этим исследованием, но чего-то не хватало для полноты картины. Мемасик стал последним куском головоломки.

В сообществах аналитиков часто встречаются жалобы на сложности с внедрением BI-инструментов, так как excel проще и привычнее.

Так вот, ребята решили перестать бороться со злом и примкнуть к нему, только своим, особым способом. Они разрабатывают плагин для браузера, который позволит пользователям управлять контентом веб-страниц через табличный интерфейс. В статье есть видео с примерами работы бета-версии, рекомендую посмотреть.

По-моему, замечательный пример того, как привычные сценарии поведения могут стать источником инноваций.

Ссылка на описание:
https://www.geoffreylitt.com/wildcard/salon2020/
Крутая визуализация возраста зданий в Санкт-Петербурге:
https://how-old-is-this.house/

Вот тут можно почитать подробно про реализацию проекта и используемые инструменты.
Вышел очередной обзор рынка аналитики от Cnews, подводят итоги 2019 года.

Из интересного:
- Мировой рынок аналитики, по прогнозам, будет расти на 12,5 % в год, чего стоило ожидать вследствие массовой популяризации data science, ml, ai и прочих весёлых аббревиатур из этой области;
- В России рынок поставщиков решений по аналитике данных также вырос (судя по табличке, аж на 53%), хотя у большинства компаний доходы от таких проектов удручают (больше миллиарда - только у 5 компаний);
- на рынке BI-инструментов особых изменений нет (хотя интересно будет посмотреть на Magic Quadrant 2021 года, после того как будут объединены Tableau с Salesforce).

Ссылка на статью:
https://www.cnews.ru/reviews/analitika_30_2020/articles/rynok_analitiki_rastet_i_stanovitsya

#анализ_рынка
Начнём рабочую неделю с очередного сравнения двух инструментов в борьбе с одной и той же задачей - когортным анализом. На ринге сегодня Power BI и Python.

Автор статьи любезно не предоставил ссылку на оригинальное видео, но найти его было несложно (ссылка на ютуб).

Сама статья:
https://habr.com/ru/post/501492/
30 июня собираюсь послушать доклады онлайн-конференции Data Start. Ключевые темы - Data Science, Big Data, Machine Learning.

Участие - бесплатное.

В конфе 2 потока, на данный момент, технический для меня слишком хардкорен, но в бизнес-потоке есть несколько крутых спикеров, другие выступления которых - топ (ребята из Yandex.Taxi, ScrumTrek, Rubbles).

Ссылка:
https://datastart.ru/online-summer-2020/
Нашёл забавный симулятор работы продуктового аналитика/продакта:
- приоритезируем гипотезы;
- смотрим на результаты A/B тестирования;
- оцениваем влияние на продажи;
- релизим, либо не релизим.

Вроде бы простенько, но каждая сессия - новая увлекательная борьба за показатели бизнеса, мне нравится.

Ссылка:
https://www.lukasvermeer.nl/confidence/