Я у мамы аналитик – Telegram
Я у мамы аналитик
2.81K subscribers
77 photos
2 files
244 links
Как могу анализирую материалы на тему работы с данными:
- инфраструктура и инструменты;
- роли и компетенции аналитиков;
- продуктовый подход к аналитике;
- роль аналитики в создании и развитии продуктов.

Обратная связь @s_valuev, рекламу не размещаю
Download Telegram
🛠〽️👥 #Инструменты #PowerBI #ОтПодписчика

Коллега (увидит мою благодарность, если соизволит подписаться 😂) тут поделился пособием по Power BI, которое является альтернативой официальной документации от Microsoft.

По сравнению с последней, пособие намного лучше структурировано, вся информация в одном месте и в адекватной последовательности. Понравилось, что одновременно рассматривается Power Query в контексте Power BI и Excel, так что полезно будет независимо от используемого в конкретном кейсе инструмента.

Ссылка:
https://github.com/power-bi/PowerBI-book-ru
🛠〽️ #Инструменты #PowerBI

По BI-чику есть еще такая штука - инструкция по созданию динамических фильтров. Видел несколько кейсов их применения для сравнения данных с аналогичными за предыдущий период (продажи в деньгах и штуках, нагрузка и т.п.).

Подробнее по ссылкам:
- Часть 1;
- Часть 2.
Не могу не поделиться, канал крутой и посты интересные:
Forwarded from Datalytics
Гайд по визуализации данных в Python: начиная от раскрашивания ячеек и спарклайнов в Pandas, и завершая интерактивными визуализациями с помощью Bokeh и Altair, а также геовизуализациями в Folium.

https://towardsdatascience.com/complete-guide-to-data-visualization-with-python-2dd74df12b5e
Сегодня у нас долгое чтиво про метрики здоровья продукта:
- что это такое;
- какие показатели есть на разном этапе жизненного цикла продукта;
- какие инструменты и визуализации используются.

Несколько понравившихся идей:
1) QA-метрики и бизнес-метрики живут в одном интерфейсе и рассматриваются в жёсткой связке;
2) Метрики и их визуальное отображение устаревают и требуют систематического пересмотра;
3) Принудительные уведомления по состоянию метрик (по пересечению пороговых значений или инцидентам).

Интересно было бы в дополнение почитать про процесс и стоимость внедрения единого инструмента.

Ссылка на статью:
https://habr.com/ru/company/oleg-bunin/blog/481874/
Хабр собрал статейку про сервисы, которые дают бесплатный доступ к контенту на время карантина (а также там еще немного накидали пользователи в комментариях).

Интересного много, практически применимого для развития в области аналитики - поменьше.

Среди книг на Альпине, к примеру, я для себя ничего не нашёл.

А вот на Geekbrains можно получить бесплатный доступ к 3 курсам из ограниченного списка на выбор, полезны будут:
- базы данных;
- алгоритмы и структуры данных на Python;
- можно посмотреть смежные дисциплины - основы project/product менеджмента или дизайна.

Ссылка:
https://habr.com/ru/company/habr/blog/492776/
Парни из Белоруссии с помощью машинного обучения научились по снимкам со спутников определять на карте с/х поля и угадывать, что на них посажено.

По-моему, очень крутой пример того, как применять современные методы анализа к данным из открытых источников и создавать на этом бизнес (у них эта технология является частью продукта для фермеров).

Жаль, данных по России нет, чтобы вживую проверить, как работает.

Ссылка:
https://map.onesoil.ai/2018
Если освободилось много времени из-за удалёнки (у меня, например, нет) то можно еще посмотреть цикл лекций "Анализ данных на Python в примерах и задачах". Слышал несколько хороших отзывов про него, ну и преподаватель (по моему мнению) неплохо рассказывает (я медленно, но все-таки их смотрю).

Ссылки на ютуб:
- первая;
- вторая.
Мощная (как по содержанию, так и по размеру) статья про рекомендательные системы для ритейла, освещает:
- терминологию;
- алгоритмы;
- основные метрики;
- специфику, собственно, ритейла.

Ссылка:
https://habr.com/ru/post/494468/
Небольшой и ёмкий обзор Data Science как профессии и Data Scientist как профессионала. Внутри много ссылок на основные понятия, концепты, полезные материалы.

Ссылка:
https://www.kdnuggets.com/2019/10/good-data-scientist-beginner-guide.html
А во второй части статьи можно почитать про основные этапы проектов по аналитике данных.

Выцепил для себя 2 инструмента анализа данных, с которыми можно познакомиться поближе: Orange и Knime. Еще один, Rapid Miner, судя по всему, перестали распространять по Free модели.

Ссылка:
https://www.kdnuggets.com/2020/04/guide-data-science-build-data-project.html
Небольшое погружение в концепцию управления данными DataGovernance на примере кейса Ростелекома. Автор рассказывает про основные цели, результаты внедрения и инструменты (что интересно, используют Python и Django, а не коробочное решение, объяснение тоже присуствует).

Ссылка:
https://habr.com/ru/company/rostelecom/blog/495934/
Если есть желание потрогать Tableau собственными руками и вы еще этого не делали - самое время.
Ребятки открывают на 90 дней бесплатный доступ к своим курсам:
https://www.tableau.com/learn/training/elearning.

Есть также 14-дневный триал на само приложение Tableau Desktop (на том же официальном сайте), а также бесплатная альтернатива с порезанной функциональностью в облаке (https://public.tableau.com/s/).
В последнее время, у меня чаще на фоне играют подкасты, чем музыка.

Из последнего больше всего запомнилось интервью Ивана Замесина со специалистом по машинному обучению из Яндекса, который занимается разработкой self-drive - самоуправляющегося автомобиля.

Интересно послушать про сложности и задачи в подобного рода инновационных проектах.

Ссылка:
https://www.youtube.com/watch?v=nPpXXWy_gQg
Искали на работе способы визуализировать в Power BI данные из Redis, в итоге нашёл коннектор на cdata. Он работает, правда не поддерживает нативные запросы (можно дописать на чем-нибудь типа python).
Еще из минусов - триал на 30 дней.

С другой стороны, для коротких проектов или исследований подходит неплохо. Помимо этого, есть еще много кастомных коннекторов (к примеру, для Elasticsearch), которые могут пригодиться.

Полный список:
https://www.cdata.com/powerbi/
Божественная статья про визуализацию данных, внутри которой можно найти:
- небольшой экскурс в историю;
- примеры хороших и плохих визуализаций (в том числе, примеры манипуляций и искажения данных);
- обобщённый взгляд на процесс визуализации;
- внушительный список дополнительных материалов в конце статьи.

Из-за объёма читать лучше на свежую голову.

Ссылка:
https://towardsdatascience.com/the-power-of-visualization-in-data-science-1995d56e4208
Немного ранее мы читали про Data Governance, пришла пора дополнить общую картину аналитического мира информацией о платформах управления данными.

В обзоре можно почитать про:
- общее назначение;
- виды;
- основные компоненты
- существующие решения на рынке.

Ссылка:
https://habr.com/ru/company/ruvds/blog/500028/
Давно хотел поделиться этим исследованием, но чего-то не хватало для полноты картины. Мемасик стал последним куском головоломки.

В сообществах аналитиков часто встречаются жалобы на сложности с внедрением BI-инструментов, так как excel проще и привычнее.

Так вот, ребята решили перестать бороться со злом и примкнуть к нему, только своим, особым способом. Они разрабатывают плагин для браузера, который позволит пользователям управлять контентом веб-страниц через табличный интерфейс. В статье есть видео с примерами работы бета-версии, рекомендую посмотреть.

По-моему, замечательный пример того, как привычные сценарии поведения могут стать источником инноваций.

Ссылка на описание:
https://www.geoffreylitt.com/wildcard/salon2020/