Аня - аналитик данных👩‍🌾 – Telegram
Аня - аналитик данных👩‍🌾
101 subscribers
3 photos
1 file
12 links
Записки начинающего аналитика данных
@Mrs_logunova Аня

Делаю заметки для себя. Пишу просто.
Здесь не будет сложных специализированных терминов. И мутных исследований.

Нет и не будет простыней текста, 100500 ссылок. Коротко, один пост - одна мысль.
Download Telegram
Аня - аналитик данных👩‍🌾
График из книги "Графики, которые убеждают всех". Александр Богачев https://www.litres.ru/aleksandr-bogachev/grafiki-kotorye-ubezhdaut-vseh/
Хочется подобное исследование провести самой. Канал по-тихоньку набирается. Понятно, что выборка будет маленькая и наврятли по ней пока можно судить о свойствах Генеральной совокупности, но всё же;)
Апрель 2022 года. Вы счастливы в целом, не смотря на всё трудности, которые встречаете?
Final Results
32%
Определённо да
18%
Определённо нет
39%
Скорее да
11%
Скорее нет
Визуализация

Интересная подсказка: чтобы график не был перегружен данными, данные имеющие малую долю можно объединить в категорию "прочее".

Чтобы на графике не было наслоения множества линий друг на друга - выделить цветом только важные, остальные сделать серыми - общая тенденция будет видна, при этом основное сообщение будет подкреплено цветными линиями.
Аня - аналитик данных👩‍🌾
https://youtu.be/xBTiBcPatd8
Посмотрела. Видео для тех, кто только думает освоить эту профессию. Практика максимально простая в колабе. Мне было неинтересно.
Forwarded from Pavel Dubinin
Полезные ссылки для знакомства и работы с DataLens

Большой функциональный демо дашборд:
- datalens.yandex/demo - публичный, только чтение
- Развернуть дашборд в своем DataLens для редактирования

Сообщество:
- Телеграм чат (вы сейчас тут)
- Предложить и проголосовать за новую фичу
- Плейлист официальных мероприятий на YouTube

Обучение:
- Быстрый старт, пошаговая инструкция
- Более детальные пошаговые инструкции по сценариям
- Туториалы по аналитическим функциям: агрегации, оконные функции, Level-of-Detail выражения
- Создание SQL-чартов (если вам нужно больше гибкости модели данных)
- Образовательные проекты

FAQ в документации:
- https://cloud.yandex.ru/docs/datalens/qa/

Публичные кейсы использования DataLens:
- КазаньЭкспресс - Аналитика retail маркетплейса
- Правительство С.-Петербурга - Аналитика городских сервисов
- Окраина - Аналитика на мясоперерабатывающем заводе
- МВидео - Платформа данных в облаке, геоаналитика
- Rubetek - Аналитика IOT по датчикам домов и квартир застройщика ПИК
- Moneycare - Кредитный брокер, корпоративный BI
- AnywayAnyDay - Аналитика онлайн туристического агентства
- JustSchool - Аналитика над CRM школы английского языка
- SevenTech - Аналитика технологического стартапа над ClickHouse
- НефтеТрансСервис - Промышленная аналитика интернета вещей
- RADAR - Аналитика аудитории наружной рекламы по всей России
- Цифровое образование - Аналитика олимпиад, учеников, школ
- Биологический Факультет МГУ - Предсказание и аналитика урожая
- tproger – Веб аналитика портала
- Car-Taxi - Продуктовая аналитика сервиса эвакуации авто
- Кинопоиск - Публичная статистика оценок фильмов

Примеры публичных дашбордов:
- Анализ качества воздуха
- Статистика коронавируса
- Погода
- Показатели Российских ВУЗов
- Демография Ставрополья
- Исследование про работу вахтовым методом в РФ
- Безработица РФ
- Пример с LOD выражениями от @ab0xa
(присылайте ваши примеры в чат, если хотите поделиться своим опытом!)

Презентации:
- DataLens
- Yandex Cloud Data Platform

Помощь:
- Обсудить ваш проект
- Завести тикет в техподдержку
- Найти партнера для проекта
👍4
Аналитика данных / Data Study
Гайд_по_профессии_аналитика_данных.pdf
Вот в этом файлике, который я нашла на другом канале (Я лишь перепостила) есть список вопросов, которые распространены на собеседованиях. По-тихоньку поотвечаю как бы я ответила на эти вопросы. Тег будет #вопросы_с_собеседований
Channel name was changed to «Я - аналитик данных👩‍🎓»
Какие по вашему мнению задачи решает аналитик данных в компании?

Как я бы ответила на этот вопрос:
Аналитик данных помогает принимать решения в бизнесе на основе анализа данных, выявляя закономерности, проблемы, аномалии в данных. Собирает, обрабатывает и презентует результаты исследования человеку, принимающему решение в компании. На основании исследования делает заключения о работе рекламных компаний, о причинах проблем в продажах, об аномальном поведении пользователей, о влиянии изменений на выручку и тд.
#вопросы_с_собеседований
👍3
Какие первые шаги вы бы стали делать при старте работы на проекте?

Очень неконкретный для меня вопрос. И полностью зависит от того времени сколько я работаю здесь и что за проект. Но если говорить о самом первом этапе на позиции стажёра или Джуна и какую то абстрактную задачу по анализу и презентации данных, конкретизировала бы задачу, формат результата, срок выполнения и вводные. Вводные: где хранятся данные, кто предоставит данные или доступ, формат данных.

Как-то так.
#вопросы_с_собеседований
Вы бы так же ответили? Ставьте 👍-да, 👎-нет
👍3
Какие стадии жизненного цикла продуктов вы знаете?

- разработка
- внедрение
- рост
- зрелость
- спад и вывод продукта с рынка

На каких из этих этапов работает аналитик данных?

Я бы ответила так: на всех и решает разные задачи. На этапе разработки, который включает в себя этап исследования рынка, анализирует нишу, конкурентов, исторические данные по продажам аналогичных продуктов и т. д. Определяет наиболее востребованные характеристики продукта. Участвует в тестировании.

На этапе внедрения, роста и зрелости тестирует влияние новых фич на продажи, проблемы в разных бизнес-процессах: маркетинг, продажи, тех. поддержка. Помогает в определении стратегии продвижения продукта.
На этапе спада надо как минимум определить, когда наступает спад, а когда спад продаж связан связан с неудачными изменениями в бизнес процессах или в самом продукте.

#вопросы_с_собеседований
Вы бы так же ответили? Ставьте👍- да, 👎 - нет
👍3
Channel name was changed to «Аня - аналитик данных👩‍🎓»
Можно потренироваться на датасетах с этих сайтов.
Список сайтов с разными источниками данных:
MakeoverMonday выкладывают каждый понедельник в рамках челленджа
WorkoutWednesday выкладываеют каждую среду
SportsvizSunday данные про спорт
Fivethirtyeight у них и визы хорошие, и данные открыты
Kaggle самая популярная штука, много хорошего внутри, сама часто пользуюсь
DatasetSearch гугл поиск по датасетами
👍1🔥1
В PostgreSQL у типа данных вещественные числа какое обозначение?
Anonymous Quiz
37%
Float64
26%
Integer
34%
Real
3%
Bool
В чем различия задач аналитика и менеджера проекта?

Задача аналитика: понять, где боль клиента/бизнеса и предложить, как её вылечить. То есть собрать данные (или найти у кого их взять), сделать выводы, представить рекомендации, в том числе менеджеру проекта.

Задача менеджера проекта: вылечить боль: поставить задачу, распределить ресурсы (время и команду, бюджет), решать проблемы по мере реализации проекта, отследить сроки, готовить отчётность.
#вопросы_с_собеседований

Ответили бы так же? Да - 👍, нет - 👎
👍5
Определение из статистики. Мода

Мода - это самое частовстречающееся значение во множестве (выборке).

Множество:
1 2 3 4 5 6 5 4 3 2 8 1 9 9 9 4

Мода: 9

Мультимодальность - когда таких значений несколько.

Часто мультимодальность указывает, что распределение НЕ является нормальным.
2🎉1
Знаете, что такое НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ?
Anonymous Poll
72%
Да
28%
Нет
Channel name was changed to «Аня - аналитик данных👩‍🌾»
Как взаимодействую между собой владелец продукта и аналитик?

В отличие от менеджера проекта владелец работает только над развитием самого продукта. Ведёт бэклог (определяет задачи и фичи, которые надо реализовать). Выступает внутренним заказчиком при выполнении разработки. Анализирует рынок, общается с экспертами, получает результаты тестирований, общается с заказчиком, определяет приоритетность.

Аналитик помогает владельцу продукта принимать решения в части разработки на основе собранных данных. Проводить А/В-тесты, формулировать гипотезы и на основе их проверки запускать в продукт новые фичи.

Я бы так ответила.
#вопросы_с_собеседований
1👍1🥰1
Дальше по плану написать про стандартное отклонение и дисперсию. И нормальное распределение.

Про нормальное распределение 38 % голосующих не знают)