Аня - аналитик данных👩‍🌾 – Telegram
Аня - аналитик данных👩‍🌾
101 subscribers
3 photos
1 file
12 links
Записки начинающего аналитика данных
@Mrs_logunova Аня

Делаю заметки для себя. Пишу просто.
Здесь не будет сложных специализированных терминов. И мутных исследований.

Нет и не будет простыней текста, 100500 ссылок. Коротко, один пост - одна мысль.
Download Telegram
Делаю файл такой же как выше по A/B тестам в Питоне. Нужно тут выкладывать?
Выкладывать файл колаба по A/B - тестам, когда закончу?
Anonymous Poll
91%
Да
5%
Нет
5%
Что за файл?)
Далее немного тестов. Продолжим по sql. Важно понимать в каком порядке работают основные операторы в sql.
Какой оператор в SQL отработает следующим после FROM?
Anonymous Quiz
30%
SELECT
58%
WHERE
0%
HAVING
12%
GROUP BY
👍2
Какой оператор в SQL сработает после WHERE?
Anonymous Quiz
28%
ORDER BY
9%
HAVING
47%
GROUP BY или SELECT
17%
FROM
График из книги "Графики, которые убеждают всех". Александр Богачев https://www.litres.ru/aleksandr-bogachev/grafiki-kotorye-ubezhdaut-vseh/
Аня - аналитик данных👩‍🌾
График из книги "Графики, которые убеждают всех". Александр Богачев https://www.litres.ru/aleksandr-bogachev/grafiki-kotorye-ubezhdaut-vseh/
Хочется подобное исследование провести самой. Канал по-тихоньку набирается. Понятно, что выборка будет маленькая и наврятли по ней пока можно судить о свойствах Генеральной совокупности, но всё же;)
Апрель 2022 года. Вы счастливы в целом, не смотря на всё трудности, которые встречаете?
Final Results
32%
Определённо да
18%
Определённо нет
39%
Скорее да
11%
Скорее нет
Визуализация

Интересная подсказка: чтобы график не был перегружен данными, данные имеющие малую долю можно объединить в категорию "прочее".

Чтобы на графике не было наслоения множества линий друг на друга - выделить цветом только важные, остальные сделать серыми - общая тенденция будет видна, при этом основное сообщение будет подкреплено цветными линиями.
Аня - аналитик данных👩‍🌾
https://youtu.be/xBTiBcPatd8
Посмотрела. Видео для тех, кто только думает освоить эту профессию. Практика максимально простая в колабе. Мне было неинтересно.
Forwarded from Pavel Dubinin
Полезные ссылки для знакомства и работы с DataLens

Большой функциональный демо дашборд:
- datalens.yandex/demo - публичный, только чтение
- Развернуть дашборд в своем DataLens для редактирования

Сообщество:
- Телеграм чат (вы сейчас тут)
- Предложить и проголосовать за новую фичу
- Плейлист официальных мероприятий на YouTube

Обучение:
- Быстрый старт, пошаговая инструкция
- Более детальные пошаговые инструкции по сценариям
- Туториалы по аналитическим функциям: агрегации, оконные функции, Level-of-Detail выражения
- Создание SQL-чартов (если вам нужно больше гибкости модели данных)
- Образовательные проекты

FAQ в документации:
- https://cloud.yandex.ru/docs/datalens/qa/

Публичные кейсы использования DataLens:
- КазаньЭкспресс - Аналитика retail маркетплейса
- Правительство С.-Петербурга - Аналитика городских сервисов
- Окраина - Аналитика на мясоперерабатывающем заводе
- МВидео - Платформа данных в облаке, геоаналитика
- Rubetek - Аналитика IOT по датчикам домов и квартир застройщика ПИК
- Moneycare - Кредитный брокер, корпоративный BI
- AnywayAnyDay - Аналитика онлайн туристического агентства
- JustSchool - Аналитика над CRM школы английского языка
- SevenTech - Аналитика технологического стартапа над ClickHouse
- НефтеТрансСервис - Промышленная аналитика интернета вещей
- RADAR - Аналитика аудитории наружной рекламы по всей России
- Цифровое образование - Аналитика олимпиад, учеников, школ
- Биологический Факультет МГУ - Предсказание и аналитика урожая
- tproger – Веб аналитика портала
- Car-Taxi - Продуктовая аналитика сервиса эвакуации авто
- Кинопоиск - Публичная статистика оценок фильмов

Примеры публичных дашбордов:
- Анализ качества воздуха
- Статистика коронавируса
- Погода
- Показатели Российских ВУЗов
- Демография Ставрополья
- Исследование про работу вахтовым методом в РФ
- Безработица РФ
- Пример с LOD выражениями от @ab0xa
(присылайте ваши примеры в чат, если хотите поделиться своим опытом!)

Презентации:
- DataLens
- Yandex Cloud Data Platform

Помощь:
- Обсудить ваш проект
- Завести тикет в техподдержку
- Найти партнера для проекта
👍4
Аналитика данных / Data Study
Гайд_по_профессии_аналитика_данных.pdf
Вот в этом файлике, который я нашла на другом канале (Я лишь перепостила) есть список вопросов, которые распространены на собеседованиях. По-тихоньку поотвечаю как бы я ответила на эти вопросы. Тег будет #вопросы_с_собеседований
Channel name was changed to «Я - аналитик данных👩‍🎓»
Какие по вашему мнению задачи решает аналитик данных в компании?

Как я бы ответила на этот вопрос:
Аналитик данных помогает принимать решения в бизнесе на основе анализа данных, выявляя закономерности, проблемы, аномалии в данных. Собирает, обрабатывает и презентует результаты исследования человеку, принимающему решение в компании. На основании исследования делает заключения о работе рекламных компаний, о причинах проблем в продажах, об аномальном поведении пользователей, о влиянии изменений на выручку и тд.
#вопросы_с_собеседований
👍3
Какие первые шаги вы бы стали делать при старте работы на проекте?

Очень неконкретный для меня вопрос. И полностью зависит от того времени сколько я работаю здесь и что за проект. Но если говорить о самом первом этапе на позиции стажёра или Джуна и какую то абстрактную задачу по анализу и презентации данных, конкретизировала бы задачу, формат результата, срок выполнения и вводные. Вводные: где хранятся данные, кто предоставит данные или доступ, формат данных.

Как-то так.
#вопросы_с_собеседований
Вы бы так же ответили? Ставьте 👍-да, 👎-нет
👍3
Какие стадии жизненного цикла продуктов вы знаете?

- разработка
- внедрение
- рост
- зрелость
- спад и вывод продукта с рынка

На каких из этих этапов работает аналитик данных?

Я бы ответила так: на всех и решает разные задачи. На этапе разработки, который включает в себя этап исследования рынка, анализирует нишу, конкурентов, исторические данные по продажам аналогичных продуктов и т. д. Определяет наиболее востребованные характеристики продукта. Участвует в тестировании.

На этапе внедрения, роста и зрелости тестирует влияние новых фич на продажи, проблемы в разных бизнес-процессах: маркетинг, продажи, тех. поддержка. Помогает в определении стратегии продвижения продукта.
На этапе спада надо как минимум определить, когда наступает спад, а когда спад продаж связан связан с неудачными изменениями в бизнес процессах или в самом продукте.

#вопросы_с_собеседований
Вы бы так же ответили? Ставьте👍- да, 👎 - нет
👍3
Channel name was changed to «Аня - аналитик данных👩‍🎓»
Можно потренироваться на датасетах с этих сайтов.
Список сайтов с разными источниками данных:
MakeoverMonday выкладывают каждый понедельник в рамках челленджа
WorkoutWednesday выкладываеют каждую среду
SportsvizSunday данные про спорт
Fivethirtyeight у них и визы хорошие, и данные открыты
Kaggle самая популярная штука, много хорошего внутри, сама часто пользуюсь
DatasetSearch гугл поиск по датасетами
👍1🔥1
В PostgreSQL у типа данных вещественные числа какое обозначение?
Anonymous Quiz
37%
Float64
26%
Integer
34%
Real
3%
Bool