Аня - аналитик данных👩🌾
https://youtu.be/xBTiBcPatd8
Посмотрела. Видео для тех, кто только думает освоить эту профессию. Практика максимально простая в колабе. Мне было неинтересно.
Forwarded from Pavel Dubinin
Полезные ссылки для знакомства и работы с DataLens
Большой функциональный демо дашборд:
- datalens.yandex/demo - публичный, только чтение
- Развернуть дашборд в своем DataLens для редактирования
Сообщество:
- Телеграм чат (вы сейчас тут)
- Предложить и проголосовать за новую фичу
- Плейлист официальных мероприятий на YouTube
Обучение:
- Быстрый старт, пошаговая инструкция
- Более детальные пошаговые инструкции по сценариям
- Туториалы по аналитическим функциям: агрегации, оконные функции, Level-of-Detail выражения
- Создание SQL-чартов (если вам нужно больше гибкости модели данных)
- Образовательные проекты
FAQ в документации:
- https://cloud.yandex.ru/docs/datalens/qa/
Публичные кейсы использования DataLens:
- КазаньЭкспресс - Аналитика retail маркетплейса
- Правительство С.-Петербурга - Аналитика городских сервисов
- Окраина - Аналитика на мясоперерабатывающем заводе
- МВидео - Платформа данных в облаке, геоаналитика
- Rubetek - Аналитика IOT по датчикам домов и квартир застройщика ПИК
- Moneycare - Кредитный брокер, корпоративный BI
- AnywayAnyDay - Аналитика онлайн туристического агентства
- JustSchool - Аналитика над CRM школы английского языка
- SevenTech - Аналитика технологического стартапа над ClickHouse
- НефтеТрансСервис - Промышленная аналитика интернета вещей
- RADAR - Аналитика аудитории наружной рекламы по всей России
- Цифровое образование - Аналитика олимпиад, учеников, школ
- Биологический Факультет МГУ - Предсказание и аналитика урожая
- tproger – Веб аналитика портала
- Car-Taxi - Продуктовая аналитика сервиса эвакуации авто
- Кинопоиск - Публичная статистика оценок фильмов
Примеры публичных дашбордов:
- Анализ качества воздуха
- Статистика коронавируса
- Погода
- Показатели Российских ВУЗов
- Демография Ставрополья
- Исследование про работу вахтовым методом в РФ
- Безработица РФ
- Пример с LOD выражениями от @ab0xa
(присылайте ваши примеры в чат, если хотите поделиться своим опытом!)
Презентации:
- DataLens
- Yandex Cloud Data Platform
Помощь:
- Обсудить ваш проект
- Завести тикет в техподдержку
- Найти партнера для проекта
Большой функциональный демо дашборд:
- datalens.yandex/demo - публичный, только чтение
- Развернуть дашборд в своем DataLens для редактирования
Сообщество:
- Телеграм чат (вы сейчас тут)
- Предложить и проголосовать за новую фичу
- Плейлист официальных мероприятий на YouTube
Обучение:
- Быстрый старт, пошаговая инструкция
- Более детальные пошаговые инструкции по сценариям
- Туториалы по аналитическим функциям: агрегации, оконные функции, Level-of-Detail выражения
- Создание SQL-чартов (если вам нужно больше гибкости модели данных)
- Образовательные проекты
FAQ в документации:
- https://cloud.yandex.ru/docs/datalens/qa/
Публичные кейсы использования DataLens:
- КазаньЭкспресс - Аналитика retail маркетплейса
- Правительство С.-Петербурга - Аналитика городских сервисов
- Окраина - Аналитика на мясоперерабатывающем заводе
- МВидео - Платформа данных в облаке, геоаналитика
- Rubetek - Аналитика IOT по датчикам домов и квартир застройщика ПИК
- Moneycare - Кредитный брокер, корпоративный BI
- AnywayAnyDay - Аналитика онлайн туристического агентства
- JustSchool - Аналитика над CRM школы английского языка
- SevenTech - Аналитика технологического стартапа над ClickHouse
- НефтеТрансСервис - Промышленная аналитика интернета вещей
- RADAR - Аналитика аудитории наружной рекламы по всей России
- Цифровое образование - Аналитика олимпиад, учеников, школ
- Биологический Факультет МГУ - Предсказание и аналитика урожая
- tproger – Веб аналитика портала
- Car-Taxi - Продуктовая аналитика сервиса эвакуации авто
- Кинопоиск - Публичная статистика оценок фильмов
Примеры публичных дашбордов:
- Анализ качества воздуха
- Статистика коронавируса
- Погода
- Показатели Российских ВУЗов
- Демография Ставрополья
- Исследование про работу вахтовым методом в РФ
- Безработица РФ
- Пример с LOD выражениями от @ab0xa
(присылайте ваши примеры в чат, если хотите поделиться своим опытом!)
Презентации:
- DataLens
- Yandex Cloud Data Platform
Помощь:
- Обсудить ваш проект
- Завести тикет в техподдержку
- Найти партнера для проекта
Telegram
Yandex DataLens
Сообщество пользователей Yandex DataLens
- Правила: t.me/YandexDataLens/28609/28610
- Полезное: t.me/YandexDataLens/28609/28894
Номер заявления РКН: 4962849290
- Правила: t.me/YandexDataLens/28609/28610
- Полезное: t.me/YandexDataLens/28609/28894
Номер заявления РКН: 4962849290
👍4
Аналитика данных / Data Study
Гайд_по_профессии_аналитика_данных.pdf
Вот в этом файлике, который я нашла на другом канале (Я лишь перепостила) есть список вопросов, которые распространены на собеседованиях. По-тихоньку поотвечаю как бы я ответила на эти вопросы. Тег будет #вопросы_с_собеседований
Какие по вашему мнению задачи решает аналитик данных в компании?
Как я бы ответила на этот вопрос:
Аналитик данных помогает принимать решения в бизнесе на основе анализа данных, выявляя закономерности, проблемы, аномалии в данных. Собирает, обрабатывает и презентует результаты исследования человеку, принимающему решение в компании. На основании исследования делает заключения о работе рекламных компаний, о причинах проблем в продажах, об аномальном поведении пользователей, о влиянии изменений на выручку и тд.
#вопросы_с_собеседований
Как я бы ответила на этот вопрос:
Аналитик данных помогает принимать решения в бизнесе на основе анализа данных, выявляя закономерности, проблемы, аномалии в данных. Собирает, обрабатывает и презентует результаты исследования человеку, принимающему решение в компании. На основании исследования делает заключения о работе рекламных компаний, о причинах проблем в продажах, об аномальном поведении пользователей, о влиянии изменений на выручку и тд.
#вопросы_с_собеседований
👍3
Какие первые шаги вы бы стали делать при старте работы на проекте?
Очень неконкретный для меня вопрос. И полностью зависит от того времени сколько я работаю здесь и что за проект. Но если говорить о самом первом этапе на позиции стажёра или Джуна и какую то абстрактную задачу по анализу и презентации данных, конкретизировала бы задачу, формат результата, срок выполнения и вводные. Вводные: где хранятся данные, кто предоставит данные или доступ, формат данных.
Как-то так.
#вопросы_с_собеседований
Вы бы так же ответили? Ставьте 👍-да, 👎-нет
Очень неконкретный для меня вопрос. И полностью зависит от того времени сколько я работаю здесь и что за проект. Но если говорить о самом первом этапе на позиции стажёра или Джуна и какую то абстрактную задачу по анализу и презентации данных, конкретизировала бы задачу, формат результата, срок выполнения и вводные. Вводные: где хранятся данные, кто предоставит данные или доступ, формат данных.
Как-то так.
#вопросы_с_собеседований
Вы бы так же ответили? Ставьте 👍-да, 👎-нет
👍3
Аня - аналитик данных👩🌾
Хочется подобное исследование провести самой. Канал по-тихоньку набирается. Понятно, что выборка будет маленькая и наврятли по ней пока можно судить о свойствах Генеральной совокупности, но всё же;)
Май 2022. Счастливы ли вы, несмотря на всё трудности, которые встречаете сейчас на своём жизненном пути?
Final Results
28%
Определённо да
10%
Определённо нет
31%
Скорее да
31%
Скорее нет
Какие стадии жизненного цикла продуктов вы знаете?
- разработка
- внедрение
- рост
- зрелость
- спад и вывод продукта с рынка
На каких из этих этапов работает аналитик данных?
Я бы ответила так: на всех и решает разные задачи. На этапе разработки, который включает в себя этап исследования рынка, анализирует нишу, конкурентов, исторические данные по продажам аналогичных продуктов и т. д. Определяет наиболее востребованные характеристики продукта. Участвует в тестировании.
На этапе внедрения, роста и зрелости тестирует влияние новых фич на продажи, проблемы в разных бизнес-процессах: маркетинг, продажи, тех. поддержка. Помогает в определении стратегии продвижения продукта.
На этапе спада надо как минимум определить, когда наступает спад, а когда спад продаж связан связан с неудачными изменениями в бизнес процессах или в самом продукте.
#вопросы_с_собеседований
Вы бы так же ответили? Ставьте👍- да, 👎 - нет
- разработка
- внедрение
- рост
- зрелость
- спад и вывод продукта с рынка
На каких из этих этапов работает аналитик данных?
Я бы ответила так: на всех и решает разные задачи. На этапе разработки, который включает в себя этап исследования рынка, анализирует нишу, конкурентов, исторические данные по продажам аналогичных продуктов и т. д. Определяет наиболее востребованные характеристики продукта. Участвует в тестировании.
На этапе внедрения, роста и зрелости тестирует влияние новых фич на продажи, проблемы в разных бизнес-процессах: маркетинг, продажи, тех. поддержка. Помогает в определении стратегии продвижения продукта.
На этапе спада надо как минимум определить, когда наступает спад, а когда спад продаж связан связан с неудачными изменениями в бизнес процессах или в самом продукте.
#вопросы_с_собеседований
Вы бы так же ответили? Ставьте👍- да, 👎 - нет
👍3
Forwarded from настенька и графики
Список сайтов с разными источниками данных:
– MakeoverMonday выкладывают каждый понедельник в рамках челленджа
– WorkoutWednesday выкладываеют каждую среду
– SportsvizSunday данные про спорт
– Fivethirtyeight у них и визы хорошие, и данные открыты
– Kaggle самая популярная штука, много хорошего внутри, сама часто пользуюсь
– DatasetSearch гугл поиск по датасетами
– MakeoverMonday выкладывают каждый понедельник в рамках челленджа
– WorkoutWednesday выкладываеют каждую среду
– SportsvizSunday данные про спорт
– Fivethirtyeight у них и визы хорошие, и данные открыты
– Kaggle самая популярная штука, много хорошего внутри, сама часто пользуюсь
– DatasetSearch гугл поиск по датасетами
Medium
Websites to Find Datasets for your Data Visualization Projects
The best way to improve your visualizations is to practice and practice and practice. The basic step in making a dashboard involves data…
👍1🔥1
В PostgreSQL у типа данных вещественные числа какое обозначение?
Anonymous Quiz
37%
Float64
26%
Integer
34%
Real
3%
Bool
В чем различия задач аналитика и менеджера проекта?
Задача аналитика: понять, где боль клиента/бизнеса и предложить, как её вылечить. То есть собрать данные (или найти у кого их взять), сделать выводы, представить рекомендации, в том числе менеджеру проекта.
Задача менеджера проекта: вылечить боль: поставить задачу, распределить ресурсы (время и команду, бюджет), решать проблемы по мере реализации проекта, отследить сроки, готовить отчётность.
#вопросы_с_собеседований
Ответили бы так же? Да - 👍, нет - 👎
Задача аналитика: понять, где боль клиента/бизнеса и предложить, как её вылечить. То есть собрать данные (или найти у кого их взять), сделать выводы, представить рекомендации, в том числе менеджеру проекта.
Задача менеджера проекта: вылечить боль: поставить задачу, распределить ресурсы (время и команду, бюджет), решать проблемы по мере реализации проекта, отследить сроки, готовить отчётность.
#вопросы_с_собеседований
Ответили бы так же? Да - 👍, нет - 👎
👍5
Определение из статистики. Мода
Мода - это самое частовстречающееся значение во множестве (выборке).
Множество:
1 2 3 4 5 6 5 4 3 2 8 1 9 9 9 4
Мода: 9
Мультимодальность - когда таких значений несколько.
Часто мультимодальность указывает, что распределение НЕ является нормальным.
Мода - это самое частовстречающееся значение во множестве (выборке).
Множество:
1 2 3 4 5 6 5 4 3 2 8 1 9 9 9 4
Мода: 9
Мультимодальность - когда таких значений несколько.
Часто мультимодальность указывает, что распределение НЕ является нормальным.
❤2🎉1
Как взаимодействую между собой владелец продукта и аналитик?
В отличие от менеджера проекта владелец работает только над развитием самого продукта. Ведёт бэклог (определяет задачи и фичи, которые надо реализовать). Выступает внутренним заказчиком при выполнении разработки. Анализирует рынок, общается с экспертами, получает результаты тестирований, общается с заказчиком, определяет приоритетность.
Аналитик помогает владельцу продукта принимать решения в части разработки на основе собранных данных. Проводить А/В-тесты, формулировать гипотезы и на основе их проверки запускать в продукт новые фичи.
Я бы так ответила.
#вопросы_с_собеседований
В отличие от менеджера проекта владелец работает только над развитием самого продукта. Ведёт бэклог (определяет задачи и фичи, которые надо реализовать). Выступает внутренним заказчиком при выполнении разработки. Анализирует рынок, общается с экспертами, получает результаты тестирований, общается с заказчиком, определяет приоритетность.
Аналитик помогает владельцу продукта принимать решения в части разработки на основе собранных данных. Проводить А/В-тесты, формулировать гипотезы и на основе их проверки запускать в продукт новые фичи.
Я бы так ответила.
#вопросы_с_собеседований
❤1👍1🥰1
Дальше по плану написать про стандартное отклонение и дисперсию. И нормальное распределение.
Про нормальное распределение 38 % голосующих не знают)
Про нормальное распределение 38 % голосующих не знают)
Аня - аналитик данных👩🌾
Дальше по плану написать про стандартное отклонение и дисперсию. И нормальное распределение. Про нормальное распределение 38 % голосующих не знают)
Не буду углубляться в формулы.
Дисперсия - это мера разброса величины вокруг среднего. Зная, среднее и дисперсию мы можем примерно представлять как разбросаны значения выборки.
Если дисперсия большая, то есть значения сильно разбросаны, то и график нормального распределения будет более широким по сравнению с распределением, где числа имеют более узкий диапазон.
Например, у вас стоимость акции: среднее - 100, дисперсия 20 и среднее 100 , а дисперсия 55. Где больше риска и прибыли? Правильно во втором случае.
Так как дисперсия возводит значения в квадрат (руб. в квадрате), то для возврата к единицам измерения (просто руб. ) можно посчитать стандартное отклонение.
Стандартное отклонение = корень из дисперсии.
Дисперсия - это мера разброса величины вокруг среднего. Зная, среднее и дисперсию мы можем примерно представлять как разбросаны значения выборки.
Если дисперсия большая, то есть значения сильно разбросаны, то и график нормального распределения будет более широким по сравнению с распределением, где числа имеют более узкий диапазон.
Например, у вас стоимость акции: среднее - 100, дисперсия 20 и среднее 100 , а дисперсия 55. Где больше риска и прибыли? Правильно во втором случае.
Так как дисперсия возводит значения в квадрат (руб. в квадрате), то для возврата к единицам измерения (просто руб. ) можно посчитать стандартное отклонение.
Стандартное отклонение = корень из дисперсии.
❤3🔥2
Большинство событий в нашей жизни подчиняется нормальному распределению.
Возьмём рост.
Если построить гистограмму для для роста 100000 человек России, то гистограмма будет стремиться к нормальному распределению и иметь вид колокола. Где самая высокая точка - будет средний рост жителя России.
Есть ещё такое понятие как стандартное нормальное распределение - это частный случай нормального распределения. Среднее в этом случае = 0, а стандартное отклонение = 1.
Возьмём рост.
Если построить гистограмму для для роста 100000 человек России, то гистограмма будет стремиться к нормальному распределению и иметь вид колокола. Где самая высокая точка - будет средний рост жителя России.
Есть ещё такое понятие как стандартное нормальное распределение - это частный случай нормального распределения. Среднее в этом случае = 0, а стандартное отклонение = 1.
❤3