Аналитика. Это просто – Telegram
Аналитика. Это просто
969 subscribers
120 photos
3 videos
4 files
517 links
Канал об аналитике. Web, мобильная, продуктовая. По любым вопросам можно писать - @ealexandr
Download Telegram
Актуальность Retention растет не по дням а по когортам. Неплохая статья про визуализацию матрицы Retention - https://towardsdatascience.com/visualizing-cohort-retention-rates-with-pycohort-package-95e7f29052b3
Forwarded from Про BI, DWH, DE
Наверняка вы знакомы с такой программой как DBeaver. Если не слышали, то это такой софт, с помощью которого можно в удобном виде работать с огромным количеством баз данных, аналитикам рекомендую.

Работая с ней возникла необходимость подключиться к PostgreSQL, создать в нем базу данных с таблицами. Выполнил все необходимые операции но в списке доступных баз не обнаружил вновь созданную. Переподключения не помогли. В процессе решения задачи выяснил, что по умолчанию драйвер PostgreSQL в DBeaver отображает только базу данных по умолчанию (default), чтобы изменить режим нужно перейти к настройкам подключения и активировать переключатель как показано на скриншоте
То, что мы имеем сегодня, обычно является результатом того, что мы делали вчера. Так что, наверное, спросить нужно спросить с себя, меня, нас.
Лягушка не даст соврать.
Всем привет! Не так давно для экономии времени при поиске работы сделал простого бота, который собирает вакансии для аналитиков из известных мне каналов и чатов с вакансиями. После немного доработал. Сейчас он собирает и пересылает эти посты с вакансиями в отдельный канал-агрегатор.

Пока формат именно такой - пересылаемые сообщения. В дальнейшем подумаю, какой формат агрегации вакансий будет оптимальным. Хорошо бы также использовать другие источники вакансий, это, наверное, впереди.
В данный момент это все находится в стадии тестирования, поэтому не все пока идеально, например, иногда пересылаются и рекламные сообщения в каналах.

Критике и предложениям по улучшению работы буду очень благодарен.

Собственно, канал https://news.1rj.ru/str/analyst_job_aggregator
Forwarded from Alexey Nikushin
Если бы каждый 50ый из этого чата написал в фейсбуке/телеге/на стене - Матемаркетинг заебись! Придите на матемаркетинг - было бы вообще огонь
This media is not supported in your browser
VIEW IN TELEGRAM
Придите на Матемаркетинг. Алексей продолжает делать лучшую отраслевую конференцию для нас. А те, кто любит кормить свои страхи и комплексы, тем более приходите.
Forwarded from Про BI, DWH, DE
Развитие веб-аналитика - в каком направлении двигаться дальше?

Поскольку я сам начинал с веб-аналитики, то определил для себя несколько возможных вариантов развития специалиста на сегодняшний день. Расположил по сложности и текущему уровню з/п. Но, имейте ввиду, это личное мнение, а также то, что зачастую требования и навыки могут пересекаться в одной вакансии, особенно если это не крупная компания.

1️⃣ Инжиниринг данных. Работая веб-аналитиком, приходится иметь дело с процессами, которые происходят на сайте "под капотом", т.е. есть понимание как устроены сайты, как происходит обмен информацией между сервером и клиентом и пр. Также приходится выполнять различные интеграции между системами (например, через Measurement Protocol). Возможно, настройка выполняется через сервисы автоматизации, но все равно есть понимание того, как такой процесс происходит. Сильно обобщая ваша задача сводится к тому, чтобы построить систему в которой будет центральное хранилище данных, наполняемое из различных источников, с которыми вы организуете постоянное автоматическое взаимодействие, формирование витрин данных, для нужд аналитиков данных и BI аналитиков и много других интересных задач. Набор навыков и инструментов для работы достаточно широк.

2️⃣ Аналитик данных. Эта история больше про работу с данными и извлечение из них ценной информации. У вас собран некоторый массив информации, который стоит исследовать, чтобы найти закономерности, отклонения и пр. На основе проведённой работы подготовить гипотезы, протестировать их и посмотреть на результат. Помимо навыков работы с данными потребуется также умение преподнести ваше исследование, а это значит, что стоит также иметь знания в области визуализации данных. Придется работать на Python, возможно R, требуется SQL, базовое знание статистики.

3️⃣ BI аналитик. По сравнению с двумя первыми вариантами, на текущий момент мне кажется наименее привлекательным т.к. с российского рынка ушли лидеры (Power BI, Tableau), а равносильно заменить их нечем. Для отдельных задач подойдут и открытые решения, но это не полноценные альтернативы. Но если решили посмотреть в этом направлении, то будет полезно изучить SQL, основы баз данных, для понимания связей между таблицами (чтобы строить модели), визуализацию данных, а также посидеть над изучением документации к специализированному программному обеспечению.

✔️ Что и где посмотреть для изучения.

По инжинирингу данных Дмитрия Аношина есть бесплатный проект, который можно использовать как точку входа в профессию. По аналитике данных посмотрите на курсы Python, R, SQL можно начать с самых основ, если ранее на работали. Основы статистики рекомендую бесплатный курс от Анатолия Карпова . По BI (и не только) есть книги от Александра Гинько

Интересно узнать вашу текущую специализацию и планы на будущее
Нечасто покупаю на Озоне, поэтому странным сюрпризом стало, что получить в ПВЗ заказ можно только с помощью штрих-кода. Его можно найти в ЛК мобильного приложения, а на сайте есть лишь его номер, который, впрочем у меня отказались принять (допускаю, что мы просто недопоняли друг друга). Пришлось прямо в ПВЗ устанавливать приложение, чего делать не очень хотелось.
Для меня так и остается загадкой, а зачем это все...
Был уверен, что расширение возможностей получения, ну или оплаты - несомненное добро, а ограничение - зло. Для меня не проблема установить МП или сфоткать номер кода с ноутбука. А, вот, моя мама не смогла бы.
Очень хотелось бы на какой-нибудь из ближайших конференций послушать доклад представителя Озона, как протестировали эту фичу AB-тестом и она дала прирост 100500%. Ведь аналитика и пруфы наше все, не так ли?
Работать с clickhouse начал недавно и почти сразу наткнулся, что нет оконных функций lag, lead. В документации написано, как можно решить иначе. В итоге использовал функцию neighbor (https://clickhouse.com/docs/ru/sql-reference/functions/other-functions/#neighbor) с последующими несколькими фильтрами. Не очень удобная, но вполне рабочая схема. А пока ждем, все же, появления lag, lead
Добрый человек поправил меня. В clickhouse есть функции LagInFrame и LeadInFrame, работающие как Lag и Lead. Собственно, они есть и на скриншоте выше
Ну что? Дождались! Бесплатный онлайн-билет, который позволит посмотреть в лайве около 30 докладов конференции!

Среди которых, мастер-класс от Федора Лисицына по построению карьеры в России и за рубежом, лекция и беседа с Валерием Бабушкиным, доклад Марата Миннекаева из Авито о том, что должен знать о финансах каждый продакт и аналитик, лекция Яндекс.Практикума о том как грамотно совершать и быть готовым к карьеным свитчам, секретный доклад от Яндекса, лекции и дискуссии от Тинькофф и, конечно же, лекция Стаса Асафьева и многое другое.

У вас будет полноценная возможность просмотреть эти доклады в лайве, початиться со спикерами, задавать вопросы и тд и тп.

Но в полночь пятницы 18 ноября это все превратится в тыкву! 🎃

Люблю вас! ❤️ Регайтесь https://matemarketing.ru/#tickets
Сегодня случайно посмотрел двухминутный фрагмент шикарного фильма "В погоне за счастьем" и вспомнил о чем-то важном.

Я тоже составлял (видимо, как и многие) чек-лист hard-скиллов, инструментов, умений, навыков, которыми нужно владеть, чтобы быть хорошим аналитиком. Заглянул в этот список - не везде стоят галочки и сейчас.

Потому что нам (человекам), наверное, не нужно прямо сейчас уметь и помнить все (собеседование - сильно условное исключение), а намного важнее скилл под названием умею все уметь, который подразумевает возможность в кратчайшие сроки овладеть новыми навыками, инструментами.

И, конечно, нет проблемы, что я не работал, например, с Plotly или оракловой бд, ведь все это я буду знать и уметь уже завтра... И этот скилл умею все уметь можно и нужно "продавать" на том же собеседовании, так как нанимающая сторона такие вещи очень ценит.

Ну и ссылочка на фильм, конечно
Недавно в BigQuery появилась шикарная фича - граф выполнения запроса. Это может быть очень полезно, если у нас есть сложное вью, которое, в свою очередь обращается к другим таблицам или вью. Таким образом видим всю логику запроса. Год назад это мне могло сэкономить немало часов работы c Miro
Forwarded from Sbergile NEWS
🔥 Уже завтра состоится Sbergile Talks Pro!

Мы заканчиваем последние приготовления, и очень-очень ждем вас.

Вчера мы вспоминали, как прошла конференция в 2020 году, а сегодня предлагаем погрузиться в атмосферу прошлогоднего мероприятия!😏

📹 Все выступления Sbergile Talks 2021:

Sbergile Talks 2021: Сцена 1
Sbergile Talks 2021: Сцена 2

Ждем вас завтра в 10:00 на сайте promo.sber.ru/stpro22/
🤔Что общего у бортпроводников, хирургических бригад и успешных специалистов по анализу данных? Все они используют читлисты. Читлисты – это шпаргалки, в которых собраны базовые действия. Несмотря на то, что каждая операция, каждый проект и каждый полет имеют свои особенности, во всех этих вещах есть необходимые основные шаги.

Мы собрали для вас шпаргалки по Python для анализа данных, чтобы вам не пришлось тратить время на поиск банальных функций:

🔷 Numpy. Практически в каждом проекте по анализу данных есть вычисления с помощью этого модуля. Numpy помогает при работе с массивами, матрицами, операциями из линейной алгебры и другими математическими вычислениями. Сохраняйте шпаргалку по Numpy отсюда.

🔷 Scikit-learn. Полдключение этой библиотеки также встречается почти во всех работах по машинному обучению. Scikit-learn выручает в случаях, когда надо использовать алгоритмы ML. Он предоставляет выбор эффективных инструментов, включая регрессию, классификацию, кластеризацию, подбор гиперпараметров, метрики и оценки и снижение размерности. Читлист по scikit-learn можно найти здесь.

🔷 Pandas. Эта библиотека была создана с целью упростить работу с данными. Pandas облегчает выполнение трудоемких и повторяющихся задач, в том числе: очистку данных, масштабирование, объединения, проверки значений, визуализацию и статистический анализ. Шпаргалка лежит здесь.

🔷 Matplotlib. Эта библиотека отвечает за визуализацию данных и считается самой распространенной среди специалистов по DS. Отрисовка графиков, диаграмм, пайчартов, точечных спектров с уникальным стилем, подписями, легендами и возможностью сохранения в любом удобном формате – весь этот функционал доступен благодаря Matplotlib. Краткий список по этому модулю забираем отсюда.
Многие, наверное, знают, что начался Кубок мира по футболу. Зимой, потому что в Катаре только в это время можно не сразу умереть на поле.
Ну так вот - Фифа будет предоставлять продвинутую статистику и аналитику по матчам, отдельным игрокам. Как в во время трансляции, так и после игры. Поставщики данных Sportec Solutions / Deltatre и Chyronhego / Tracab.
В спорт в целом и в футбол в частности все глубже и шире заходят данные, а не только вот эти вот ТТД, пробег, владение.
https://www.fifa.com/technical/football-technology/media-releases/fifa-to-introduce-enhanced-football-intelligence-at-fifa-world-cup-2022-tm
Тинькофф приглашает продуктовых аналитиков на онлайн-митап 📊

Встречу проведут эксперты Тинькофф, EXPF и Ozon Fintech. Команды расскажут:

— для чего и как создавали собственную A/B-платформу в Тинькофф;
— как построить работу с метриками в формате сервиса;
— как обеспечивают стабильную аналитику при нестабильной инфраструктуре в Ozon.

🗓 Онлайн-митап пройдет 30 ноября. Начало в 18:00. Регистрируйтесь на странице встречи: https://o.tinkoff.ru/meetup_product_analytics

Кстати, EXPF несколько раз в год проводит аналитические митапы вместе с партнерами и друзьями из индустрии. Подробнее о встречах можно прочитать на сайте.