Junior Data Analyst – Telegram
Junior Data Analyst
501 subscribers
235 photos
12 videos
41 files
434 links
Джунам и не только подборки полезных ссылок.
- SQL
- Визуализация, Tableau
- Продуктовая аналитика
- Вакансии
- Книги
- Мемчики:)
Download Telegram
Что спрашивают на собеседовании продакт аналитика в штат Тинькофф?

Уже подробно рассказывал про начало карьеры в Тинькофф здесь, но камрады постоянно просят расшарить вопросы второго технического собеседования. Не могу отказать своим любимым подписчикам, которые постоянно делятся моими постами и пиарят мои каналы друзьям. Все ради вас!

1. Есть база данных с одной таблицей из 9 строк (5 строк связанна с авторами, 4 с постами). Надо ее оптимизировать (разделить на 2 для оптимизации скорости и памяти, так как авторов намного меньше чем постов, поэтому будет выигрыш).
Это простая задач на декомпозицию. Декомпозиция может быть на уровне таблиц, а может быть на уровне баз данных, а также на уровне кластеров баз данных.
Основная цель декомпозиции сделать из сложного что-то мелкое и простое. Нашу задачу можно решить несколькими способами, например:
а) создать дополнительную таблицу и в неё переместить посты, удалить посты в исходной таблице
б) Можно создать две таблицы: посты и авторы. Переместить в них дату и дропнуть исходную (мало живой сценарий, но видел что так делают)

2. Разговор про графики и визуализацию.
Графики можно разделить на нормированный и масштабируемый. Формально не всегда так, но когда объясняем вопрос бизнесу нужно идти наиболее простыми путями. Если график нормированный (условно от нуля до единицы, или в миллионах), то важно чтобы бизнес понимал происходящее: почему так, зачем так, чтобы что так и другие подобные вопросы. Этот вопрос обычно решается двумя путями. Либо у бизнеса и так есть минимальная теор подготовка, либо нужно сделать преамбулу с объяснением. Не нормированный график, когда например значение у нас может лежать на всей числовой прямой. Тут важно больше помахать руками. В основном графики строятся от двух переменных: признака и целевой переменной (таргет). На практике же нужен всего один признак, ну максимум два, НО тут проблема с менеджментом: в этом случае им придётся думать, разбираться, а обычно они это не любят и опираются на эмоции, поэтому используем только одну, чтобы не нагружать трёхмерными картинками. Также можно рисовать картинки с тем как таргет метрика меняется с течением времени.

3. Разговор про метрики.
Метрики могут быть вообще разными: поюзерные (их можно считать многими способами: отношение, линейная комбинация и т.д.), метрика по всей выборке, метрика относительно какого-то события от пользователя и т.д. Все бизнес, и не только, метрики, типа CTR или конверсии, лучше всего найти в инете и заучить. Еще нужно быть готовым к тому, что интервьюер или просто джун менеджер любую изменчивую величину назовем метрикой, что очень часто не так.

4. Разговор про a/b тесты, как готовить выборки людей через критерии гомогенности и как потом проверять результат на стат значимость.
В классическом дизайне нужно выдвинуть гипотезу (некоторое бизнес утверждение/инициативу). Чтобы не растрачивать деньги зря, необходимо проверить на небольшой аудитории (выборке), которая будет очень похожей/схожей относительно всей генеральной совокупности (выборка должна быть репрезентативной). Тут можно использовать стратификацию, критерии согласия, визуальную схожесть, хэширование (солить, что-то питерское) и т.п. После формирования выборки разбиваем на две группы и проверяем на однородность (гомогенность, есть специальные тесты на равенство дисперсий). Запускаем тест. Останавливать тест можно по-разному: через MDE, если у нас нормальное распределение, через выверенное бизнес время. Затем проверяем гипотезу о том что значение метрики на тесте и контроле равны с нужным уровнем значимости. Если знаем распределение то используем параметрический тест, если не знаем то тут непараметрический тест.

Также не забываем про наши курсы, дающие настоящую базу, которая позволит щелкать такие вопросы как орешки!
1
Forwarded from 🗞 Виз Ньюз (Nikita Rokotyan)
Media is too big
VIEW IN TELEGRAM
🤯 В ChatGPT завезли фунционал, который может запускать код, и, как следствие, анализировать и визуаилизировать данные.

Я решил на пробу скормить ему данные с Екатеринбуржской метеостации за последние 140 лет, которые хранятся не в самом легкочитаемом формате. И затем спросить, что можно понять по этим данным, а также попросить построить графики. И тут началось самое интересное!

ChatGPT долго не мог понять формат данных, но продолжал самостоятельно пробовать разные подходы, что бы их прочитать, а я просто сидел и несколько минут наблюдал за его потугами. И вдруг с 18 попытки у него получилось! Он нарисовал графики среднемесячных значений температуры и количества осадков за поледние 10 лет.

Вишенкой на торте стало то, что когда следующим шагом я попросил его нарисовать климатические полоски (climate stripes) за последние 100 лет, ChatGPT уже зная, как читать такие данные, справился очень быстро, да еще и рассказал об истории этого графика и как его читать! Можно сравнить с аналогичными графиками, которые я делал пару лет назад: https://news.1rj.ru/str/dataviznews/378

На видео к посту привожу весь процесс. Впечатляюще!
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Start Career in DS
👨‍🏫 Что ботать, чтобы пройти на стажировку аналитиком в Яндекс?

Вообще, на страничке young&&yandex есть полезные ссылки на годные материалы для бота. Давайте дополним их, пройдёмся по каждой теме, которую надо будет выучить, и накидаем полезных материалов:
SQL:
тренажёр на stepik, дальше первых двух блоков можно не решать, а приступать к пункту ниже
sql-ex - нарешиваем задачки отсюда
– читаем документацию PostgreSQL
+ можно почитать классную статью с топом прикладных задач

Алгоритмы:
– читаем «Грокаем алгоритмы»
– решаем задачки отсюда, у каждой есть видеоразбор
– решаем алго-задачки с реальных собесов в Яндекс (правда не факт, что на должность аналитика) из этой таблички
– смотрим лекции от Яндекса по тренировкам 2.0 и 3.0

Теорвер:
курс на stepik от CSC, скорее всего всё отсюда не понадобится, но закладывает хорошую базу
– ищем и решаем задачки на problems.ru
– смотрим посты(раз и два) от Поступашек, материалы под ними и выборочно решаем задачки оттуда
+ любуемся красотой курса с этого поста

Статистика и A/B тесты:
– читаем «Статистику и котиков»
курс по статистике от CSC на stepik
очень полезный пост с материалами
– ещё один пост про А/Б тесты с материалами
+ 40-минутный понятный видос про A/B тестирование
+ легендарный канал StatQuest

Ещё:
– можно порешать задачки с coderun
– посмотреть посты с разборами Яндекс Контестов (раз и два)

Давайте наберём 150 огоньков 🔥 под этим постом?)
Тинькофф_Лекторий_про_любовь_между_продуктом_и_пользователем.pdf
39.8 MB
ЛЮБОВЬ В ПРОДУКТЕ - ТИНЬКОФФ!

На днях прошел лекторий о языках любви в продукте от Тинькофф Банка. Лекторий состоял из 4 лекций о том, как завоевать любовь клиента с помощью продуктовых решений. Посмотрел данные лекции на одном дыхании - много примеров из практики, много инсайтов и прекрасные спикеры. Рекомендую!

Список лекций:
1️⃣ Как работает мозг пользователя - Леонид Колыбин (лид направления геймификации и социальных механик)
2️⃣ Идеальное первое свидание - Владимир Тен (лид продуктов активации)
Феймворк первого свидания
3️⃣ Как бороться за внимание клиента - Владимир Посвянский (лид продуктов вовлечения)
4️⃣ Как позаботиться о клиенте - Петр Савостин (лид мобильных продуктов AI-Bank)

Также собрал все презентации спикеров в одном файле для быстрого освоения материала и чтобы он всегда был под рукой.
Наберем 25🔥, если было полезно для тебя?

#ТинькоффОбразование
OutOfScope | OOS
Please open Telegram to view this post
VIEW IN TELEGRAM
Коллеги, вакансия для джунов в твиттере) подробности и скидывать резюме там же :)
🤣2
Вот вы зря смеетесь :) в твиттере достаточно часто выкладывают вакансии ☺️
#теорвер #задачкассобеса

Представьте, что мы бросаем монетку 5 раз подряд. 4 раза выпал орел. Какова вероятность что и в пятый раз выпадет орёл?
Паша ищет добровольца :)
Forwarded from No Data No Growth | Pavel Bukhtik (Павел Бухтик)
Ищу добровольца на mock-собеседование на позицию продуктового аналитика в прямом эфире 🐳

Ваша реакция показала, что вам действительно интересно посмотреть на mock-собеседование в прямом эфире.

И любой из вас может стать его участником.

Это отличная возможность проверить свои навыки в А/Б тестировании, продуктовом мышлении, написании SQL запросов и решении задач на Python.

📝 Условия участия просты:

Напишите в комментариях к этому посту на Linkedin – “Хочу на mock-собеседование”, а также расскажите немного о себе, своем опыте и мотивации. Если сразу прикрепите свое резюме – будет идеально.

1 августа я выберу человека с наиболее интересным комментарием.

Дата эфира, как и сам эфир, будут на следующей неделе.)
Forwarded from Start Career in DS
​​🅰️🅱️ Топовая книжка про А/B тесты

Про многие аспекты А/B тестов обычно не пишут в учебниках, и один из лучших способов обучения - читать кучу статей по экспериментам.

Но вместо пласта статей можно прочитать книжку, которую сильно рекомендовал Никита Маршалкин в интервью на тему A/B тестов для karpov.courses. (кстати, очень советуем посмотреть)

В ней рассказывают:
— Как выстраивать культуру А/В тестов
— Как их проводить
— Про нетворк-эффекты
— Как оценивать long-term
— В каких случаях какую статистику стоит применять
… и еще кучу полезного

Вот ссылочка на диск с книгой:
читайте и тыкайте огни 🔥 на этот пост (давайте набьем 150?)
🔥6
Forwarded from Start Career in DS
🎣 Что такое z-score и p-value?

Об этом на примере рыбалки (😁) классно рассказывается вот в этой статье, время прочтения ~20 минут

Главный герой, Антон, решил затестить две удочки; на обе он поймал по 300 экземпляров рыб. Кроме того, для каждой рыбы Антон записывал её вес. Теперь он хочет определить, какая из этих удочек эффективнее

В статье автор:
– Немного рассказывает о нормальном распределении
– Буквально на рыбах , используя SciPy, показывает, как выглядит центральная предельная теорема в действии
– Рассказывает про z-score и p-value и высчитывает их для приведённого выше примера
– Это всё подкрепляется графиками, построенными с помощью seaborn и кодом к ним. Причем код имхо будет понятен даже новичкам)

Ставим огонечек 🔥 на этот пост (давайте наберём 70?) и отправляемся читать статью🙂
🔥1
Задачка с собеса #python #собес

Даны список целых чисел a и число b. Удалите из a первое и последнее вхождение b.

Пример:

a = [3,5,8,9,3,5,7,9]
b = 5

> a = [3,8,9,3,7,9]

*ответ завтра вечером напишу :)
👍2