Junior Data Analyst – Telegram
Junior Data Analyst
501 subscribers
235 photos
12 videos
41 files
434 links
Джунам и не только подборки полезных ссылок.
- SQL
- Визуализация, Tableau
- Продуктовая аналитика
- Вакансии
- Книги
- Мемчики:)
Download Telegram
Вопросы по питону HR задают редко, часто они про типы данных, могут быть мини задачки

Python

- типы данных в питоне (какие изменяемые, какие нет)

- в чём разница между списком и кортежем?

- есть список a = [1, 2, 3, 4, 5, 6]. Что выведет a[-3:-1]?

- какие типы данных могут использоваться как ключ в dict (Python)?
4
Статистика, теорвер, аб-тесты (вопросы от HR)

- методы оценки статзначимости, которые использовали и почему?

- что такое сплит-тестирование?

- какие виды распределений знаете? распределение Бернулли

- чему равна медиана [4, 1, 2, 3]?

- кидаем 5 раз монетку: какая вероятность, что 3 раза подряд с самого начала выпадет Орел?

- мы провели 1000 А/А-тестов, брали порог значимости в 5%. Сколько раз мы должны увидеть ложные прокрасы?

- что такое ошибка I и II рода? MDE?

- что такое p-value?

- отметьте верные утверждения о p-value.
A) 1 - (Вероятность того, что повторный тест приведёт к тому же решению)
B) Это вероятность при справедливости нулевой гипотезы получить значение
статистики, такое же или ещё более экстремальное
С) Вероятность истинности нулевой гипотезы
D) Вероятность истинности альтернативной гипотезы

- от чего зависит размер выборки, необходимый для эксперимента?

- от чего зависит длительность эксперимента?
5
Forwarded from Simulative
Приглашаем на 3 поток бесплатного курса по Pandas 🔥

Вчера мы поделились с вами лайфхаком, который рассказывали на мастер-классе в рамках 2 потока нашего бесплатного курса по Pandas. А сегодня мы стартуем набор на 3 поток!

🔗 Записаться на поток: ссылка

На бесплатном курсе по Pandas вас ждет:

- Подробные видео лекции по Pandas
- Практические задания и бизнес-кейсы (ABC/XYZ-анализ, автоматизация финансовой отчетности и т.д.)
- Закрытый мастер-класс
- Общение в чате со студентами и преподавателями

В общем, будет круто! Новых потоков в ближайшее время не будет, поэтому записывайтесь по ссылке - давайте проведем время с пользой! 🙂

🔗 Записаться на поток: ссылка
👍1
Задачка с собеседования на вероятность

Два игрока по очереди бросили два кубика (стандартные кубики, от 1 до 6).
Найдите вероятность того, что в результате у них выпала одинаковая сумма очков, равная 5 или 6, на кубиках.

#теорвер #матан_собесы
2
Задачки с собесов на python

1. Есть два словаря: рецепт пирога и запасы. Написать функцию, которая будет определять, сколько можно испечь пирогов из имеющихся запасов

recipe = {'bread':1,'sugar':10, 'salt':100, 'milk':50}
storage = {'bread':10,'sugar':1000, 'salt':510, 'milk':270}

2. В переменной х уже сохранено целое положительное число. Вычислите x + x0x0x. Результат сохраните в переменную result.

То есть, если x = 2, то нужно вычислить 2 + 20202

3. В переменной m хранится целое положительное число — продолжительность сна в минутах. Если продолжительность сна составит от 7 до 9 часов включительно, то в переменную optimal_sleep_duration сохраните значение True. В противном случае присвойте это переменной значение False.

#python #python_собесы
3
Задачка с собеседования на SQL
#sql #sql_собесы

Мы хотим найти магазины, в которых низкая частотность следующего заказа. Для этого нужно посчитать, сколько времени проходит между заказами в магазине.

Задачка:

Найдите магазин, где среднее время разницы между заказами в часах было наибольшим. Все это нужно проделать для клиентов, которые имели хотя бы 3 заказа в нашем сервисе.

Ожидаемый результат:

id магазина. Если магазинов с таким значением несколько, то нужно вывести все id.

Какие данные использовать:

- Используйте таблицу orders
- Id заказа - id
- Id пользователя – user_id
- Id магазина – store_id
- Дата / время доставки заказа – shipped_at
2
Задачка с собеседования на SQL
#sql #sql_собесы

Вывести клиентов, совершивших покупки во всех категориях и их доли трат в каждой категории от общей суммы трат
3
Forwarded from AvitoTech
Топ-7 материалов по аналитике здесь и сейчас.

✔️ Apache Spark и PySpark для аналитика. Учимся читать и понимать план запроса в SparkUI

Статья Саши Ледовского о сути и важности планов запроса.

✔️ Анализ пользовательского негатива от CRM коммуникаций

Видеодоклад Ани Москаленко о том, как определять цену отписки от CRM коммуникаций.

✔️ Продуктовому аналитику: 7 методик, чтобы находить кратные точки роста продукта

Статья Дениса Пехтерева о том, где искать новые идеи для продуктов. И бонус: список профессиональных телеграм-каналов.

✔️ Как мы в Авито открыли школу тимлидов аналитики и за 3 месяца подготовили 15 будущих руководителей

Мемуары Стаса Косилова о том, как создавалась образовательная программа для подготовки менеджеров.

✔️ Как нанять или вырастить тимлида: гайд от руководителя аналитики Авито

Инструкция Глеба Белогорцева про то, как определить качества идеального тимлида, а затем найти именно такого.

✔️ Как устроена «Академия Аналитиков Авито»

Рассуждения выпускницы Академии Жени Мурзаевой о процессе обучения и о том, как у ААА получаются настоящие профи.

✔️ Как устроиться аналитиком в «Авито»

Лайфхаки от руководителя Ирины Вовк в формате статьи и видео с подборкой полезных материалов.

P.S. У нас прямо сейчас открыто несколько аналитических вакансий. Читайте, готовьтесь, и ждём на интервью.

#analytics_avitotech
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Это оч хорошая книга по датавизу)
Forwarded from Чартомойка (Aleksandr Bogachev)
⚡️Книга продаётся!

Книга начала постепенно развозиться по книжным магазинам. Где-то уже появилась, где-то небольшая поставка, в течение недели постепенно появится во всех крупных магазинах.

Вот тут в Озоне стоит недорого (не знаю много ли там экземпляров):
https://www.ozon.ru/product/grafiki-kotorye-ubezhdayut-vseh-2-e-dopolnennoe-i-pererabotannoe-izdanie-bogachev-1383550700

Не обращайте особого внимания на "переработанное" издание. Оно примерно такое же, только обложка новая 😜

В связи с этой позитивной новостью в канале тоже изменения. По вашим просьбам добавлены многочисленные реакции 😈 и комментарии(!). Велкам!

Пожалуйста, напишите, в комментах, если книга еще где-то продается.

UPD. Проверять цены в разных магазинах можно тут: https://ast.ru/book/grafiki-kotorye-ubezhdayut-vsekh-2-e-dopolnennoe-i-pererabotannoe-izdanie-874030/
3
Forwarded from Maksim Simanov
🆕 В Тинькофф Страхование ищем Jun/Jun+ Продуктового аналитика. У тебя будет ментор, который пройдет с тобой путь становления крутым аналитиком.
Проект: запуск новых экосистемных страховых продуктов.

1️⃣ Что ты будешь делать?
• делать дизайн экспериментов для A/B тестов и интерпретировать результаты;
• предоставлять команде понятные дашборды с продуктовыми метриками;
• помогать команде принимать верные бизнес решения на основе данных.

2️⃣ Какие пожелания к кандидату?
• знание математической статистики и теории вероятностей;
• навыки работы в системах визуализации;
• крепкие знания языков SQL-like;
• опыт проведения и обсчета А/Б-тестов (или хотя бы понимание, как работать с небинарными метриками);
• образование (МГУ мехмат/физфак, МФТИ, ВШЭ экономика/математика, МГТУ им.Баумана);
• будет плюсом опыт программирования на Python.

3️⃣ Что еще важно знать?
• из Грузии, к сожалению, не поработать. Гибрид в Москве, через несколько месяцев переезжаем в новый офис на Белорусской;
• из плюшек шведский стол на завтрак и обед, свой зал с тренером, обучение, крутые работяги вокруг, ДМС

Вопросы, резюме и подарки сюда → @jsimonj 💛
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Forwarded from AvitoTech
Дата-сайентистам приготовиться: мы начали набор на оплачиваемые стажировки.

Чтобы подать заявку, жмите прямо на этот текст

Если вы ещё здесь, воспользуемся моментом и добавим: стажировка длится 6 месяцев. Это полгода полной занятости в крутой команде. Точнее — в одной из четырёх крутых команд: Авито Авто, Автоматическая модерация, Репутационная система или Large Language Models.

Стажировка подходит тем, кто:

1️⃣ знает базу по CNN, градиентному бустингу, трансформерам;
2️⃣ умеет работать с PyTorch, Pandas, sklearn, CatBoost;
3️⃣ может написать функцию на Python на 30–40 строк за 20 минут;
4️⃣ будет работать 40 часов в неделю;
5️⃣ готов периодически появляться в нашем офисе в Москве.

Подходит? Нажимайте на текст. Ждём ваши отклики до 31 января.

Удачи на интервью!

#avitostart
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Госпожа аналитик 💚 Ия Зотова (Ия Зотова️)
🧠 Групповое занятие по "Исследованию данных".
Набираю группу, которая хочет провести часок-другой за исследованием данных)

🖥 Как будет проходить занятие:
1. Заранее пришлю ecomm-датасет и тетрадку с небольшой теорией и набором заданий/вопросов
2. Вы решаете, гуглите, отвечаете на вопросы
3. Собираемся группой из 2-4 учеников и обсуждаем все вопросы и решение. Если будут дополнительные вопросы - готова так же ответить, если останется время

🖥 Уровень:
Начальный. Подойдет, если вам нужно структурировать знания по первичному исследованию и/или у вас есть вопросы по этой теме. Или вы вообще об этом никогда не слышали

🖥 Когда:
28.01.2024 (вск) 15:00 МСК (если наберется хотя бы 2 человека)
04.02.2024 (вск) 20:00 МСК

🖥 Продолжительность:
1-1,5 часа

🤑 Стоимость
• В группе: 2 500 р.
• При личной работе со мной: 3 500 р.
Оплата до старта занятия. Если группа не наберется: верну деньги или предложу апгрейднуть тариф и поработать лично😁

✍️ Пишите @IyaZotova
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Forwarded from Госпожа аналитик 💚 Ия Зотова (Ия Зотова️)
😊Собес в Яндекс

Волею судеб Брунгильду пригласили на собес в Яндекс. Для подготовки к собесу рекрутер скирнул целый гайд с рекомендациями по подготовке и примерами задач (ссылки ниже)

И так вышло, что она никогда не проходила контесты Яндекса (а в одной из статей была речь про него https://contest.yandex.ru/contest/8458/problems/). Поэтому пошла смотреть что это такое и пробовать.

Задачи в контесте были несложными, борьба была в основном с интерфейсом. Освоившись, Брунгильда решила зафиксировать основные моменты:
1. Первой строкой часто может идти количество данных, а не сами данные
2. Потоковое чтение по строке в конце строк содержит \n и выглядит так:
import sys 
j = sys.stdin.readline().strip()

а полностью поток можно считать сразу в массив так:
j = sys.stdin.readlines()

Не забудьте, что там тоже будет \n в конце строк

3. Интерпретатор ломается на tab'ах и нужно делать 4 пробела вместо этого (если кто-то знает другой лайфхак - памагите)

4. Не получится промежуточные варианты как-то отладить. Пришлось это делать в соседнем блокноте. В общем-то дисциплинирует сразу писать нормально

5. Желательно не плодить переменных и лишнего не сохранять - инчае может быть переполнение памяти или перелимит времени выполнения

——-
Фух, кажется, все... Ниже ресурсы для подготовки:

• LeetCode — для практики в решении задач на
написание кода (уровень easy/medium);

• Разбор задач на youtube:
https://www.youtube.com/watch?v=0yxjWwoZtLw
https://www.youtube.com/watch?v=zU-LndSG5RE

• Видеолекции курса «Алгоритмы и структуры
данных»
https://www.coursera.org/specializations/data-structures-algorithms/

• Статья «Знай сложности алгоритмов»
https://habr.com/ru/articles/188010/

и про алгоритмические секции
https://habr.com/ru/companies/yandex/articles/449890/

• Задачи по матстату и теории вероятностей от ШАД
https://academy.yandex.ru/dataschool/stepbystep

А еще где-то по перекрестным ссылкам Брунгильда нашла аналог литкода от Яндекса, наслаждайтесь: https://coderun.yandex.ru/catalog

✉️Кто проходил собес в Яндекс - делитесь в комментах, что было на собесе и как вы до него дошли?
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Forwarded from Simulative
Срочная новость - мы сделали для вас еще один бесплатный курс!

Больше всего за последний год у нас просили сделать именно курс по Основам языка Python. Курс подойдет абсолютным новичкам: мы с самого нуля шаг за шагом разбираем все темы - начиная от переменных и заканчивая работой с интересными модулями (например, для работы с Google Sheets).

Начать можно уже сегодня 👉🏻 https://simulative.ru/free-python

Курс максимально практикоориентированный - 10 глав, 100+ практических заданий, 3 бизнесовых проекта для портфолио. Все как мы любим 🙂

👉🏻 Записаться на бесплатный курс 👈🏻
Записывать в плюшки интересные задачи, конечно, такое себе, но здесь рассматривают джунов)
3
В Тинькофф нужны аналитики
2
смотрите, какие у меня наклеечки 😁🫶🏻
4
Forwarded from AvitoTech
Кажется, началось: стартовал приём заявок в Академию Аналитиков Авито.

Академия — это образовательная онлайн-программа на 13 месяцев для аналитиков данных и DS-инженеров. Лекции читают наши ведущие специалисты, а практика основана на актуальных задачах бизнеса. Ни на что не намекаем, но работая с реальными командами, студенты успевают себя зарекомендовать, а затем реализовать карьерные амбиции.

Чтобы получилось и у вас, нужно:
✔️ посещать все занятия (до 9 часов в неделю);
✔️ выполнять домашку, проекты и курсовые (от 6 часов в неделю);
✔️ сотрудничать с куратором и ментором;
✔️ давать обратную связь после каждого занятия.

Но сначала, конечно, нужно подать заявку и пройти отбор.

Удачи на вступительных! 🔥

#analytics_avitotech
Please open Telegram to view this post
VIEW IN TELEGRAM
2