Junior Data Analyst – Telegram
Junior Data Analyst
501 subscribers
235 photos
12 videos
41 files
434 links
Джунам и не только подборки полезных ссылок.
- SQL
- Визуализация, Tableau
- Продуктовая аналитика
- Вакансии
- Книги
- Мемчики:)
Download Telegram
Forwarded from Start Career in DS
​​🅰️🅱️ Топовая книжка про А/B тесты

Про многие аспекты А/B тестов обычно не пишут в учебниках, и один из лучших способов обучения - читать кучу статей по экспериментам.

Но вместо пласта статей можно прочитать книжку, которую сильно рекомендовал Никита Маршалкин в интервью на тему A/B тестов для karpov.courses. (кстати, очень советуем посмотреть)

В ней рассказывают:
— Как выстраивать культуру А/В тестов
— Как их проводить
— Про нетворк-эффекты
— Как оценивать long-term
— В каких случаях какую статистику стоит применять
… и еще кучу полезного

Вот ссылочка на диск с книгой:
читайте и тыкайте огни 🔥 на этот пост (давайте набьем 150?)
🔥6
Forwarded from Start Career in DS
🎣 Что такое z-score и p-value?

Об этом на примере рыбалки (😁) классно рассказывается вот в этой статье, время прочтения ~20 минут

Главный герой, Антон, решил затестить две удочки; на обе он поймал по 300 экземпляров рыб. Кроме того, для каждой рыбы Антон записывал её вес. Теперь он хочет определить, какая из этих удочек эффективнее

В статье автор:
– Немного рассказывает о нормальном распределении
– Буквально на рыбах , используя SciPy, показывает, как выглядит центральная предельная теорема в действии
– Рассказывает про z-score и p-value и высчитывает их для приведённого выше примера
– Это всё подкрепляется графиками, построенными с помощью seaborn и кодом к ним. Причем код имхо будет понятен даже новичкам)

Ставим огонечек 🔥 на этот пост (давайте наберём 70?) и отправляемся читать статью🙂
🔥1
Задачка с собеса #python #собес

Даны список целых чисел a и число b. Удалите из a первое и последнее вхождение b.

Пример:

a = [3,5,8,9,3,5,7,9]
b = 5

> a = [3,8,9,3,7,9]

*ответ завтра вечером напишу :)
👍2
Forwarded from Борзило (Юрий Борзило)
📌 БОЛЬШАЯ ПОДБОРКА МАТЕРИАЛОВ ПО АБ ТЕСТАМ

1. Описательная статистика и проверка стат гипотез

Курсы:
1. Курс Карпова по основам статистики часть 1
2. Курс Глеба Михайлова вероятность и статистика
3. Курс Филиппа Ульянкина
4. Основы статистики и АБ тестирования от ЯП

Описательная статистика
1. Математическое Ожидание, Дисперсия, Стандартное Отклонение за 5 минут
2. Распределение в статистике за 5 минут
3. Нормальное распределение за 6 минут
4. Совокупности их параметры и статистики за 8 минут
5. Введение в биномиальное распределение
6. Как использовать биномиальное распределение в эксель
7. Стандартная ошибка среднего

Проверка стат гипотез
1. Что такое проверка статистической гипотезы
2. Объяснение p-value
3. Математика в АБ тестах. Что такое z-score и p-value
4. Карта статистических методов
5. T критерий стьюдента
6. История одного обмана или требования к распределению в стат тестах
7. Двусторонние проверки гипотез
8. Практическое руководство по стат методам от VK
9. Хи 2 для проверки стат гипотез
10. Оценка статистической мощности

2. База по АБ тестам
1. Прикладные задачи анализа данных. АБ тестирование
2. Как и зачем оценивать размер выборок
3 Как подготовить и провести АБ тест, базовый роадмэп
4. АБ тестирование как сделать так, чтобы оно заработало
5. Бутстреп и АБ тестирование
6. Когда останавливать АБ тесты ч1
7. Когда останавливать АБ тесты ч2
8. Эксперименты и математическая статистика
9. АБ-тест для долей, MDE, ошибка 1-2 рода, как найти число наблюдений для АБ-теста
10. Сплит тесты, когда речь идет о деньгах
11. Статистика в АБ мифы и реальность
12. Воркшоп "Лезем в данные самостоятельно"
13. 15 минут статистики: как делать выводы из АБ-тестов
14. АБ тесты и как мы их готовим
15. Bootstrap: виды, особенности, ограничения и способы применения (EXPF)


3. Методы ускорения АБ тестов
1. Как улучшить ваши A/B-тесты: лайфхаки аналитиков Авито Часть1
2. Как улучшить ваши A/B-тесты: лайфхаки аналитиков Авито. Часть 2
3. Методы сокращения дисперсии, и зачем это нужно
4. Стратификация. Как разбиение выборки повышает чувствительность A/B теста
5. CUPED увеличиваем чувствительность метрик
6. Увеличение чувствительности в АБ при помощи CUPED
7. 13 способов ускорить А/В тест, или "Не CUPED-ом единым"

4. Типичные ошибки в АБ тестах
1. Тонкости АБ тестирования проблема подглядывания
2. Малоизвестные грабли АБ
3. Подводные камни A/Б-тестирования или почему 99% ваших сплит-тестов проводятся неверно

Как вам?
Полезно - 👍
Такое себе - 👎
👍6
Forwarded from CodeCamp
Халява: там у Datacamp проходит неделя бесплатного обучения, в рамках которой можно залутать примерно 400 курсов по ИИ и анализу данных.

Особенно ценны курсы, которые учат использовать ChatGPT и другие нейронки для оптимизации собственной работы или вообще, позволяющие скинуть часть задач на ИИ.
Forwarded from Simulative
🔥 Марафон-подготовка к собеседованию на аналитика данных! 🔥

📢 Внимание, внимание!

Мы запускаем марафон-подготовку к собеседованию на позицию аналитика данных! 📊

Что это такое?

От студентов Симулятора собеседования аналитика мы собрали большой фидбек, где выяснили, что почти всех объединяют несколько пунктов:
- не проходят собеседования из-за недостатка знаний и отсутствия практики в решении коммерческих задач;
- накрывает волна неуверенности и волнения на интервью - в итоге с треском проваливаются на простых вопросах;
- не умеют “продавать” себя и упаковывать свой опыт.

🎯 Наша задача - помочь вам преодолеть все эти преграды. Поэтому на марафоне мы уделим особое внимание этим проблемам, а также разберем настоящие задачи, вопросы и тестовое задание для прокачки ваших hard-skills.

📆 Марафон стартует 14 сентября. И продлится 5 дней.

Что будет на марафоне:

Сможете оценить свои собственные компетенции и грейд.
Разберете популярные вопросы с технических собеседований.
Порешаете задачи с собеседований в ТОП-компании.
Узнаете правила составления "продающего" резюме.
Разберете настоящее полноценное тестовое задание.


💪 Так что не упустите свой шанс на успех! Присоединяйтесь к марафону и станьте настоящим профессионалом в сфере аналитики данных.

🔗 Запись на марафон по ссылке: https://r.bothelp.io/tg?domain=marafon_interview_bot&start=c1694085133962-ds&utm_source=telegram&utm_medium=itresume
Forwarded from girlsplaining ml
ресурсы, по которым я готовилась к собеседованиям

👾 учебник по ml от шад: хороший математичный учебник, все базовые темы точно покрывает (и даже чуть больше), но может быть сложным для совсем новичков

👾 курс по алгоритмам от cs центра: очень здорово, понятно и с примерами рассказывается база алгоритмов — это маст

👾 карточки на литкоде: здесь уже можно решать задачки на алгоритмы и структуры данных — в карточках все агрегировано по темам, можно идти по очереди

👾 вопросы по питону: питоновская теория, мне задавали некоторые вопросы из списка на собесах

👾 nlp for you от лены войта: это уже специализированно для моей сферы в ml — nature language processing. мой любимый интерактивный учебник!

в целом, это все. математику я не повторяла (и, если честно, не знаю, как ее быстро повторить можно)

я готовилась чуть больше месяца, но, чтобы хорошо подготовиться, времени нужно больше точно, потому что на собеседованиях спрашивают все очень подробно и у всех свои требования 🤧
🔥2
Forwarded from Simulative
🔥 Базовая Шпаргалка по Pandas 🔥

Pandas - один из самых основных и важных инструментов для работы с данными в Python. Он предоставляет множество удобных функций для загрузки, обработки, и анализа данных.

Мы собрали шпаргалку, в которой все основные функции, которые пригодятся вам в повседневной работе с Pandas:

Импорт данных: Загрузка данных из разных источников.

Исследование данных: Ознакомление с данными, просмотр первых и последних строк, получение информации о типах данных.

Извлечение информации из датафреймов: Выбор столбцов и строк, выполнение различных операций.

Добавление и удаление данных: Добавление новых столбцов и строк, удаление лишних данных.

Фильтрация: Выбор данных по условию, множественные условия.

Сортировка: Сортировка данных по столбцам, множественная сортировка.

Агрегирование: Группировка данных, вычисление статистических показателей, подсчет уникальных значений.

И для удобства мы сделали для вас notebook 😊

Сохраняйте и пользуйтесь 👇

https://colab.research.google.com/drive/1XOF8oQB3kzs0Yxt17XdtGy8IFNudvp4c?usp=sharing

Если у вас есть какие-либо дополнения, не стесняйтесь оставлять в комментариях! 🐼

#python #pandas
👍1
Data Analysis From S... by Peters Morga.pdf
2.8 MB
Книга "Анализ данных с нуля с помощью Python: руководство для начинающих с использованием Python, Pandas, NumPy, Scikit-Learn, IPython, TensorFlow и Matplotlib"
👍1
В Karpov.courses действительно оч хорошие курсы (я прошла 3:))
Райф ищет стажера bi-аналитика