karpov.courses – Telegram
karpov.courses
27.7K subscribers
1.59K photos
5 videos
8 files
1.19K links
Школа DATA SCIENCE для любого уровня подготовки. Учим актуальным навыкам с акцентом на практику

Программы: https://to.karpov.courses/Vy4YuQ
Чат по DS и ML: @karpovcourseschat

Регистрация в РКН: https://gosuslugi.ru/snet/67b592291bca1d7fe17570a8
Download Telegram
NB! Специальное предложение:

Для студентов первого потока будут особые опции:
– Бесплатное продление прохождения курса на 2 месяца, если почувствуете, что вам нужно больше времени на обучение
– Доступ к обновлениям в течение года, если в программе произойдут изменения.
Вчера произошел анонс долгожданного курса по машинному обучению!

Подробно ознакомиться с программой можно не только на сайте, но и в небольшом видео от команды ML. Каждый преподаватель рассказывает о своем модуле на курсе: его технических аспектах, в чём уникальность, как используется в мировых IT-гигантах, и даже сколько времени вам понадобится на освоение блока. Must see!
Если вдруг вы пропустили...
Наши выпускники уже вовсю покоряют просторы IT, применяя полученные на курсе знания в работе, и готовы делиться своими историями! Первым о смене своего карьерного пути расскажет Игорь Синицын, студент 3 потока, который получил оффер аналитика данных, еще даже до конца обучения:
Совсем недавно мы радовались годовщине Karpov.Courses и даже подводили итоги, а сейчас уже и календарный год заканчивается. Наша команда уходит на каникулы, а чтобы вы вдруг не заскучали – собрали подборку наших лучших материалов за этот год. Сохраняйте!
Интервью с Марией Жавадовой

Одно из наших первых интервью, которое собрало невероятный отклик для наших первых шагов в ведении этого сообщества! Мария рассказывает о своем опыте работы Product Manager'ом ВКонтакте и дает советы для junior-аналитиков.

Топ 5 книг по аналитике

Алексей Никушин поделился с нами книгами, которым стоит уделить внимание при изучении математики и анализа данных.

Статья «Как правильно оформлять таблицы в Jupiter Notebook»

Прямое руководство о видоизменении таблицы в Jupyter Notebook, чтобы все таблицы в ваших документах были красивыми и понятными :)

Вебинар «Как не запутаться в статистических методах»

Теплая и ламповая лекция о статистике с Анатолием Карповым (куда ж без него!). Разбираемся с основным набором статистических методов и рассматриваем случаи применения каждого из них.

Подборка игровых тренажеров для аналитика данных

Геймификация – крутой тренд, который не стоит обходить стороной, поэтому мы собрали 6 игр для улучшения своих скиллов в анализе данных.
Всем привет! На связи Анатолий Карпов.

Этот год запомнится нам надолго. Уверен, что не только дистанционкой и защитными масками :) В 2020 году мы с командой запустили большой курс по анализу данных и даже успели анонсировать долгожданный ML. Записали несколько десятков часов лекций и ответили на тысячи сообщений в чатах поддержки. Переживали за каждый новый поток. Радовались, когда наши выпускники делились своими успехами, которых они смогли достигнуть с новыми знаниями. Словом, провели 2020 невероятно насыщенно!

Спасибо, что вы с нами. Дальше только круче.

С Новым годом. Ура!
Всем привет!

Команда karpov.courses постепенно выходит с каникул. Этот год мы начинаем сразу с небольшой задачки как первой разминки в новом году:

Вам пишет новый заказчик. Всё традиционно: молодой развивающийся бизнес, клиентура понемногу растёт, интересен прирост клиентов через три месяца. Дополнительный подвох: заказчик переживает за своих старых клиентов. Он заметил, что некоторые из них перестают пользоваться услугами бизнеса. Запрос принимает следующий оборот:

● Сколько старых клиентов останется у него через эти три месяца?
● Какие клиенты с большей вероятностью перестанут пользоваться его услугами к этому времени?
С помощью какого метода анализа можно получить ответ на подобный вопрос?
Anonymous Poll
12%
Сложная линейная модель
44%
Анализ выживаемости
31%
Анализ временных рядов
12%
Кинуть монетку
Каждую неделю мы рассказываем о команде karpov.courses. Сегодня – о Романе Бунине, руководителе команды визуализации Яндекс Go и преподавателе модуля «Визуализация».

Перед тем, как прийти к визуализации данных, Роман сменил две профессии: инженера и бизнес-консультанта. Перегорев от больших компаний, он решил попробовать себя в IT — прошел курс по визуализации на d3.js и завел блог Reveal the Data, чтобы попасть в Лабораторию данных. Программистом устроиться не удалось, зато там же стал руководителем проектов по визуализации :) Крупный проект в Лаборатории, потом – управление BI-продуктом в Фармакей, и вот руководитель аналитики Яндекса находит блог и приглашает пообщаться. Сейчас Роман руководит командой визуализации в Яндекс Go и говорит, что из трех профессий нынешняя — самая интересная.

На специализации «Аналитик данных» Роман Бунин читает лекции модуля «Визуализация», где учит представлять результаты работы в зависимости от задач, данных и требований заказчика.
Зачем же осваивать визуализацию новичку в дата аналитике? Отвечает наш лектор:

«Визуализация может использоваться для двух целей: анализировать данные или представлять результаты своей работы. В 80-90% случаев результат работы аналитика — графики или дашборды. Если они будут сделаны плохо, то общее впечатление от работы будет испорчено, какой бы крутой она ни была с точки зрения аналитики и данных. Поэтому важный навык для хорошего специалиста – это умение грамотно визуализировать данные и
аккуратно представлять эти результаты в виде интерактивных инструментов. Этому мы и учимся в рамках моего модуля. Конечно же, не обязательно знать все тонкости визуализации и BI, но базовые навыки дизайна и знание BI-систем — очень важны».
Каждый, кто искал работу, наверняка сталкивался с порталом HeadHunter и представляет, насколько тяжело там найти вакансию, подходящую по всем параметрам.

Николай Валиотти и Роман Бунин, преподаватель karpov.courses, создали дашборд на основе данных, полученных через открытый API платформы HH. Роман визуализировал информацию о вакансиях, подходящих для дата аналитиков, причем она обновляется в режиме реального времени. На основе этого дашборда можно понять, какие навыки ценятся больше всего на рынке. Например, сделать такие выводы, как:

● Больше всего вакансий в Москве и в Санкт-Петербурге. Тут же они лучше оплачиваются.

● Самые высокооплачиваемые должности: руководитель отдела аналитики (≈110 тыс. руб./месяц), инженер баз данных (138 тыс. руб./месяц) и директор по машинному обучению (250 тыс. руб. в месяц).

● Самые полезные навыки — владение Python c библиотеками pandas и numpy, Tableau, Power BI, Etl и Spark. Вакансий с такими требованиями больше всего и зарплаты в них выше. Удивительно, что для Python-программистов знание matplotlib ценится на рынке выше, чем владение plotly.

Как думаете, соответствуют эти выводы реальности или нет?

Полный код проекта доступен на GitHub, а тут подробно расписана техническая часть создания дашборда.
Сегодня у нас стартует первый в новом году и восьмой по счету поток специализации «Аналитик данных».

Однако еще есть шанс запрыгнуть в последний вагон! В честь 2021 года наша команда дарит скидку в 20 000 рублей на курс при полной оплате, которая действует только на этот поток до конца недели ;)

5 месяцев интенсивного обучения, 3 лекции в неделю и постоянная практика. Меньше, чем за полгода вы освоите новую профессию: напряженная программа позволит быстрее влиться в реальную работу и успевать за изменениями в индустрии. Лекции вы будете смотреть в записанном виде на платформе Stepik, а применять полученные знания – на настоящем вычислительном кластере с оперативной поддержкой нашей команды в Slack.

По результатам обучения у вас будет готовое резюме с необходимым набором hard skills для позиции аналитика. Лучших студентов мы рекомендуем в известные компании.

Подробнее программа курса описана на нашем сайте, а на почте student@team.karpov.courses мы ответим на все вопросы.

Будем рады увидеться на курсе!
Не одними аналитиками наполнена команда karpov.courses, поэтому сегодня мы познакомимся с рекрутером Яндекс.Маркета и по совместительству нашей преподавательницей, Алиной Дубоделовой.

Грамотная презентация навыков важна ничуть не меньше, чем их наличие. А кто, как не HR, может рассказать о самопрезентации на собеседовании? Алина занимается рекрутингом аналитиков в Яндекс.Маркете и любит делиться собственным опытом – так она и начала читать лекции модуля «Как искать работу».

Думаем, не должно возникнуть вопроса, зачем же это начинающему аналитику, но мы всё-таки спросили. Вот такой ответ мы получили:

«Благодаря этому блоку вы научитесь правильно общаться с рекрутером и нанимающими менеджерами, сделаете своё резюме привлекательнее, а также узнаете, как подготовиться к непосредственно собеседованию по аналитике».
Всем привет!

Совсем недавно мы решали задачку на анализ выживаемости.

Что ж, заказчик снова с нами! Розовый, бодрый, с несколькими магазинами и благодарностью. И задачей, конечно же. Выглядит всё просто – предсказать количество закупаемого товара (в штуках) в зависимости от ряда показателей. Первичный анализ показывает, что явных нелинейных связей не видать. Подозрения вызывает только сама предсказываемая переменная - она несколько асимметрична и с кучей промежутков по своей природе.
karpov.courses
Какой метод тут лучше всего подойдёт?
Итак, правильный ответ – GLM.

Почему именно так? Основная причина – характер распределения товаров. Когда речь заходит о счётных данных (сколько штук чего-либо), нормальное распределение может плохо их описывать. Как правило, подобные данные моделируют распределением Пуассона или отрицательно-биномиальным распределением. Простые линейные модели полагаются на нормальное распределение, а дисперсионный анализ – разновидность линейных моделей, поэтому первые два ответа вычёркиваем. Взять другое распределение позволяют GLM и GAM. Однако в задаче указано, что явных нелинейных взаимосвязей в данных не наблюдается, поэтому GAM – это перебор. Таким образом, остается только GLM, что и будет верным ответом.
Каждую неделю мы рассказываем о команде karpov.courses. Сегодня настала очередь Жанны Азизовой, продуктового аналитика ВКонтакте и преподавательницы модулей «Развитие продукта» и «Продуктовая аналитика».

Будучи студенткой 3-го курса Жанна осознала, что навык обработки и анализа больших данных универсален и дает неоспоримое конкурентное преимущество при поиске работы. Университет дал глубокое понимание бизнеса, основ статистики и количественных методов, а также помог прокачать софт-скиллы. Однако hard skills добирались уже самостоятельно с помощью курсов или интернета :) Больше всего опыта Жанна получила во время работы в юридическом маркетплейсе Правовед на 4 курсе, а за новыми знаниями она отправилась уже в англоязычную магистратуру Высшая школа менеджмента СПбГУ, откуда и попала во ВКонтакте.

На специализации «Аналитик данных» Жанна формирует продуктовое видение, учит глубокому восприятию бизнеса и продукта, а также рассказывает, как показать ценность аналитика для бизнеса.
Зачем изучать продуктовую аналитику начинающему специалисту? Отвечает преподавательница модулей:

«Подавляющая часть вакансий аналитиков – это вакансии непосредственно про продуктовую аналитику, а точнее про умение помогать продуктовым командам принимать решения, позволяющие драйвить ключевые метрики продукта. Продуктовый аналитик – правая рука продакт-менеджера, поэтому помимо знания того, какие метрики и как нужно считать, аналитик должен понимать, как мыслит продакт и что из себя представляет процесс управления продуктом. Модули «Развитие продукта» и «Продуктовая аналитика» рассчитаны на то, чтобы помочь понять как устроен продукт, как строится работа в команде и как использовать данные для помощи команде в росте и улучшении продукта».
Знаете, чем отличается код аналитика от кода разработчика? Код аналитика должен сработать хотя бы один раз!:) Но, шутки шутками, а навык писать хороший и понятный код – большой плюс для аналитика! А знание основ Git как раз поможет нам в освоении этого навыка.

На вебинаре «Введение в Git» с Анатолием Карповым, основателем karpov.courses, мы сделаем еще шаг на пути к идеальному коду, а именно:

● Узнаем, зачем аналитику знать Git
● Обсудим и научимся базовым командам
● Поработаем в командной строке
● И, конечно же, хорошо проведем время!

Ждем всех желающих как на знакомство с основами, так и на обновление имеющихся знаний!

Эта среда, 27 января, в 19:00

Запись на вебинар