karpov.courses
Какой метод тут лучше всего подойдёт?
Итак, правильный ответ – GLM.
Почему именно так? Основная причина – характер распределения товаров. Когда речь заходит о счётных данных (сколько штук чего-либо), нормальное распределение может плохо их описывать. Как правило, подобные данные моделируют распределением Пуассона или отрицательно-биномиальным распределением. Простые линейные модели полагаются на нормальное распределение, а дисперсионный анализ – разновидность линейных моделей, поэтому первые два ответа вычёркиваем. Взять другое распределение позволяют GLM и GAM. Однако в задаче указано, что явных нелинейных взаимосвязей в данных не наблюдается, поэтому GAM – это перебор. Таким образом, остается только GLM, что и будет верным ответом.
Почему именно так? Основная причина – характер распределения товаров. Когда речь заходит о счётных данных (сколько штук чего-либо), нормальное распределение может плохо их описывать. Как правило, подобные данные моделируют распределением Пуассона или отрицательно-биномиальным распределением. Простые линейные модели полагаются на нормальное распределение, а дисперсионный анализ – разновидность линейных моделей, поэтому первые два ответа вычёркиваем. Взять другое распределение позволяют GLM и GAM. Однако в задаче указано, что явных нелинейных взаимосвязей в данных не наблюдается, поэтому GAM – это перебор. Таким образом, остается только GLM, что и будет верным ответом.
Каждую неделю мы рассказываем о команде karpov.courses. Сегодня настала очередь Жанны Азизовой, продуктового аналитика ВКонтакте и преподавательницы модулей «Развитие продукта» и «Продуктовая аналитика».
Будучи студенткой 3-го курса Жанна осознала, что навык обработки и анализа больших данных универсален и дает неоспоримое конкурентное преимущество при поиске работы. Университет дал глубокое понимание бизнеса, основ статистики и количественных методов, а также помог прокачать софт-скиллы. Однако hard skills добирались уже самостоятельно с помощью курсов или интернета :) Больше всего опыта Жанна получила во время работы в юридическом маркетплейсе Правовед на 4 курсе, а за новыми знаниями она отправилась уже в англоязычную магистратуру Высшая школа менеджмента СПбГУ, откуда и попала во ВКонтакте.
На специализации «Аналитик данных» Жанна формирует продуктовое видение, учит глубокому восприятию бизнеса и продукта, а также рассказывает, как показать ценность аналитика для бизнеса.
Будучи студенткой 3-го курса Жанна осознала, что навык обработки и анализа больших данных универсален и дает неоспоримое конкурентное преимущество при поиске работы. Университет дал глубокое понимание бизнеса, основ статистики и количественных методов, а также помог прокачать софт-скиллы. Однако hard skills добирались уже самостоятельно с помощью курсов или интернета :) Больше всего опыта Жанна получила во время работы в юридическом маркетплейсе Правовед на 4 курсе, а за новыми знаниями она отправилась уже в англоязычную магистратуру Высшая школа менеджмента СПбГУ, откуда и попала во ВКонтакте.
На специализации «Аналитик данных» Жанна формирует продуктовое видение, учит глубокому восприятию бизнеса и продукта, а также рассказывает, как показать ценность аналитика для бизнеса.
Зачем изучать продуктовую аналитику начинающему специалисту? Отвечает преподавательница модулей:
«Подавляющая часть вакансий аналитиков – это вакансии непосредственно про продуктовую аналитику, а точнее про умение помогать продуктовым командам принимать решения, позволяющие драйвить ключевые метрики продукта. Продуктовый аналитик – правая рука продакт-менеджера, поэтому помимо знания того, какие метрики и как нужно считать, аналитик должен понимать, как мыслит продакт и что из себя представляет процесс управления продуктом. Модули «Развитие продукта» и «Продуктовая аналитика» рассчитаны на то, чтобы помочь понять как устроен продукт, как строится работа в команде и как использовать данные для помощи команде в росте и улучшении продукта».
«Подавляющая часть вакансий аналитиков – это вакансии непосредственно про продуктовую аналитику, а точнее про умение помогать продуктовым командам принимать решения, позволяющие драйвить ключевые метрики продукта. Продуктовый аналитик – правая рука продакт-менеджера, поэтому помимо знания того, какие метрики и как нужно считать, аналитик должен понимать, как мыслит продакт и что из себя представляет процесс управления продуктом. Модули «Развитие продукта» и «Продуктовая аналитика» рассчитаны на то, чтобы помочь понять как устроен продукт, как строится работа в команде и как использовать данные для помощи команде в росте и улучшении продукта».
Знаете, чем отличается код аналитика от кода разработчика? Код аналитика должен сработать хотя бы один раз!:) Но, шутки шутками, а навык писать хороший и понятный код – большой плюс для аналитика! А знание основ Git как раз поможет нам в освоении этого навыка.
На вебинаре «Введение в Git» с Анатолием Карповым, основателем karpov.courses, мы сделаем еще шаг на пути к идеальному коду, а именно:
● Узнаем, зачем аналитику знать Git
● Обсудим и научимся базовым командам
● Поработаем в командной строке
● И, конечно же, хорошо проведем время!
Ждем всех желающих как на знакомство с основами, так и на обновление имеющихся знаний!
Эта среда, 27 января, в 19:00
Запись на вебинар
На вебинаре «Введение в Git» с Анатолием Карповым, основателем karpov.courses, мы сделаем еще шаг на пути к идеальному коду, а именно:
● Узнаем, зачем аналитику знать Git
● Обсудим и научимся базовым командам
● Поработаем в командной строке
● И, конечно же, хорошо проведем время!
Ждем всех желающих как на знакомство с основами, так и на обновление имеющихся знаний!
Эта среда, 27 января, в 19:00
Запись на вебинар
У каждого из студентов karpov.courses есть своя мотивация записываться на курс по анализу данных. Например, Григорий Реут, студент 1 потока, считает, что аналитика – это «один из основных hard skills ближайших 10 лет». А, чтобы не быть голословным, используя знания со специализации «Аналитик данных», вместе с командой из 4 человек он занял 13 место из 800 команд на Архипелаге 20.35 и выиграл Сколковский грант в $40тыс. на развитие проекта.
Мы попросили Григория рассказать подробнее о проекте и вот, что из этого вышло:
«Наша команда состояла из 4 человек: основателя, главного организатора, меня и еще товарища, прошедшего онлайн-курс по дата аналитике в Стэнфорде. Мы с сентября разрабатывали новый бизнес-проект, и тут как раз Архипелаг подвернулся – решили попробовать прокачать ИИ компетенции, которых почти нет.
К сожалению, на курсе я пока прошел только два первых модуля – Python и SQL, но даже этого хватило для участия: как минимум, не имея объективной базы, я бы даже не задумывался об участии. Выигрывать совсем не планировали, ну а потом вошли во вкус 🙂 Так что курс обязательно закончу, а потом собираюсь изучать ML!
На Архипелаге надо было двигаться одновременно в разных жанрах, везде набирая очки, положительные отзывы экспертов и внимание инвесторов. Материалы курса помогли как минимум в 3 направлениях:
● Знание python и pandas позволили набрать баллы в одной из лабораторий по машинному обучению.
● При помощи python, SQL и веб-фронтенда наша команда собрала макет для презентации своей идеи с технической стороны.
● Сам курс послужил отличным фундаментом для диалога с потенциальными инвесторами.
Проект, если в три слова – убер для тяжелой техники. На Архипелаге была только стадия идеи, то есть к софтверной реализации не приступали. А уже по ходу соревнования нашли первых клиентов и как раз познакомились с экспертами фонда Бортника, которые дал грант на реализацию.
В конце декабря мы получили регистрацию компании в Сколково. Теперь называемся Ломоносов Тек 🙂 Так что проект будем реализовывать, в том числе и на международном рынке – сейчас начинаем работу с акселератором в Австралии по направлению сельхозтехники».
«Наша команда состояла из 4 человек: основателя, главного организатора, меня и еще товарища, прошедшего онлайн-курс по дата аналитике в Стэнфорде. Мы с сентября разрабатывали новый бизнес-проект, и тут как раз Архипелаг подвернулся – решили попробовать прокачать ИИ компетенции, которых почти нет.
К сожалению, на курсе я пока прошел только два первых модуля – Python и SQL, но даже этого хватило для участия: как минимум, не имея объективной базы, я бы даже не задумывался об участии. Выигрывать совсем не планировали, ну а потом вошли во вкус 🙂 Так что курс обязательно закончу, а потом собираюсь изучать ML!
На Архипелаге надо было двигаться одновременно в разных жанрах, везде набирая очки, положительные отзывы экспертов и внимание инвесторов. Материалы курса помогли как минимум в 3 направлениях:
● Знание python и pandas позволили набрать баллы в одной из лабораторий по машинному обучению.
● При помощи python, SQL и веб-фронтенда наша команда собрала макет для презентации своей идеи с технической стороны.
● Сам курс послужил отличным фундаментом для диалога с потенциальными инвесторами.
Проект, если в три слова – убер для тяжелой техники. На Архипелаге была только стадия идеи, то есть к софтверной реализации не приступали. А уже по ходу соревнования нашли первых клиентов и как раз познакомились с экспертами фонда Бортника, которые дал грант на реализацию.
В конце декабря мы получили регистрацию компании в Сколково. Теперь называемся Ломоносов Тек 🙂 Так что проект будем реализовывать, в том числе и на международном рынке – сейчас начинаем работу с акселератором в Австралии по направлению сельхозтехники».
Скоро начинаем «Введение в Git»! В 19:00 основатель karpov.courses, Анатолий Карпов, будет рассказывать об основах основ Git и базовых командах, которые пригодятся каждому аналитику.
Ждем всех желающих по ссылке
Ждем всех желающих по ссылке
В конце декабря мы анонсировали начало работы над продвинутым курсом по машинному обучению с Валерием Бабушкиным (Facebook, ex Alibaba, X5, Yandex), и вот, уже 1 февраля мы запускаемся!
Вы уже знакомы с основами машинного обучения? Активно применяете его в работе? Хотите повысить свой уровень? На курсе «Hardcore ML» мы пройдём все этапы работы инженера по машинному обучению: от изучения сбора и разметки данных до оценки эффективности алгоритмов. Это вам не просто модельки обучать :)
Подробнее с программой можно ознакомиться на сайте и в небольшом видео, где каждый из преподавателей курса рассказывает про свой модуль и те задачи из практики крупных компаний, которые вы сможете решать после обучения.
Наставниками на курсе выступят ведущие специалисты в области Data Science из Facebook, Yandex, Mail.ru и X5.
Готовы к погружению в мир ML? Тогда скорее пишите на почту student@team.karpov.courses
До встречи на курсе!
Вы уже знакомы с основами машинного обучения? Активно применяете его в работе? Хотите повысить свой уровень? На курсе «Hardcore ML» мы пройдём все этапы работы инженера по машинному обучению: от изучения сбора и разметки данных до оценки эффективности алгоритмов. Это вам не просто модельки обучать :)
Подробнее с программой можно ознакомиться на сайте и в небольшом видео, где каждый из преподавателей курса рассказывает про свой модуль и те задачи из практики крупных компаний, которые вы сможете решать после обучения.
Наставниками на курсе выступят ведущие специалисты в области Data Science из Facebook, Yandex, Mail.ru и X5.
Готовы к погружению в мир ML? Тогда скорее пишите на почту student@team.karpov.courses
До встречи на курсе!
Так как курс запускается впервые, для студентов первого потока мы предусмотрели особое предложение. В него входит:
– Бесплатное продление прохождения курса на 2 месяца, если почувствуете, что вам нужно больше времени на обучение
– Доступ к обновлениям в течение года, если в программе произойдут изменения.
– Бесплатное продление прохождения курса на 2 месяца, если почувствуете, что вам нужно больше времени на обучение
– Доступ к обновлениям в течение года, если в программе произойдут изменения.
Не все в жизни идет так гладко, как нам хотелось бы: с записью вебинара «Введение в Git» случились технические неполадки, поэтому опубликовать её мы не сможем :(
Однако, мы попросили Анатолия Карпова сделать подборку рекомендаций по Git на основе его лекции!
● Git How To: курс обучения Git
Один из самых коротких мануалов, охватывающих основные проблемы при работе с Git. Освоить основы вы сможете даже за остаток сегодняшнего дня!
● Основы Git на Stepik
25 уроков на уже всем знакомой платформе Stepik с более сложными задачами.
● Git-game
Репозиторий на GitHub, который одновременно является игрой, где вы приближаетесь к ответу, выполняя действия в самом репозитории.
● Learn Git Branching
Игра, визуализирующая работу с ветками – одним из ключевых концептов контроля версий Git.
● Getting Git Right от Atlassian
Мануал по Git от Atlassian, фирмы, поддерживающей Bitbucket – альтернативу GitHub.
● Pro Git book
Книга, подробно описывающая концепты, на которых строится Git, и как с ним работать.
Однако, мы попросили Анатолия Карпова сделать подборку рекомендаций по Git на основе его лекции!
● Git How To: курс обучения Git
Один из самых коротких мануалов, охватывающих основные проблемы при работе с Git. Освоить основы вы сможете даже за остаток сегодняшнего дня!
● Основы Git на Stepik
25 уроков на уже всем знакомой платформе Stepik с более сложными задачами.
● Git-game
Репозиторий на GitHub, который одновременно является игрой, где вы приближаетесь к ответу, выполняя действия в самом репозитории.
● Learn Git Branching
Игра, визуализирующая работу с ветками – одним из ключевых концептов контроля версий Git.
● Getting Git Right от Atlassian
Мануал по Git от Atlassian, фирмы, поддерживающей Bitbucket – альтернативу GitHub.
● Pro Git book
Книга, подробно описывающая концепты, на которых строится Git, и как с ним работать.
Сегодня стартует первый поток хардкорного курса по машинному обучению с Валерием Бабушкиным. В честь этого события команда karpov.courses попросила Валерия записать обращение к будущим студентам:
«На собеседованиях я часто задаю вопрос, чем потенциальный сотрудник хочет заниматься. Многих этот вопрос приводит в растерянность. Люди собираются, напрягаются и часто выдают: «Хочу приносить пользу с помощью данных». Нужно сказать, что количество энтропии в моей вселенной такой ответ вряд ли уменьшит.
Курс, который мы запустили, должен помочь ответить на два вопроса: что полезного я умею делать и что я хочу или не хочу делать.
В этом курсе стоит ожидать много страданий, связанных с инфраструктурой и немного с математикой. Некоторые преподаватели в процессе создания даже находились на грани срыва: посмотрим, удастся ли им перейти эту грань после старта первого потока.
Надеюсь, что наши студенты получат не меньшее удовольствие, чем мы в процессе создания этого курса».
«На собеседованиях я часто задаю вопрос, чем потенциальный сотрудник хочет заниматься. Многих этот вопрос приводит в растерянность. Люди собираются, напрягаются и часто выдают: «Хочу приносить пользу с помощью данных». Нужно сказать, что количество энтропии в моей вселенной такой ответ вряд ли уменьшит.
Курс, который мы запустили, должен помочь ответить на два вопроса: что полезного я умею делать и что я хочу или не хочу делать.
В этом курсе стоит ожидать много страданий, связанных с инфраструктурой и немного с математикой. Некоторые преподаватели в процессе создания даже находились на грани срыва: посмотрим, удастся ли им перейти эту грань после старта первого потока.
Надеюсь, что наши студенты получат не меньшее удовольствие, чем мы в процессе создания этого курса».
Первые шаги в области программирования и анализа данных самые сложные, а формат самостоятельного обучения подходит не всем.
Когда вы учитесь в компании опытных наставников и других студентов, получить ощутимые результаты выйдет в разы быстрее, поэтому на каждой нашей программе преподаватели проверяют домашние задания студентов и помогают им в чате.
Когда вы учитесь в компании опытных наставников и других студентов, получить ощутимые результаты выйдет в разы быстрее, поэтому на каждой нашей программе преподаватели проверяют домашние задания студентов и помогают им в чате.
В karpov.courses есть два вида домашних заданий: те, что автоматически проверяются платформой, и задания с открытым ответом. Что же это значит?
● Если задание проверяется автоматически, то при введении правильного ответа, вы сможете сразу посмотреть разбор от составившего задачу преподавателя.
● Если задание с открытым ответом, то в течение двух недель оно проверяется преподавателями, ведущими блок. Они выставляют оценки и могут дать комментарии.
Кроме этого, в некоторых блоках мы разбираем домашние задания на вебинарах с обратной связью от преподавателей. Например, в итоговом проекте (о нём мы расскажем отдельно) и модуле «Визуализация».
Все домашние задания построены так, что студенты сразу погружаются в рабочие задачи аналитика, а формат рецензий и оценок от наших лекторов позволяет им не сбиться с пути.
● Если задание проверяется автоматически, то при введении правильного ответа, вы сможете сразу посмотреть разбор от составившего задачу преподавателя.
● Если задание с открытым ответом, то в течение двух недель оно проверяется преподавателями, ведущими блок. Они выставляют оценки и могут дать комментарии.
Кроме этого, в некоторых блоках мы разбираем домашние задания на вебинарах с обратной связью от преподавателей. Например, в итоговом проекте (о нём мы расскажем отдельно) и модуле «Визуализация».
Все домашние задания построены так, что студенты сразу погружаются в рабочие задачи аналитика, а формат рецензий и оценок от наших лекторов позволяет им не сбиться с пути.
Всем привет! На связи karpov.courses.
Близится середина месяца, а это значит, что мы запускаем уже 9 поток специализации «Аналитик данных».
Наверняка вы уже не первый месяц читаете, что происходит на курсе и как за 5 месяцев наши студенты становятся востребованными специалистами в области анализа данных.
Как же так выходит, что меньше, чем за полгода, выпускники готовы сразу же влиться в работу и следовать за изменениями в индустрии?
Близится середина месяца, а это значит, что мы запускаем уже 9 поток специализации «Аналитик данных».
Наверняка вы уже не первый месяц читаете, что происходит на курсе и как за 5 месяцев наши студенты становятся востребованными специалистами в области анализа данных.
Как же так выходит, что меньше, чем за полгода, выпускники готовы сразу же влиться в работу и следовать за изменениями в индустрии?
● Интенсивный формат обучения из 3 лекций в неделю позволяет заранее приспособиться к ритму, который требуется в работе аналитика.
● Практико-ориентированные домашние задания с первого же модуля формируют представление о реальных задачах аналитика.
● Работа на удаленном сервере – это те самые боевые условия, которые используются в крупных корпорациях!
● Постоянная поддержка преподавателей и команды саппорта, которые готовы как указать на ошибку в коде, так и порекомендовать, как углубиться в интересующую тему.
● Грамотно составленное резюме помогает быстрее найти вакансию, пока знания еще свежи, а итоговый проект, сделанный после прохождения всей теории курса, может стать важной частью портфолио.
Как насчет к середине лета уже окончить курс и вступить в ряды аналитиков?
Скорее записывайтесь по ссылке
Остались вопросы? Пишите на почту student@team.karpov.courses – развеем все сомнения!
До встречи на специализации!
● Практико-ориентированные домашние задания с первого же модуля формируют представление о реальных задачах аналитика.
● Работа на удаленном сервере – это те самые боевые условия, которые используются в крупных корпорациях!
● Постоянная поддержка преподавателей и команды саппорта, которые готовы как указать на ошибку в коде, так и порекомендовать, как углубиться в интересующую тему.
● Грамотно составленное резюме помогает быстрее найти вакансию, пока знания еще свежи, а итоговый проект, сделанный после прохождения всей теории курса, может стать важной частью портфолио.
Как насчет к середине лета уже окончить курс и вступить в ряды аналитиков?
Скорее записывайтесь по ссылке
Остались вопросы? Пишите на почту student@team.karpov.courses – развеем все сомнения!
До встречи на специализации!
Как часто вам приходилось сталкиваться с данными, где у каждого объекта по 3-4 признака? В целом, обычная ситуация для учебного задания. Однако данные из реальной жизни гораздо сложнее и многограннее. Что делать в случае, когда количество признаков достигает сотни? Тут уже понадобятся знания о многомерных данных.
На вебинаре «Анализ многомерных данных» мы разберем:
● Как правильно представлять многомерные данные, чтобы всем всё стало понятно?
● Что такое ординация и какой она бывает?
● Каким образом сравнивать группы со многим признаками между собой?
Вебинар проведёт Лаврентий Данилов, аспирант кафедры Генетики и Биотехнологии СПбГУ и аналитик в компании EPAM.
Среда, 10 февраля, 19:00
Ждем всех желающих!
Регистрация на вебинар
На вебинаре «Анализ многомерных данных» мы разберем:
● Как правильно представлять многомерные данные, чтобы всем всё стало понятно?
● Что такое ординация и какой она бывает?
● Каким образом сравнивать группы со многим признаками между собой?
Вебинар проведёт Лаврентий Данилов, аспирант кафедры Генетики и Биотехнологии СПбГУ и аналитик в компании EPAM.
Среда, 10 февраля, 19:00
Ждем всех желающих!
Регистрация на вебинар
Вебинар начнётся через час! Залетайте слушать про сравнения и визуализацию многомерных данных от Лаврентия Данилова.
Ссылка на трансляцию
Ссылка на трансляцию
Опыт запуска продвинутого курса по машинному обучению показал, что желающих сделать свои первые шаги в ML больше, чем мы предполагали.
Рады наконец-то написать: курсу по машинному обучению для начинающих – быть!
Куратором курса выступит Ян Пиле, руководитель группы аналитики поиска Mail.ru, а подробнее ознакомиться с программой Start ML уже можно на сайте.
Программа подойдет тем, кто заинтересован в машинном обучении, но не знает, с чего начать. Мы обучим всему, что нужно для старта в ML: Python, математика, статистика, классические ML-алгоритмы и, конечно, введение в нейронные сети.
Формат обучения такой же, как и на остальных программах karpov.courses: 3 лекции в неделю, постоянная практика на основе реальных кейсов, выделенный сервер и чуткая помощь саппорта.
С полученными знаниями вы сможете самостоятельно углубиться в нужную вам область машинного обучения. Или вернуться на Hard ML с Валерием Бабушкиным :)
Начинаем 1 марта.
До встречи на курсе!
Рады наконец-то написать: курсу по машинному обучению для начинающих – быть!
Куратором курса выступит Ян Пиле, руководитель группы аналитики поиска Mail.ru, а подробнее ознакомиться с программой Start ML уже можно на сайте.
Программа подойдет тем, кто заинтересован в машинном обучении, но не знает, с чего начать. Мы обучим всему, что нужно для старта в ML: Python, математика, статистика, классические ML-алгоритмы и, конечно, введение в нейронные сети.
Формат обучения такой же, как и на остальных программах karpov.courses: 3 лекции в неделю, постоянная практика на основе реальных кейсов, выделенный сервер и чуткая помощь саппорта.
С полученными знаниями вы сможете самостоятельно углубиться в нужную вам область машинного обучения. Или вернуться на Hard ML с Валерием Бабушкиным :)
Начинаем 1 марта.
До встречи на курсе!
🔥1
На вебинаре «Анализ многомерных данных» мы затронули лишь верхушку айсберга. Как и в любую другую тему, в многомерные данные можно погружаться бесконечно, поэтому Лаврентий Данилов сделал подборку книг, с которых лучше всего начать свое знакомство.
● Analysing Ecological Data
В книге описывается большинство используемых методов, а также дается достаточно полное описание различных коэффициентов сходства/различия и методов ординации.
● An Introduction to Statistical Learning
Настоятельно рекомендуемая к прочтению книга, где рассматриваются аспекты многомерного анализ, особенности построения работы с линейными моделями, а также некоторые из классических алгоритмов машинного обучения.
● PRIMER v6: User Manual/Tutorial
Одна из классических работ, содержащая в себе описания «механики» различных методов работы с многомерными данными.
P.S. Запись лекции доступна по ссылке, а материалы прикреплены ниже к посту.
● Analysing Ecological Data
В книге описывается большинство используемых методов, а также дается достаточно полное описание различных коэффициентов сходства/различия и методов ординации.
● An Introduction to Statistical Learning
Настоятельно рекомендуемая к прочтению книга, где рассматриваются аспекты многомерного анализ, особенности построения работы с линейными моделями, а также некоторые из классических алгоритмов машинного обучения.
● PRIMER v6: User Manual/Tutorial
Одна из классических работ, содержащая в себе описания «механики» различных методов работы с многомерными данными.
P.S. Запись лекции доступна по ссылке, а материалы прикреплены ниже к посту.