Почти каждый из нас пользуется телефоном для чтения новостей, совершения покупок и поиска информации. Скорее всего, даже этот пост вы видите с телефона! Мобильный трафик занимает почти половину от всего мирового трафика и содержит огромное количество ценной информации, анализ которой может оказать влияние на ваш бизнес.
Как удобнее всего собирать данные с мобильных приложений? В качестве ответа этот вопрос Ярослав Баранов, Senior BI Analyst в компании Tango, сделал обзор набора сервисов для аналитики мобильных приложений.
P.S. Осторожно! Читать статью будет гораздо легче со знаниями в области аналитики мобильных приложений.
Как удобнее всего собирать данные с мобильных приложений? В качестве ответа этот вопрос Ярослав Баранов, Senior BI Analyst в компании Tango, сделал обзор набора сервисов для аналитики мобильных приложений.
P.S. Осторожно! Читать статью будет гораздо легче со знаниями в области аналитики мобильных приложений.
Telegraph
Стек для аналитики мобильных приложений
Введение В этой статье я рассмотрю относительно привычный набор технологий для аналитики мобильного приложения. С небольшими модификациями и отклонениями предложенный вариант может легко использоваться и в любой другой продуктовой компании, нуждающейся в…
Уже сегодня, уже через час: залетайте наш открытый вебинар по статистике с Анатолием Карповым, ведущим аналитиком в Mail.ru!
Ссылка на трансляцию
Ссылка на трансляцию
Всем привет! На связи Анатолий Карпов.
Завершаем рабочую неделю под интервью с основателями Experiment Fest, Черемисиновым Виталием и Мирмахмадовым Искандером! Вместе мы обсудили такие волнующие вопросы, как:
● Правда ли, что классическая статистика и базовые тесты уже не актуальны?
● A/B тесты - плюсы, минусы и подводные камни?
● Как машинное обучение помогает проводить эксперименты?
И, разумеется, как же выстроить бизнес на знаниях статистики, чтобы конкурировать с экспертами из Big Four?
Завершаем рабочую неделю под интервью с основателями Experiment Fest, Черемисиновым Виталием и Мирмахмадовым Искандером! Вместе мы обсудили такие волнующие вопросы, как:
● Правда ли, что классическая статистика и базовые тесты уже не актуальны?
● A/B тесты - плюсы, минусы и подводные камни?
● Как машинное обучение помогает проводить эксперименты?
И, разумеется, как же выстроить бизнес на знаниях статистики, чтобы конкурировать с экспертами из Big Four?
YouTube
Основатели Experiment Fest об образовании, анализе данных и бизнесе | Интервью | karpov.courses
Симулятор A/B-тестов: https://bit.ly/3ZIejfg
Завершаем рабочую неделю под интервью с основателями Experiment Fest, Черемисиновым Виталием и Мирмахмадовым Искандером! Вместе мы обсудили такие волнующие вопросы, как:
● Правда ли, что классическая статистика…
Завершаем рабочую неделю под интервью с основателями Experiment Fest, Черемисиновым Виталием и Мирмахмадовым Искандером! Вместе мы обсудили такие волнующие вопросы, как:
● Правда ли, что классическая статистика…
Все больше компаний хотят решать бизнес-задачи с помощью визуализации данных, а каждая BI-система борется за самые наглядные и интерактивные дашборды. Однако при этом внутренние заказчики до сих пор просят сделать дашборд как одну огромную таблицу с миллионом фильтров «как в Excel».
Почему так происходит? Что на самом деле стоит за желанием получить таблицу «как в Excel»? Как совместить наглядность и информативность? Все это мы обсудим на вебинаре «Как быть, когда заказчик хочет только таблички», а также рассмотрим примеры решения подобных задач и разберем практический кейс создания отчёта в Tableau с «правильной» таблицей.
Занятие проведет Роман Бунин, руководитель команды визуализации данных Яндекс Go, автор телеграм-канала Reveal the Data.
Этот четверг, 1 октября, 20.00
👉Регистрация на вебинар👈
Почему так происходит? Что на самом деле стоит за желанием получить таблицу «как в Excel»? Как совместить наглядность и информативность? Все это мы обсудим на вебинаре «Как быть, когда заказчик хочет только таблички», а также рассмотрим примеры решения подобных задач и разберем практический кейс создания отчёта в Tableau с «правильной» таблицей.
Занятие проведет Роман Бунин, руководитель команды визуализации данных Яндекс Go, автор телеграм-канала Reveal the Data.
Этот четверг, 1 октября, 20.00
👉Регистрация на вебинар👈
Вебинар начнется совсем скоро! Уже через час Роман Бунин, руководитель команды визуализации данных Яндекс Go, расскажет, как совместить наглядность и информативность в вашем дашборде и что же все-таки делать, если заказчик хочет только подобие Excel-таблички?
Ссылка на трансляцию
Ссылка на трансляцию
1. sql-ex.ru
На этом ресурсе нет четкого разделения уровня задач: они все ориентированы на начинающих, и их можно решать в любом порядке. Помимо упражнений, тут есть интерактивный учебник — sql-tutorial.ru, где можно найти подробные описания работы операторов и примеры запросов разного уровня сложности.
2. leetcode.com
Одна из наиболее популярных платформ для решения алгоритмических задач, на котором также есть упражнения на SQL (в разделе Problems → Database). Сами задачи разделены на три уровня сложности: easy, medium и hard, но часть из них доступна только по подписке. Альтернативные варианты решения можно посмотреть в обсуждении.
3. HackerRank.com
Похожий сайт с набором задач по различным темам, в том числе и SQL. Присутствует разбивка как по сложности, так и по теме (агрегация, простые операции объединения, сложные и т.д.).
На этом ресурсе нет четкого разделения уровня задач: они все ориентированы на начинающих, и их можно решать в любом порядке. Помимо упражнений, тут есть интерактивный учебник — sql-tutorial.ru, где можно найти подробные описания работы операторов и примеры запросов разного уровня сложности.
2. leetcode.com
Одна из наиболее популярных платформ для решения алгоритмических задач, на котором также есть упражнения на SQL (в разделе Problems → Database). Сами задачи разделены на три уровня сложности: easy, medium и hard, но часть из них доступна только по подписке. Альтернативные варианты решения можно посмотреть в обсуждении.
3. HackerRank.com
Похожий сайт с набором задач по различным темам, в том числе и SQL. Присутствует разбивка как по сложности, так и по теме (агрегация, простые операции объединения, сложные и т.д.).
🔥5
Всем привет! На связи Анатолий Карпов
Почти по традиции завершаем понедельник под интервью с Валерием Бабушкиным, тимлидом в X5 Retail Group. Параллельно с обсуждением новостей из мира ML, нам удалось:
● Упорядочить особенности найма в такие крупные компании, как Facebook и Google
● Сравнить зарплаты в России, Европе и США
● Решить, какие новые тренды в Data Science заслуживают особо пристального внимания
● Выяснить, где и как нужно учиться, чтобы стать востребованным data science специалистом
Почти по традиции завершаем понедельник под интервью с Валерием Бабушкиным, тимлидом в X5 Retail Group. Параллельно с обсуждением новостей из мира ML, нам удалось:
● Упорядочить особенности найма в такие крупные компании, как Facebook и Google
● Сравнить зарплаты в России, Европе и США
● Решить, какие новые тренды в Data Science заслуживают особо пристального внимания
● Выяснить, где и как нужно учиться, чтобы стать востребованным data science специалистом
YouTube
Валерий Бабушкин о работе в Facebook и трендах Data Science | Интервью | karpov.courses
Курс Hard ML: http://bit.ly/42icUh3
Почти по традиции завершаем понедельник под интервью с Валерием Бабушкиным, тимлидом в X5 Retail Group.
Параллельно с обсуждением новостей из мира ML, нам удалось:
● упорядочить особенности найма в такие крупные компании…
Почти по традиции завершаем понедельник под интервью с Валерием Бабушкиным, тимлидом в X5 Retail Group.
Параллельно с обсуждением новостей из мира ML, нам удалось:
● упорядочить особенности найма в такие крупные компании…
Можно бесконечно смотреть на то, как горит огонь, как течет вода и как меняется восприятие данных в зависимости от способа визуализации. По итогам вебинара «Таблички VS Графики» с Романом Буниным, руководителем команды визуализации Яндекс Go, мы собрали четыре ссылки, с которыми будет гораздо легче отвечать на вопрос «как визуализировать данные»
1. В каких случаях какой график лучше использовать? Какие могут возникнуть ошибки в его интерпретации? Для самостоятельных ответов на эти вопросы, советуем опробовать интерактивный тренажер по сравнению круговых диаграмм и гистограмм.
2. Галерея интерактивных вариантов оформления графиков в Tableau, собранных в соответствии с типами задач и необходимыми к отражению данными. Список не является исчерпывающим, но может стать отправной точкой для создания идеального дашборда. Тренируем насмотренность по ссылке.
3. Не уходя далеко от галереи примеров Tableau, стоит заглянуть в профиль эксперта Романа Бунина с вариантами дашбордов от активности передвижения людей по городам до состояния рынка вакансий в области аналитики.
4. Для тех, кто предпочитает воспринимать информацию через текст, или просто не смог присутствовать на лекции — конспект вебинара, где содержатся ключевые пункты, на которые стоит обратить внимание при составлении дашбордов. Рекомендуем к прочтению и регулярному использованию.
2. Галерея интерактивных вариантов оформления графиков в Tableau, собранных в соответствии с типами задач и необходимыми к отражению данными. Список не является исчерпывающим, но может стать отправной точкой для создания идеального дашборда. Тренируем насмотренность по ссылке.
3. Не уходя далеко от галереи примеров Tableau, стоит заглянуть в профиль эксперта Романа Бунина с вариантами дашбордов от активности передвижения людей по городам до состояния рынка вакансий в области аналитики.
4. Для тех, кто предпочитает воспринимать информацию через текст, или просто не смог присутствовать на лекции — конспект вебинара, где содержатся ключевые пункты, на которые стоит обратить внимание при составлении дашбордов. Рекомендуем к прочтению и регулярному использованию.
По сути, игра похожа на программирование в ассемблере, где команды отдаются напрямую процессору. Похожим образом выполняется программирование на высокоуровневых языках, типа Python. Скажем, скрипт для категоризации текста на деле выглядит как «взять данные на входе, сложить в ячейку памяти, взять следующие, сложить с имеющимися, отдать на выход». Поиграв в Human Resource Machine, становится понятнее, как работают алгоритмы на более низком уровне.
В общем, рекомендую!
В общем, рекомендую!
В доме может завестись много вредителей. У кого-то это тараканы, у других – фараоновы муравьи, встречаются даже родственники. Вам досталось хуже всех: в данных завелись случайные группы!
Что будете делать?
Что будете делать?
Anonymous Poll
15%
Ну завелись и завелись, чё бубнить-то
12%
При входе в Jupyter вытру ноги об данные
23%
В борьбе с вредителями надо создать своих – построю модель для каждой группы
32%
Мои модели будут иерархическими, пусть знают, что такое дисциплина
16%
Заведусь в этих группах, вот это будет плоттвист
Представьте: вы организуете вечеринку. Уже готова культурная программа, закуплена еда и, конечно, собран список гостей. Родственники, близкие друзья, просто знакомые...и Особенный.
Вы не можете не пригласить Особенного. Возможно, на этом настаивают родственники. Может, он умеет открывать шампанское ухом, а это гвоздь культурной программы. Ну, или вам просто неловко его не звать. Причин может быть много.
Но если Особенный придёт, то вечеринка с ненулевой вероятностью рискует схлопнуться в сингулярность. Он съест всю еду, в том числе из чужих тарелок. Он будет петь караоке при полном отсутствии голоса, слуха и самого караоке. В общем, жизнь разнообразна и удивительна, и с этим что-то надо делать.
...какое это имеет отношение к статистике? Читаем в статье Александра Манаенкова, ментора Karpov.Courses:
Вы не можете не пригласить Особенного. Возможно, на этом настаивают родственники. Может, он умеет открывать шампанское ухом, а это гвоздь культурной программы. Ну, или вам просто неловко его не звать. Причин может быть много.
Но если Особенный придёт, то вечеринка с ненулевой вероятностью рискует схлопнуться в сингулярность. Он съест всю еду, в том числе из чужих тарелок. Он будет петь караоке при полном отсутствии голоса, слуха и самого караоке. В общем, жизнь разнообразна и удивительна, и с этим что-то надо делать.
...какое это имеет отношение к статистике? Читаем в статье Александра Манаенкова, ментора Karpov.Courses:
Telegraph
Нетехническое введение в LMM
Начнем сначала! Представьте: вы работаете аналитиком. Ваша компания начала сотрудничать с МФЦ, и вы получили задание: смоделировать, как скорость выполнения услуги влияет на оценку со стороны клиентов. Клиенты не особо охотно ставят оценку или не знают о…
LMM.ipynb
29.1 KB
Вдогонку к введению в LMM прикрепляем ноутбук с кодом!
За последние 20 лет большинство людей привыкло, что хранить и записывать данные эквивалентно хранению данных в таблице Excel. Так думали и в системе здравоохранения Великобритании в разгар распространения COVID-19, пока не выяснилось, что данных накопилось настолько много, что они… перестали влезать в Excel. Правительство Великобритании на протяжении почти недели получало недостоверные данные по статистике заболеваемости из-за того, что они просто не подгружались в систему.
Дело в том, что файлы в формате Excel имеют ограничение на максимальное количество наблюдений (в данном случае колонок) в 65 000. После этого значения новые случаи перестают загружаться в форму для построения графиков. Таким образом, пусть и верное решение о локдауне было принято на основе неверных данных.
Какой вывод из этого можно сделать? Используйте базы данных, храните свои сложные данные в специально подготовленных форматах вместо .xls и, разумеется, мойте руки, друзья 🙂
Почитать подробнее о случае можно тут
Дело в том, что файлы в формате Excel имеют ограничение на максимальное количество наблюдений (в данном случае колонок) в 65 000. После этого значения новые случаи перестают загружаться в форму для построения графиков. Таким образом, пусть и верное решение о локдауне было принято на основе неверных данных.
Какой вывод из этого можно сделать? Используйте базы данных, храните свои сложные данные в специально подготовленных форматах вместо .xls и, разумеется, мойте руки, друзья 🙂
Почитать подробнее о случае можно тут
Mail Online
Blame game after 16,000 Covid cases missed due to Excel glitch
A clearer picture of the country's outbreak has emerged after some 16,000 confirmed infections had to be added to the daily totals running back more than a week.
Новая неделя – новое интервью!
В этот раз у нас в гостях Артур Хачуян, основатель Tazeros, который, пожалуй, лучше всех знает, как использовать большие данные для бизнеса и маркетинга.
Вместе мы успели обсудить:
● Что будет с рекламным рынком после iOS 14?
● К каким новым рекламным технологиям следует готовиться аналитикам?
● Что бизнес хочет знать о пользователях?
● Big Data и политика (казалось бы, при чем тут Беларусь?)
Бонус-история: как Шнуров Big Data в космос запускал 🙂
В этот раз у нас в гостях Артур Хачуян, основатель Tazeros, который, пожалуй, лучше всех знает, как использовать большие данные для бизнеса и маркетинга.
Вместе мы успели обсудить:
● Что будет с рекламным рынком после iOS 14?
● К каким новым рекламным технологиям следует готовиться аналитикам?
● Что бизнес хочет знать о пользователях?
● Big Data и политика (казалось бы, при чем тут Беларусь?)
Бонус-история: как Шнуров Big Data в космос запускал 🙂
YouTube
Артур Хачуян о Big Data в рекламе и политике | Интервью | karpov.courses
Курс «Аналитик данных»: http://bit.ly/3JH4adg
Артур, основатель Tazeros, пожалуй, лучше всех знает, как использовать большие данные для бизнеса и маркетинга. Обсудили с Артуром:
● что ждёт рекламный рынок после iOS 14;
● к каким прорывным технологиям…
Артур, основатель Tazeros, пожалуй, лучше всех знает, как использовать большие данные для бизнеса и маркетинга. Обсудили с Артуром:
● что ждёт рекламный рынок после iOS 14;
● к каким прорывным технологиям…
Прокачиваем скиллы аналитика данных через игры:
1. Learn Git Branching
И в крупных компаниях, и в небольших проектах аналитик должен уметь взаимодействовать с командой, чтобы обмениваться данными и кодом. Для этих целей обычно используется система контроля версий Git. В Learning Git Branching вы учитесь взаимодействовать с этим программным обеспечением. Всё сопровождается графовыми иллюстрациями для лучшего понимания процесса.
2. Git Game
Тот же Learn Git Branching, но в версии для продвинутых пользователей: на этот раз никаких графиков и визуализации – только командная строка, только хардкор. Сейчас существуют две версии игры, которые позволяют после клонирования репозитория смоделировать наиболее часто встречающиеся ситуации. Основное различие между этими версиями, что во второй содержится бОльшее количество команд, которым точно стоит научиться.
3. Regex Crossword
Регулярные выражение – это палочка-выручалока для моментов, когда нужно что-то найти в файле на несколько миллионов строк, где вы даже не знаете, что конкретно нужно искать (впрочем, обычная ситуация). Тренироваться в использовании регулярных выражений советуем в Regex Crossword. Вам предстоит решать некое подобие японского кроссворда, правда вместо цифр – регулярные выражения.
4. while True: learn ()
Чтобы понять, как работает машинное обучение, стоит обратить внимание на while True: learn (0). Вы играете за специалиста по нейросетям и ML, однако кот справляется с работой гораздо лучше вас. Чтобы извлечь пользу из сложившейся ситуации, нужно построить переводчик с кошачьего, для чего вы и начинаете изучать принципы машинного обучения.
5. Opus Magnum
Opus Magnum – это игра-головоломка с бесконечным игровым процессом. Вам предстоит освоить возможности механизма трансмутаций — самого мощного и совершенного инструмента в арсенале инженера-алхимика. По сути игра напоминает симулятор программирования промышленных роботов, а сочетание программирования и алхимии обещает быть не только полезным, но и интересным!
6. SHENZHEN I/O
Готовы вырваться на просторы и начать писать свой код? Попробуйте SHENZHEN I/O! Вам предстоит освоить новый язык программирования, похожий на язык ассемблера, чтобы создавать схемы с использованием множества компонентов от разных производителей. Легко не будет, но благодаря тяге к созиданию и преодолению трудностей полученные навыки пригодятся при написании программ на любом языке программирования.
1. Learn Git Branching
И в крупных компаниях, и в небольших проектах аналитик должен уметь взаимодействовать с командой, чтобы обмениваться данными и кодом. Для этих целей обычно используется система контроля версий Git. В Learning Git Branching вы учитесь взаимодействовать с этим программным обеспечением. Всё сопровождается графовыми иллюстрациями для лучшего понимания процесса.
2. Git Game
Тот же Learn Git Branching, но в версии для продвинутых пользователей: на этот раз никаких графиков и визуализации – только командная строка, только хардкор. Сейчас существуют две версии игры, которые позволяют после клонирования репозитория смоделировать наиболее часто встречающиеся ситуации. Основное различие между этими версиями, что во второй содержится бОльшее количество команд, которым точно стоит научиться.
3. Regex Crossword
Регулярные выражение – это палочка-выручалока для моментов, когда нужно что-то найти в файле на несколько миллионов строк, где вы даже не знаете, что конкретно нужно искать (впрочем, обычная ситуация). Тренироваться в использовании регулярных выражений советуем в Regex Crossword. Вам предстоит решать некое подобие японского кроссворда, правда вместо цифр – регулярные выражения.
4. while True: learn ()
Чтобы понять, как работает машинное обучение, стоит обратить внимание на while True: learn (0). Вы играете за специалиста по нейросетям и ML, однако кот справляется с работой гораздо лучше вас. Чтобы извлечь пользу из сложившейся ситуации, нужно построить переводчик с кошачьего, для чего вы и начинаете изучать принципы машинного обучения.
5. Opus Magnum
Opus Magnum – это игра-головоломка с бесконечным игровым процессом. Вам предстоит освоить возможности механизма трансмутаций — самого мощного и совершенного инструмента в арсенале инженера-алхимика. По сути игра напоминает симулятор программирования промышленных роботов, а сочетание программирования и алхимии обещает быть не только полезным, но и интересным!
6. SHENZHEN I/O
Готовы вырваться на просторы и начать писать свой код? Попробуйте SHENZHEN I/O! Вам предстоит освоить новый язык программирования, похожий на язык ассемблера, чтобы создавать схемы с использованием множества компонентов от разных производителей. Легко не будет, но благодаря тяге к созиданию и преодолению трудностей полученные навыки пригодятся при написании программ на любом языке программирования.
learngitbranching.js.org
Learn Git Branching
An interactive Git visualization tool to educate and challenge!
Всем привет! На связи Анатолий Карпов.
Наверняка вы знаете меня по курсу «Основы статистики» на Stepik. Эта программа родилась случайно – однажды я, как выпускник кафедры когнитивной психологии СПбГУ, интереса ради прочёл курс по статистике студентам-биологам. Но, как говорится, пранк вышел из-под контроля: офлайн формат на 30 человек быстро превратился в онлайн, количество студентов стремительно приближалось сначала к сотне, затем тысяче человек, а недавно число студентов и вовсе перевалило за 100 тысяч! Я понял, что обучать других анализу данных – это то, что мне нравится в жизни больше всего.
Параллельно с образовательными проектами я продолжал работать в индустрии, возглавлял команду аналитики ВКонтакте, открывал и закрывал EdTech стартапы, а сейчас работаю ведущим аналитиком в Mail.ru.
Работа в IT свела меня с замечательными людьми, горящими идеей сделать лучшую специализацию по анализу данных. Так и появилась команда Karpov.Courses. Мы вложили в эту программу все свои знания, полученные за годы работы в таких компаниях как ВКонтакте, Яндекс, Mail.ru. Мы записали десятки часов лекций, составили сотни заданий, десятки кейсов и развернули кластер с Big Data для практики. 1 ноября у нас стартует уже 6 поток специализации «Аналитик данных».
Присоединяйтесь!
Наверняка вы знаете меня по курсу «Основы статистики» на Stepik. Эта программа родилась случайно – однажды я, как выпускник кафедры когнитивной психологии СПбГУ, интереса ради прочёл курс по статистике студентам-биологам. Но, как говорится, пранк вышел из-под контроля: офлайн формат на 30 человек быстро превратился в онлайн, количество студентов стремительно приближалось сначала к сотне, затем тысяче человек, а недавно число студентов и вовсе перевалило за 100 тысяч! Я понял, что обучать других анализу данных – это то, что мне нравится в жизни больше всего.
Параллельно с образовательными проектами я продолжал работать в индустрии, возглавлял команду аналитики ВКонтакте, открывал и закрывал EdTech стартапы, а сейчас работаю ведущим аналитиком в Mail.ru.
Работа в IT свела меня с замечательными людьми, горящими идеей сделать лучшую специализацию по анализу данных. Так и появилась команда Karpov.Courses. Мы вложили в эту программу все свои знания, полученные за годы работы в таких компаниях как ВКонтакте, Яндекс, Mail.ru. Мы записали десятки часов лекций, составили сотни заданий, десятки кейсов и развернули кластер с Big Data для практики. 1 ноября у нас стартует уже 6 поток специализации «Аналитик данных».
Присоединяйтесь!
karpov.courses
Школа Data Science: программы обучения для любого уровня подготовки | karpov.courses
Karpov.Courses. Школа Data Science
Как часто вам приходят в голову идеи применить свои навыки не только в рабочем ключе, но и забавы ради?
Например, на прошлой неделе один продвинутый аналитик из США решил узнать... в каких ресторанах McDonald’s стоит сломанная машина для мороженого. Для этого он перепроектировал внутреннюю систему API сети, чтобы каждую минуту в каждом ресторане страны размещать заказ на сумму в 18 752 долларов. После получения ответа от системы может ли ресторан реализовать такое количество мороженого, заказ отменяется, а на карте отмечается работоспособность автомата. Таким образом, ни одно макфлурри не было потрачено зря!
В твиттере уже просят создать такую же карту для других стран, а пока можно понаблюдать, как обстоят дела с мороженым на территории США 🙂
Например, на прошлой неделе один продвинутый аналитик из США решил узнать... в каких ресторанах McDonald’s стоит сломанная машина для мороженого. Для этого он перепроектировал внутреннюю систему API сети, чтобы каждую минуту в каждом ресторане страны размещать заказ на сумму в 18 752 долларов. После получения ответа от системы может ли ресторан реализовать такое количество мороженого, заказ отменяется, а на карте отмечается работоспособность автомата. Таким образом, ни одно макфлурри не было потрачено зря!
В твиттере уже просят создать такую же карту для других стран, а пока можно понаблюдать, как обстоят дела с мороженым на территории США 🙂