This is Data – Telegram
This is Data
6.2K subscribers
168 photos
193 links
Канал Романа Романчука про аналитику и данные.

Рассказываю про метрики и мат.статистику. Обозреваю ENG и RUS статьи. Советую книги. Делюсь скриптами, ссылками, майндмэпами.

Сайт: https://thisisdata.ru
Задать вопрос: @romanchuk_roman
Download Telegram
Дайджест полезного и интересного за прошедшую неделю.
На этот раз он получился сугубо техническим, с уклоном в модный Data Mining.

Многие компании заинтересованы в машинном обучении, но не все знают с чего начать.
В статье "6 шагов по созданию проектов машинного обучения" раскрываются основные этапы, которые нужно пройти до создания готового проекта.

Материал "Подготовка данных в Data Science-проекте: рецепты для молодых хозяек" продолжает тему машинного обучения, рассказывая об одном из самых главных этапов, без которого ничего не выйдет.

Собрать нейронную сеть из базовых моделей может любой, кто хоть немного знаком с программированием. И даже не обязательно учить Python, всё можно сделать на JavaScript.
Как легко начать и зачем машинное обучение фронтенд-разработчикам в статье "Самый мягкий и пушистый путь в Machine Learning и Deep Neural Networks".

Почти все аналитики для поиска какого-либо значения используют SQL-оператор LIKE, но его проблема в медленной работе и слишком большой нагрузке на сервер.
В материале "2 лайфхака: альтернативы классическому поиску в Microsoft SQL Server" рассказывается про функционал полнотекстового поиска, который работает в сотни раз быстрее при поиске записи по миллионным таблицам.

Напоследок отличная новость - в Google BigQuery появились программные возможности (бета) и теперь помимо выборки, вы можете написать собственный скрипт по извлечению, преобразованию или загрузке данных.
И кстати, в одной из ближайших статей я расскажу о программировании на языке SQL и чем это может быть полезно аналитику. Ждите анонса!

#дайджест
Дайджест полезного и интересного за прошедшую неделю.

На VC опубликована статья "Словарь мобильного аналитика" с основными терминами и метриками, которые используются в аналитике мобильных приложений.

Продолжает мобильную тему материал "От идеи мобильного приложения до MVP, в который вложатся инвесторы".
Статья совсем не про аналитику, но полезна для понимания жизненного цикла и этапов разработки приложений.

В статье "Как оптимизировать контекстную рекламу при малом числе конверсий?" рассказывается, как при помощи Google Analytics настроить отслеживание микроконверсий и перестроить рекламу так, чтобы она привлекала на сайт наиболее заинтересованную аудиторию.

В материале "Как быстро понять, что вы переплачиваете CPA-сетке" раскрывается простой способ вычисления фрода при помощи отчетов Google Analytics "Основные пути конверсии" и "Статистика по пользователям".

#дайджест
​​Многие аналитики работающие с SQL и занимающиеся анализом данных, никогда не сталкивались с программированием на этом языке, потому что SQL в первую очередь язык структурированных запросов, а не полноценный язык программирования.
Однако, программные возможности в нем есть, хотя и весьма скромные.

В тот момент, когда при написании запроса мы сталкиваемся с какими-либо ограничениями, например синтаксическими, нам может пригодиться программирование.
В своей новой статье я расскажу о программных конструкциях и модулях существующих в SQL и чем они могут помочь аналитику.
🔥1
Дайджест полезного и интересного за прошедшую неделю

Александр Осиюк опубликовал список полезных возможностей в BigQuery, неочевидных даже для опытных пользователей "SQL лайфхаки в BigQuery, о которых вы точно не знали".

Алексей Чернобровов опубликовал статью "Монетизация Big Data: как бизнесу заработать на данных?", в которой рассказал о способах монетизации данных для компаний и физических лиц, а также о том, насколько выгодной и легальной является купля-продажа информации.

Руководитель факультета Data Science онлайн-университета "Нетология" Елена Герасимова составила подробный путеводитель по миру науки о данных "Большой гид по Data Science для начинающих: термины, применение, образование и вход в профессию".

В своей новой статье "Децильный метод или сокращение дисперсии" Виталий Черемисинов разбирает, как децильный анализ может помочь при сокращении дисперсии и увеличении чувствительности метрики.

Ведущий production-менеджер Adventum Владислав Анищенко в своей статье "Audience Network в Facebook: абсолютное зло или целевой источник трафика?" расскажет, как работает плейсмент и может ли он быть эффективным для рекламы.

Алексей Селезнёв проанализировал 3,9 миллионов кликов в 15 тематиках и 646 городах страны. Результаты в исследовании "Сколько стоил клик в Google Ads и Яндекс.Директ в России во втором квартале 2019 года".

#дайджест
👍1
Дайджест полезного и интересного за прошедшую неделю

Термин «Сквозная аналитика» регулярно используется на рекламном рынке, но если спросить у 10 людей, что же такое сквозная аналитика, то мы получим 10 разных ответов.
Эксперт Яндекса по обучению и евангелист К50 Павел Мрыкин, решил разобраться с этим вопросом в статье «Сквозная аналитика. Все ли понимают этот термин одинаково?» и провел опрос среди аналитиков, маркетологов и предпринимателей.

Многие люди уверены в том, что интернет-гиганты всех нас подслушивают через микрофон смартфонов.
Правда ли это или миф читайте в блоге Касперского (пост достаточно старый, но попался на глаза только сейчас).

Изданиям, зарабатывающим на контенте, важно понимать, кто из авторов создаёт более интересные материалы и какие тематики получают больше всего просмотров.
Команда Яндекс.Метрики добавила в раздел «Контент» новые отчёты — по авторам и по тематикам издания.

В конце октября компания Google начала отключать отчеты Google Аналитики для мобильных приложений на основе Google Analytics Services SDK для Android и iOS.
В статье «Firebase: анализируем пользователей мобильных приложений по-новому» читайте о новом инструменте для анализа пользователей мобильных приложений.

Искусственный интеллект пока ещё очень молод. Однако в этой области произошло уже много значимых событий. Некоторые из них привлекли внимание культуры, другие породили взрывную волну, воспринятую только учёными.
В материале «10 самых важных вех в развитии ИИ на сегодняшний день» читайте о ключевых моментах, наиболее сильно повлиявших на развитие ИИ.

#дайджест
Дайджест полезного и интересного

Лаптев Алексей, основатель сервиса Utmstat, подготовил материал в котором, с точки зрения разработчика, описал существующие типы настройки сквозной аналитики, а также рассказал про рынок в целом.

Максим Годзи, автор системы продуктовой и маркетинговой аналитики Retentioneering, в своей статье рассказывает почему директор по маркетингу это «расстрельная» должность и что с этим делать.

На Хабре опубликована расшифровка нашумевшего интервью специалиста по Big Data Артура Хачуяна, в котором он рассказал зачем за нами следят в соцсетях и кто продает наши данные.

Компания Microsoft опубликовала бесплатный курс по машинному обучению, в ходе которого вы самостоятельно проведете анализ климатических изменений, спрогнозируете задержки авиарейсов и проанализируете настроение отзывов пользователей.

#дайджест
Совсем недавно прошли конференции Яндекса и Google для финансовой индустрии, где специалисты и приглашенные эксперты рассказали о последних трендах на рынке интернет-рекламы и аналитики, а также показали на кейсах от крупнейших клиентов, как получить максимальную отдачу от вложений в рекламу и маркетинг.
Делюсь с вами темами докладов и ссылками на материалы.

Конференция Яндекса для финансовой индустрии:
- Как цифровые платформы помогают быть ближе к клиентам;
- Трансформация рекламной экосистемы Яндекса;
- Аналитика финансовой индустрии;
- Оптимизация кампаний Директа: основные принципы работы над улучшением качественных показателей банка (ROI);
- 1000 и один тест;
- Как найти людей, которые не отличаются ничем (кроме поведения в офлайне);
- Как привлечь клиента в условиях одинаковых УТП;
- Оцениваем верхний этап воронки конверсии: post-view аналитика рекламы;
- Новые спецпроекты на Яндексе;
- Как продвигать программу лояльности с заботой о пользователе;
- Как привлечь новых клиентов в финансовой сфере?;
- AppMetrica для приложений банков: анализ аудитории и продукта в одной платформе.
Видео и презентации доступны по ссылке.

Think Finance 2019:
- О чем говорит российский финансовый рынок;
- Глобальные изменения в финансовой индустрии;
- Как ищут банковские продукты в России по данным Google;
- Видеореклама – от рассказа о вашем бренде до продажи продукта;
- Кейс. Сбербанк – Как привлекать новые вклады через Youtube;
- Кейс. Как Почта Банк снизил стоимость заявки на кредит в 3 раза и улучшил показатели воронки продаж с помощью TrueView for Action;
- Как банки используют рекламу в поиске на 100%;
- Кейс. ОТП Банк и Совкомбанк. Выживет только performance: как синхронизировать медийные кампании и задачи бизнеса;
- Кейс. Сфера и RealWeb: Снизить стоимость конверсий на 25% при помощи Campaign Manager + Search Ads 360;
- Блок Digital maturity – цифровая трансформация бизнеса;
- Кейс. Как Райффайзенбанк вырастил онлайн продажи в 2 раза;
- Блок Digital maturity – Тактика внедрения;
- Новинки мобильных технологий и UX playbook для категории финансы;
- Новый канал привлечения клиентов для банков;
- Кейс. Tinkoff. Инвестиции, UAC и переворот игры;
- Кейс. Продвижение финтех продукта на примере карты Совесть.
Видео и презентации доступны по ссылке.
Дайджест полезного и интересного

На Хабре вышла очень интересная статья от команды Dodo Pizza Engineering о том, как накопить все данные в компании и дать любому сотруднику удобный доступ к этому массиву данных и при этом сохранить нервы.

Там же опубликован отличнейший материал о трендах BI-аналитики с анализом важнейших сделок и выводами о будущем рынка.

VC радует второй частью исследования, которое затеял евангелист компании К50 Павел Мрыкин, на тему «Сквозная аналитика: все ли понимают этот термин одинаково».

На Rusbase вышел материал Владислава Флакса (СEO OWOX), в котором он разбирает чем может грозить недопонимание при общении исполнительного директора и директора по маркетингу (материал будет полезен и для аналитиков, как переводчик с языка бизнеса).

На VC опубликован годный гайд от ребят из агентства Adgasm по созданию отчёта по контекстной рекламе, начиная с создания справочника нейминга кампаний до построения дашборда в Google Data Studio.

#дайджест
Дайджест полезного и интересного

Оксана Прутьянова, руководитель практики найма аналитиков и data scientists в компании New HR, рассказала о том, как выглядят карьерные траектории в сфере работы с данными.

Евангелист компании К50 Павел Мрыкин, продолжает свое исследование на тему «Все ли понимают термин сквозная аналитика одинаково». В этот раз можно ознакомиться с мнениями маркетологов.

В комьюнити DataYoga опубликована прекрасная коллекция визуализаций благодаря которой, можно сэкономить кучу времени и изучить все плюсы и минусы различных типов визуализации данных.

Егор Матешук, senior data engineer в MaximaTelecom, рассказал о принципах построения систем потоковой аналитики, а также сравнил между собой сильные и слабые стороны потоковой и пакетной обработки данных.

#дайджест
👍1
Дайджест полезного и интересного

На VC опубликовано интервью с датасаентистом компании McKinsey Александром Лабутем, в котором он рассказывает о том, как жажда новых знаний помогает развиваться, о важности soft skills, горизонтальных оргструктурах и жизни на несколько стран и проектов одновременно.

Елена Герасимова, руководитель факультета Data Science в «Нетологии», в интервью Rusbase рассказывает, что сейчас происходит со сферой Data Science, какие изменения трансформируют профессии и как специалисту остаться востребованным в новых реалиях рынка труда.

На Хабре попалась достаточно интересная статья, автор которой при помощи Python, провел анализ выборов губернатора в Санкт-Петербурге и определил некоторые «волшебные» закономерности.

Яндекс представил новый инструмент — Яндекс.Метрику для медийной рекламы. Новый инструмент позволяет оценивать не только охват размещений, но и конверсии, которые обеспечили баннеры и видео — при этом учитываются и те конверсии, которые произошли спустя некоторое время после контакта с рекламой.

#дайджест
👍1
Рад представить вам нового автора блога This is Data — Валерию Новицкую.

В своей первой статье Валерия расскажет вам о том, какие бывают аналитики и чем они отличаются друг от друга, а в новом году представит цикл статей на тему системного анализа.
В них вы найдете ответы на следующие вопросы:
- Как можно реализовать транспорт данных?
- Что такое системный рефакторинг и зачем он нужен?
- Какой бывает системная документация и почему важно ее наличие?

Поэтому, если вы решили найти свое призвание именно в системном анализе, оставайтесь с нами 😉

Первая статья уже доступна по ссылке.
Welcome!

#статья
👍1
Данные – это три кита, на которых держится любой бизнес, и от того, насколько грамотно эти данные обращаются в системах, зависят рост и успех компании.

В новой статье мы рассмотрим основные технологии обмена данными, пережившие эволюцию и доказавшие свою состоятельность в бизнесе.

#статья
👍1
В своей прошлой статье я рассказывал про программные возможности языка SQL и обещал поделиться кейсом по созданию автоматизированного отчета на основе стека технологий MS SQL Server и Power BI.

Кейс готов, делюсь 😉

#статья
👍2
Наконец-то закончил статью на одну из самых сложных для понимания тем - оконные функции в SQL.
На ее написание ушло почти пять месяцев с перерывом на отпуск :)

В статье на простых примерах с картинками разбирается принцип работы данных функций, а в конце вас ждут кейсы с расчетом моделей атрибуции «Первый клик» и «С учетом давности взаимодействий».

#статья
🔥5👍1
Рассказал проекту JMS University про карьерный трек веб-аналитика, необходимый стек и то, на что стоит обратить внимание новичкам в этой области.

#статья
Друзья, привет!

Рад поделиться третьей статьей из серии материалов о системном анализе.
В этот раз речь пойдет о таком понятии, как системный рефакторинг, о его видах, а также будет дано несколько советов как выстроить рефакторинг в своей команде.

#статья
Друзья, привет!

В своей новой статье рассказал о том, как устроена аналитика в Сравни и что нам с коллегами удалось построить за последние пару лет.

Эта часть вводная, в следующих статьях планирую детальнее раскрыть нашу «аналитическую кухню» — трекинг, отчетность, создание DWH, A/B-тесты и даже найм.

#статья
Друзья, привет!

Как и обещал, делюсь подробным рассказом о том, как начиналась аналитика в Сравни и с какими проблемами пришлось столкнуться.

В статье я попытался осмыслить само понятие «аналитика» и ее роль в жизни бизнеса.

А также подробно разобрал тонкости правильной настройки трекинга — от внедрения UTM-разметки, до создания карты событий и настройки GTM.

#статья
👍3
Рассказал Rusbase о том, как заместить аналитическую инфраструктуру и не потерять в качестве данных и предоставляемых выводов.

Данная статья будет полезна как аналитикам, так и руководителям смежных подразделений.

#статья
🤯3
Друзья, привет!

Моя коллега, Ксения Шипулина, подготовила отличный материал о основных лайфхаках, проблемах и ошибках, которые возникают при проведении A/B-тестов.

Если такие словосочетания, как «Fake door тест», «P-hacking» или «Cherry picking» вводят вас в замешательство, то мы знаем, как это исправить.

#статья
🔥21👍95
Дал комментарии для ppc.world к статье «23 фишки Google Analytics 4, которых нет в Universal Analytics»:

«Логика, заложенная в Universal Analytics: сеансы, «пользователи», события состоящие из четырех параметров, уже давно морально устарела и требовала обновлений. Поэтому я всячески приветствую Google Analytics 4 и уже внедрил новую версию во все проекты, с которыми работаю.

Также большим плюсом является возможность установки одного трекера на сайт и в мобильное приложение, что позволит создать единую систему событий для разных интерфейсов взаимодействия с пользователем. А это сильно облегчит работу по анализу рекламных кампаний и созданию отчетности.»
👍16🤔21