В прошлом году я делал подборку хороших бесплатных курсов фундаментального математического образования доступного бесплатно и онлайн (на английском языке).
А вчера наткнулся на очень интересную подборку полной программы бесплатного образования в Computer Science. Программа разбита на годы и семестры и состоит из видео и плейлистов на Youtube.
А вчера наткнулся на очень интересную подборку полной программы бесплатного образования в Computer Science. Программа разбита на годы и семестры и состоит из видео и плейлистов на Youtube.
Telegram
LEFT JOIN
Бытует мнение, что аналитик в наше время может обойтись без уверенной математической базы (об этом гласят многие программы подготовки аналитиков). С моей же точки зрения тяжело рассуждать о вероятности оттока, не понимая теории вероятностей, сложно говорить…
Диаграмма в виде воронки позволяет визуализировать достижение целей по ряду этапов: например, конверсию пользователей. В новом материале блога рассказываем, как построить такую воронку в Tableau:
https://leftjoin.ru/all/funnel-chart-v-tableau/
https://leftjoin.ru/all/funnel-chart-v-tableau/
LEFT JOIN
Funnel chart в Tableau
Диаграмма в виде воронки — хороший выбор визуализации, если стоит задача отобразить достижение целей по ряду этапов. Сегодня мы посмотрим, как получить такую диаграмму в Tableau. Таблица из примера доступна в нашем репозитории на GitHub Данные должны быть…
Запись моего первого выступления на Матемаркетинг в прошлом году (всего выступлений было два)
Forwarded from Интернет-аналитика // Алексей Никушин
Какой он - современный облачный data-стек?
Николай Валиотти ( @leftjoin) объясняет подход к проектированию аналитической инфраструктуры, обосновывает использование Clickhouse при построении облачной аналитики и рассказывает о его же нюансах и говорит про Redash с точки зрения инструмента для визуализации.
Смотреть видео - YouTube, ~20 минут
@internetanalytics
Николай Валиотти ( @leftjoin) объясняет подход к проектированию аналитической инфраструктуры, обосновывает использование Clickhouse при построении облачной аналитики и рассказывает о его же нюансах и говорит про Redash с точки зрения инструмента для визуализации.
Смотреть видео - YouTube, ~20 минут
@internetanalytics
YouTube
Николай Валиотти, Valiotti Analytics - Облачный datastack
Совсем скоро Матемаркетинг-22, 17-18 ноября
Подробности: https://matemarketing.ru/
Программа: https://clck.ru/y6jEV
Купить билет: https://matemarketing.ru/
Доклад Николая Валиотти на конференции "Матемаркетинг-2020".
Полный доступ ко всем докладам: http…
Подробности: https://matemarketing.ru/
Программа: https://clck.ru/y6jEV
Купить билет: https://matemarketing.ru/
Доклад Николая Валиотти на конференции "Матемаркетинг-2020".
Полный доступ ко всем докладам: http…
На днях Денис Соловьев (@ds_im) из канала Smart Data взял мини-интервью о том, чем и как занимается наша компания, какие роли в нашей команде. Рассказываю об этом Денису и его подписчикам в соответствующем посте (ниже сделаю репост).
А вообще у Дениса аж три мини-интервью получилось сразу, поэтому можно их все и прочитать.
А вообще у Дениса аж три мини-интервью получилось сразу, поэтому можно их все и прочитать.
Telegram
Smart Data
Канал про Data Engineering, аналитику и данные.
По всем вопросам: @ds_im
По всем вопросам: @ds_im
Forwarded from Smart Data (Denis Solovyov)
Николай Валиотти:
"В основном мы работаем с различными digital и мобильными стартапами, помогаем им выстроить end-to-end аналитику.
Другими словами, мы работаем со спектром задач от проектирования хранилища / озера данных, построения процессов инжиниринга данных до построения отчетности и иногда даже некоторых моделей машинного обучения.
Персонально я успел поработать в ряде крупных организаций и занимался анализом данных с разнообразным стеком решений, однако в последние годы перед стартом своей компании работал в стартапе, который уже тогда начал работать с так называемым modern data stack. Меня это невероятно увлекло и вдохновило на то, чтобы и другие компании могли компетентно использовать современные облачные решения и получать максимальную пользу от собственных данных.
Мы в некотором смысле стартап (по духу), хотя, конечно, больше развиваемся как традиционная консалтинговая компания. У нас небольшой штат сотрудников и соответствующих ролей, о которых речь пойдет дальше.
Поскольку работаем параллельно с несколькими проектами одновременно бОльшая часть команд кросс-функциональна, что означает, что в каждом проекте есть выделенный сотрудник, который лидирует по проекту, а другие коллеги функционально помогают ему в достижении поставленной цели.
Среди наших сотрудников имеются:
Data Engineer - работы с построением архитектуры хранилища, среди инструментов Kafka, Airflow, среди СУБД: BigQuery, Redshift, Clickhouse, Redshift, Vertica, MySQL, разумеется, SQL и Pythoh.
Analytics Engineer - работы с инструментов dbt, построение моделей данных в Looker, работа с Python для обработки данных, естественно, SQL
2x Data Analyst - мы используем ряд инструментов в зависимости от потребностей и возможностей заказчика: Tableau, Looker, Redash, PowerBI и Metabase, ребята умеют работать в этих инструментах и естественно используют SQL. Ряд задач, например, построение классификационных моделей мы строим с использованием Python, используем Jupyter, в некоторых случаях Collab.
2x Junior Data Analyst - помогают более старшим аналитикам и решают более маленькие кусочки задач с тем же стеком технологий.
В будущем планирую выстраивать организационную структуру, поскольку найм сотрудников горизонтально все-таки невозможен бесконечно и система из более 7 человек будет работать неэффективно"
"В основном мы работаем с различными digital и мобильными стартапами, помогаем им выстроить end-to-end аналитику.
Другими словами, мы работаем со спектром задач от проектирования хранилища / озера данных, построения процессов инжиниринга данных до построения отчетности и иногда даже некоторых моделей машинного обучения.
Персонально я успел поработать в ряде крупных организаций и занимался анализом данных с разнообразным стеком решений, однако в последние годы перед стартом своей компании работал в стартапе, который уже тогда начал работать с так называемым modern data stack. Меня это невероятно увлекло и вдохновило на то, чтобы и другие компании могли компетентно использовать современные облачные решения и получать максимальную пользу от собственных данных.
Мы в некотором смысле стартап (по духу), хотя, конечно, больше развиваемся как традиционная консалтинговая компания. У нас небольшой штат сотрудников и соответствующих ролей, о которых речь пойдет дальше.
Поскольку работаем параллельно с несколькими проектами одновременно бОльшая часть команд кросс-функциональна, что означает, что в каждом проекте есть выделенный сотрудник, который лидирует по проекту, а другие коллеги функционально помогают ему в достижении поставленной цели.
Среди наших сотрудников имеются:
Data Engineer - работы с построением архитектуры хранилища, среди инструментов Kafka, Airflow, среди СУБД: BigQuery, Redshift, Clickhouse, Redshift, Vertica, MySQL, разумеется, SQL и Pythoh.
Analytics Engineer - работы с инструментов dbt, построение моделей данных в Looker, работа с Python для обработки данных, естественно, SQL
2x Data Analyst - мы используем ряд инструментов в зависимости от потребностей и возможностей заказчика: Tableau, Looker, Redash, PowerBI и Metabase, ребята умеют работать в этих инструментах и естественно используют SQL. Ряд задач, например, построение классификационных моделей мы строим с использованием Python, используем Jupyter, в некоторых случаях Collab.
2x Junior Data Analyst - помогают более старшим аналитикам и решают более маленькие кусочки задач с тем же стеком технологий.
В будущем планирую выстраивать организационную структуру, поскольку найм сотрудников горизонтально все-таки невозможен бесконечно и система из более 7 человек будет работать неэффективно"
Forwarded from Дашбордец
В рамках задач self-service возможности Tableau, на мой субъективный взгляд, выше Power BI, но ненадолго. Charticulator позволяет создавать практически любой шаблон диаграммы, который затем можно импортировать в PowerBI.
https://charticulator.com/
Видеоуроки:
https://charticulator.com/docs/video-tutorials.html
Практический пример:
https://youtu.be/xS6GyVpt7lY
https://charticulator.com/
Видеоуроки:
https://charticulator.com/docs/video-tutorials.html
Практический пример:
https://youtu.be/xS6GyVpt7lY
Интересное комбо в статье по ссылке: построение моделей машинного обучения на движке BigQuery с использованием dbt
Forwarded from BigQuery Insights
Пошаговое руководство запуска моделей машинного обучения в dbt и BigQuery ML без проблем, связанных с управлением инфраструктурой.
@BigQuery
@BigQuery
Как-то раз на YouTube мы нашли гайд по Radial Pie Gauge Chart в Tableau. Нам он очень понравился — диаграмма сильно напоминает кольца активности Apple Watch. Но по задумке автора кольца графика останавливаются на 270 градусах, а все цели сравниваются только между собой. Мы доработали график — показываем, как сделать масимально приближенную к кольцам активности реализацию в Tableau:
https://leftjoin.ru/all/radial-pie-v-tableau/
https://leftjoin.ru/all/radial-pie-v-tableau/
leftjoin.ru
Radial pie в Tableau
Недавно мы завели аккаунт в Instagram (подпишитесь!). В новом материале расскажем о том, как с использованием Python и Selenium можно автоматизировать часть действий в социальной сети.
Что с этим делать — на усмотрение читателя. Решения для масслайкинга и массфоловинга решили не описывать в силу их сомнительной легитимности и эффективности.
https://leftjoin.ru/all/instagram-python-selenium-bot/
Что с этим делать — на усмотрение читателя. Решения для масслайкинга и массфоловинга решили не описывать в силу их сомнительной легитимности и эффективности.
https://leftjoin.ru/all/instagram-python-selenium-bot/
leftjoin.ru
Робот для автоматизированного просмотра Instagram на Python и Selenium
Один из самых популярных и известных алгоритмов кластеризации — k-means, его знает каждый, кто хоть как-то начинал работу с методами машинного обучения.
Совершенно понятно, что про k-means уже написано огромное количество материалов, что на R, что на Python, но мне попалась интересная ссылка-визуализация того, как работает алгоритм.
Если только начинаете знакомиться, то можно довольно быстро понять принцип обновления центроидов в кластерах.
Совершенно понятно, что про k-means уже написано огромное количество материалов, что на R, что на Python, но мне попалась интересная ссылка-визуализация того, как работает алгоритм.
Если только начинаете знакомиться, то можно довольно быстро понять принцип обновления центроидов в кластерах.
Из поста особенно понравилась табличка сравнения (отправлю ниже). Но, кажется, что ошиблись c Redash и not query centric.
Forwarded from DataEng
Кейс Dropbox по использованию Apache Superset: https://dropbox.tech/application/why-we-chose-apache-superset-as-our-data-exploration-platform
dropbox.tech
Why we chose Apache Superset as our data exploration platform
Для планирования своих ежедневных дел я использую приложение Хаос-контроль, которое доступно как на мобильных устройствах, так и на десктопе.
Недавно я давал интервью создателю приложения о том, что такое тайм-менеджмент для меня, как я управляю своими делами и проектами и как использую приложение автора.
Рекомендую само приложение и делюсь своими соображениями в интервью.
#ссылка #интервью
Недавно я давал интервью создателю приложения о том, что такое тайм-менеджмент для меня, как я управляю своими делами и проектами и как использую приложение автора.
Рекомендую само приложение и делюсь своими соображениями в интервью.
#ссылка #интервью
Хаос-контроль
Интервью с Николаем Валиотти
Мы решили попробовать новый для нас формат публикаций - интервью с пользователями Хаос-контроля. Многие из вас - профессионалы своего дела, у которых есть чему научиться. Поэтому в серии статей #пользователиХК мы будем общаться с интересными людьми на темы…
📈 DATAMARATHON.RU 📈
Сегодня расскажу о запуске авторского обучающего проекта для погружения в область аналитики. MVP был в прошлом году опробован на близким круге знакомых, с тех пор был существенно изменен и переработан.
В интернете много клёвого бесплатного контента: наши коллеги из коммьюнити делают курсы, а мировые вузы выкладывают программы обучения в открытый доступ. Для тех, кто хочет получить профессию, поддержку и хорошую подачу материала есть также и море платных курсов. И всё же, иногда совсем не хочется тратить большие деньги и пару месяцев своего времени на полный теоретический курс, чтобы понять, подходит тебе профессия аналитика или нет.
Мы решили, что нужен пробный курс, который позволяет за 7 дней погрузиться в профессию и назвали его «Марафон данных». Получилась целая разработка по-взрослому: фронтенд в виде чат-бота с материалами, видео-лекциями и заданиями, бэкенд и API, рейтинги, несколько тарифов с обратной связью и без — поэтому наш марафон платный.
При этом базовый тариф стоит смешных денег — 2900 рублей, но если нужны персональные консультации — тоже велком в тарифы с поддержкой инструктора и персональной обратной связью.
Внутри — авторские видео по каждой теме из марафона, уникальные задачи из реального опыта, шпаргалки и вспомогательные материалы.
На выходе — ясное понимание, интересно ли вам углубляться в тему анализа данных, базовое владение базами данных, SQL и аналитическим аппаратом Python.
Бонусом: успеем даже собрать аналитический дашборд на Redash.
👉 Ознакомиться с программой марафона и принять участие 🎟.
Сегодня расскажу о запуске авторского обучающего проекта для погружения в область аналитики. MVP был в прошлом году опробован на близким круге знакомых, с тех пор был существенно изменен и переработан.
В интернете много клёвого бесплатного контента: наши коллеги из коммьюнити делают курсы, а мировые вузы выкладывают программы обучения в открытый доступ. Для тех, кто хочет получить профессию, поддержку и хорошую подачу материала есть также и море платных курсов. И всё же, иногда совсем не хочется тратить большие деньги и пару месяцев своего времени на полный теоретический курс, чтобы понять, подходит тебе профессия аналитика или нет.
Мы решили, что нужен пробный курс, который позволяет за 7 дней погрузиться в профессию и назвали его «Марафон данных». Получилась целая разработка по-взрослому: фронтенд в виде чат-бота с материалами, видео-лекциями и заданиями, бэкенд и API, рейтинги, несколько тарифов с обратной связью и без — поэтому наш марафон платный.
При этом базовый тариф стоит смешных денег — 2900 рублей, но если нужны персональные консультации — тоже велком в тарифы с поддержкой инструктора и персональной обратной связью.
Внутри — авторские видео по каждой теме из марафона, уникальные задачи из реального опыта, шпаргалки и вспомогательные материалы.
На выходе — ясное понимание, интересно ли вам углубляться в тему анализа данных, базовое владение базами данных, SQL и аналитическим аппаратом Python.
Бонусом: успеем даже собрать аналитический дашборд на Redash.
👉 Ознакомиться с программой марафона и принять участие 🎟.