Коллеги из канала @rockyourdata проводят интересный вебинар по визуализации данных с Ромой из @revealthedata.
Рекомендую к просмотру 👨🎓
Рекомендую к просмотру 👨🎓
Forwarded from Инжиниринг Данных
А вот и ссылка на будущий вебинар! Роман один из топ экспертов по визуализации данных и созданию дашбордов! Такое нельзя пропустить!🤗 Сам с удовольствием посмотрю. Ставьте напоминание в ютубе. 15 июля (уже сегодня вечером). https://youtu.be/xSp5ykKcQho
YouTube
Алгоритм проектирования дашборда / Роман Бунин
🔔 Вебинар проведет Роман Бунин. Очень крутой руководитель команды визуализации из Яндекс.Такси. 🚕
Роман поделиться своими знаниями и ответит на все вопросы.
🔗 Линки:
Ссылка про пай-чарты
https://ig.ft.com/science-of-charts/
На миро:
https://miro.com/app…
Роман поделиться своими знаниями и ответит на все вопросы.
🔗 Линки:
Ссылка про пай-чарты
https://ig.ft.com/science-of-charts/
На миро:
https://miro.com/app…
Вторая часть цикла материалов о библиотеке Dash: сегодня построим простой дашборд с двумя регулируемыми параметрами на основе графика, который мы сделали в предыдущем материале и запустим его на локальном сервере.
http://leftjoin.ru/all/dashboard-python-1/
http://leftjoin.ru/all/dashboard-python-1/
leftjoin.ru
Делаем дашборд с параметром на Python
Продолжаем разбираться с библиотекой Dash: разворачиваем дашборд из прошлого материала на сервисе AWS Elastic Beanstalk.
http://leftjoin.ru/all/dashboard-python-2/
http://leftjoin.ru/all/dashboard-python-2/
leftjoin.ru
Деплой дашборда на AWS Elastic Beanstalk
В сегодняшнем материале учимся размечать готовый geojson файл с административными границами, чтобы визуализировать последние данные по коронавирусу на карте России.
http://leftjoin.ru/all/plotly-russian-map/
http://leftjoin.ru/all/plotly-russian-map/
leftjoin.ru
Визуализация данных на российской карте библиотекой Plotly
Спасибо каналу @dataeng за подбор ссылок с саммита Apache Airflow 🙂
Удалось ознакомиться с перечисленными докладами, делюсь своими впечатлениями.
Автор доклада "Advanced Apache Superset for Data Engineers" из компании Preset рассказывает о возможностях Superset. Я предпочитаю Redash, но некоторые вещи в Superset из категории advanced features показались интересными:
* Например, можно определить не только пользовательский параметр в рамках SQL-запроса, но и пользовательскую функцию (в Jinja).
* Помимо этого в запросах по расписанию удобно можно задать output table для результатов, а сам запрос использовать в Airflow.
* Можно определить пользовательский плагин визуализации
* Можно динамически создавать графики через REST API (однако в самом докладе трюк не удался)
Второй доклад в основном рассказывает о пирамиде потребностей в данных организации, достаточно известный концепт о сравнении с пирамидой потребностей Маслоу, где в основе пирамиды — Data engineering, а в вершине — Machine Learning.
Доклад "Airflow the perfect match in our analytics pipeline" в большей степени об описании опыта использования Airflow в облачной инфраструктуре на больших массивах данных (десятки террабайт в дейтинге). В частности, автор рассказывает о том, как именно у них настроены DAGs в рамках аналитического пайплайна.
Из интересного: динамическое создание задач в Airflow как часть пайплайна.
Последний доклад из подборки посмотрел очень бегло, в частности, из-за менее понятного мне английского языка автора. Из ключевых хайлайтов в докладе: о месте Airflow в архитектуре, масштабировании. Отдельно можно отметить довольно подробное погружение в плагины Airflow (API).
Удалось ознакомиться с перечисленными докладами, делюсь своими впечатлениями.
Автор доклада "Advanced Apache Superset for Data Engineers" из компании Preset рассказывает о возможностях Superset. Я предпочитаю Redash, но некоторые вещи в Superset из категории advanced features показались интересными:
* Например, можно определить не только пользовательский параметр в рамках SQL-запроса, но и пользовательскую функцию (в Jinja).
* Помимо этого в запросах по расписанию удобно можно задать output table для результатов, а сам запрос использовать в Airflow.
* Можно определить пользовательский плагин визуализации
* Можно динамически создавать графики через REST API (однако в самом докладе трюк не удался)
Второй доклад в основном рассказывает о пирамиде потребностей в данных организации, достаточно известный концепт о сравнении с пирамидой потребностей Маслоу, где в основе пирамиды — Data engineering, а в вершине — Machine Learning.
Доклад "Airflow the perfect match in our analytics pipeline" в большей степени об описании опыта использования Airflow в облачной инфраструктуре на больших массивах данных (десятки террабайт в дейтинге). В частности, автор рассказывает о том, как именно у них настроены DAGs в рамках аналитического пайплайна.
Из интересного: динамическое создание задач в Airflow как часть пайплайна.
Последний доклад из подборки посмотрел очень бегло, в частности, из-за менее понятного мне английского языка автора. Из ключевых хайлайтов в докладе: о месте Airflow в архитектуре, масштабировании. Отдельно можно отметить довольно подробное погружение в плагины Airflow (API).
preset.io
Building Custom Viz Plugins in Superset v1
Create a new data visualization for Superset
Forwarded from DataEng
В сети стали доступны доклады с прошедшего Airflow Summit 2020.
Безусловно все докладчики выступали удалённо (мы этот год запомним навсегда)
Из докладов, которые хотелось бы отметить:
- Advanced Apache Superset for Data Engineers
- Data engineering hierarchy of needs
- Airflow the perfect match in our analytics pipeline
- Data flow with Airflow @ PayPal
Смотреть весь плейлист
Безусловно все докладчики выступали удалённо (мы этот год запомним навсегда)
Из докладов, которые хотелось бы отметить:
- Advanced Apache Superset for Data Engineers
- Data engineering hierarchy of needs
- Airflow the perfect match in our analytics pipeline
- Data flow with Airflow @ PayPal
Смотреть весь плейлист
YouTube
Advanced Apache Superset for Data Engineers
Maxime Beauchemin
Superset is the leading open source data exploration and visualization platform. In this talk, we’ll be presenting Superset with a focus on advanced topics that are most relevant to Data Engineers. The presentation will be largely a live…
Superset is the leading open source data exploration and visualization platform. In this talk, we’ll be presenting Superset with a focus on advanced topics that are most relevant to Data Engineers. The presentation will be largely a live…
Продолжаем разбираться с Untappd и перейдем к построению дашборда на основе Dash. Сегодня обсудим как можно использовать столь популярный в веб-разработке Bootstrap фреймворк для создания своего аналитического дашборда.
http://leftjoin.ru/all/untappd-bootstrap-dashboard-part-1/
http://leftjoin.ru/all/untappd-bootstrap-dashboard-part-1/
leftjoin.ru
Создаём дашборд на Bootstrap с нуля (Часть 1)
Достаточно давно я уже описывал опыт работы с сайтом налоговой для получения данных из чеков. К сожалению, старый метод больше не работает. Нам пришлось изрядно потрудиться и соорудить новый метод получения данных. О нем — в новом материале:
http://leftjoin.ru/all/nalog-ru-client/
http://leftjoin.ru/all/nalog-ru-client/
LEFT JOIN
Пишем клиент для нового API nalog.ru
UPD 29-09-2021: Мы обновили клиент. Теперь проходить аутентификацию можно по номеру телефона и подтверждению по SMS. Репозиторий на GitHub Ранее в блоге мы рассказывали, как благодаря открытому API можно собирать данные от ФНС по нашим чекам из магазинов…
Буквально пару дней назад завершили работу над сайтом консалтинговой аналитической компании имени меня.
Мы занимаемся построением аналитических хранилищ данных и настраиваем аналитику в основном для мобильных и digital-стартапов.
Приглашаю вас на наш новый сайт по адресу: https://valiotti.com.
На сайте вы сможете узнать чем мы занимаемся, изучить наши кейсы и убедиться, что мы супер! 😜
Мы занимаемся построением аналитических хранилищ данных и настраиваем аналитику в основном для мобильных и digital-стартапов.
Приглашаю вас на наш новый сайт по адресу: https://valiotti.com.
На сайте вы сможете узнать чем мы занимаемся, изучить наши кейсы и убедиться, что мы супер! 😜
Недавно мне на глаза попалась статья про то, что дашборды мертвы. Интересная точка зрения, однако под соусом их смерти продается работа с notebooks в целом и на одном конкретном сервисе в частности.
Подготовили перевод этой статьи на русский язык:
http://leftjoin.ru/all/dashbords-are-dead/
Подготовили перевод этой статьи на русский язык:
http://leftjoin.ru/all/dashbords-are-dead/
Medium
Dashboards are Dead
Dashboards have been the primary weapon of choice for distributing data over the last few decades, but they aren’t the end of the story…
Давайте посмотрим на наш рыночный срез: а как вы сейчас отдаёте результаты аналитики бизнесу?
Anonymous Poll
45%
Отчёты в формате .xls / .pptx / google sheets / и другие
33%
Отчёты в формате BI-систем, опубликованные онлайн
30%
Дашборды, опубликованные онлайн
9%
Ноутбуки с графиками и пояснениями
1%
Интерактивные ноутбуки с элементами интерфейса (aka Voilà)
11%
Иным образом
Полезно ознакомиться по нескольким причинам:
1) отличная возможность познакомиться с kaggle тем, кто не знаком
2) повторить pandas никогда не бывает лишним 🙂
3) у Алексея отличные заметки по Python, рекомендую его канал к изучению
1) отличная возможность познакомиться с kaggle тем, кто не знаком
2) повторить pandas никогда не бывает лишним 🙂
3) у Алексея отличные заметки по Python, рекомендую его канал к изучению
Forwarded from Datalytics
Нашёл на Kaggle микрокурс по изучению Pandas, оформленный в виде ноутбуков. Включает в себя разбор всех базовых функций, так что для ознакомления с возможностями библиотеки отлично подходит
https://www.kaggle.com/learn/pandas
https://www.kaggle.com/learn/pandas
Kaggle
Learn Pandas Tutorials
Solve short hands-on challenges to perfect your data manipulation skills.
Сентябрь наступил, и начинается активная пора всевозможных ивентов. Большая часть в этом году, как все уже понимают, будет в удаленном формате. На этой неделе опубликован список первой части докладов Матемаркетинга-2020, на котором в этом году приму участие.
Из зарубежных конференций рекомендую обратить внимание на https://www.futuredata.org/, которая состоится уже через 4 дня.
Чуть позже будут и другие анонсы.
#events
Из зарубежных конференций рекомендую обратить внимание на https://www.futuredata.org/, которая состоится уже через 4 дня.
Чуть позже будут и другие анонсы.
#events
www.futuredata.org
Future Data: Data Conference for Decision Makers and Data Teams
Future Data conference is the premiere event for data forward leaders, modern data technologists, and critical decision enablers defining the future of data.
Forwarded from Интернет-аналитика // Алексей Никушин (Алексей Никушин)
опубликовали половину программы Матемаркетинга
https://www.facebook.com/nikushin.av/posts/3476071119124454
https://www.facebook.com/nikushin.av/posts/3476071119124454
Интервью совершенно точно полезно начинающим и не только аналитикам. Алексей делится здравым смыслом, а Анатолий задает правильные вопросы. Самое то для просмотра в конце рабочей недели 🙂
Forwarded from Интернет-аналитика // Алексей Никушин (Алексей Никушин)
Это что-то невероятное
Анатолий Карпов @data_karpov берет интервью у Алексея Никушина @a_nikushin
Говорим про образование, курсы, настроения в @analysts_hunter, Матемаркетинг @MateMarketing_official и нелегкую жизнь аналитиков
https://www.youtube.com/watch?v=mome3DWQqg0
Анатолий Карпов @data_karpov берет интервью у Алексея Никушина @a_nikushin
Говорим про образование, курсы, настроения в @analysts_hunter, Матемаркетинг @MateMarketing_official и нелегкую жизнь аналитиков
https://www.youtube.com/watch?v=mome3DWQqg0
YouTube
Алексей Никушин: аналитика, маркетинг, МатеМаркетинг | Интервью | karpov.courses
Курс «Аналитик данных»: http://bit.ly/429Aj4i
В этот раз к нам в гости пришёл Алексей Никушин, основатель конференции МатеМаркетинг. Нам удалось поговорить о настоящем и будущем аналитики, в частности:
● Аналитик и маркетолог — это одно и тоже. Правда…
В этот раз к нам в гости пришёл Алексей Никушин, основатель конференции МатеМаркетинг. Нам удалось поговорить о настоящем и будущем аналитики, в частности:
● Аналитик и маркетолог — это одно и тоже. Правда…
Сегодня в канале много разного контента, не обошлось и без статьи. Интересная библиотека pandas-profiling, которая за вас попробует автоматически построить EDA (exploratory data analysis).
Подробности в материале блога.
Результаты библиотеки на датасете Superstore отдельной .html-страницей.
Подробности в материале блога.
Результаты библиотеки на датасете Superstore отдельной .html-страницей.
leftjoin.ru
Обзор библиотеки pandas-profiling на примере датасета Superstore Sales
LEFT JOIN
Давайте посмотрим на наш рыночный срез: а как вы сейчас отдаёте результаты аналитики бизнесу?
В результате: дашборды у нас еще не могут быть мертвы, так как не успели родиться 😂
47% всё ещё отдают результаты аналитической работы в книжках Excel / Google Sheets или презентациях.
47% всё ещё отдают результаты аналитической работы в книжках Excel / Google Sheets или презентациях.
Altinity выпустили обзор сравнения перфоманса Clickhouse и Redshift, несколько ключевых выводов:
+ В Clickhouse появилась возможность загружать данные из S3 табличной функцией s3()
+ Clickhouse на одной ноде несколько проигрывает Redshift по скорости выполнения запросов, но выигрывает на сопоставивом количестве нод
+ Стоимость операционного использования Clickhouse ощутимо ниже, чем Redshift (однако в статье не указан необходимый ресурс на поддержку того и иного решения)
+ В Clickhouse по-прежнему остаются ряд особенностей, которые следует учитывать при построении запроса.
Например, использование конструкции с JOIN до сих пор неэффективно, а замена JOIN на подзапросы дает значительный прирост в скорости.
+ В Clickhouse появилась возможность загружать данные из S3 табличной функцией s3()
+ Clickhouse на одной ноде несколько проигрывает Redshift по скорости выполнения запросов, но выигрывает на сопоставивом количестве нод
+ Стоимость операционного использования Clickhouse ощутимо ниже, чем Redshift (однако в статье не указан необходимый ресурс на поддержку того и иного решения)
+ В Clickhouse по-прежнему остаются ряд особенностей, которые следует учитывать при построении запроса.
Например, использование конструкции с JOIN до сих пор неэффективно, а замена JOIN на подзапросы дает значительный прирост в скорости.
Altinity | Run open source ClickHouse® better
ClickHouse Software And Services | Altinity
Deploy and operate ClickHouse, a lightning fast, open source SQL data warehouse for real-time analytics, time series, and log analysis.