Совершенно кайфовый ресурс — визуальное введение в машинное обучение. К сожалению, по-русски у меня почему-то выдает ошибку 500. Но очень красиво и понятно сделано 😍
www.r2d3.us
A visual introduction to machine learning
What is machine learning? See how it works with our animated data visualization.
Data Project Manager — миф или реальность?
Ранее размещал инфу о вакансии проджект-менеджера. И, на удивление, не нашел откликов (в тч и на hh). В начале подумал, что с описанием что-то не так и пробовал разный нейминг вакансии, а затем лишь впоследствии осознал, что на самом деле такой профессии на рынке нет в широком смысле этого слова. Ей нигде не учат. Наверное, в каком-то смысле предполагалось, что моя исходная специальность в ВУЗе про это (информационные системы в экономике), однако проджект-менеджменту нас там уж точно не учили (справедливости ради: как рисовать диаграммы Гантта в MS Project мы проходили). Короче говоря, приходится самим выращивать специалистов внутри, давать эту самую доменную экспертизу в дате, аналитике и так далее.
Вот и вопрос к уважаемым мной @KarpovCourses и @practicumtech: появится ли такая специальность? Ждать ли в будущем подобных специалистов? 🤔
Предлагаю дискуссию в комментах — ваши мысли на этот счет? Есть ли такая профессия сегодня или это редкий вид?
Ранее размещал инфу о вакансии проджект-менеджера. И, на удивление, не нашел откликов (в тч и на hh). В начале подумал, что с описанием что-то не так и пробовал разный нейминг вакансии, а затем лишь впоследствии осознал, что на самом деле такой профессии на рынке нет в широком смысле этого слова. Ей нигде не учат. Наверное, в каком-то смысле предполагалось, что моя исходная специальность в ВУЗе про это (информационные системы в экономике), однако проджект-менеджменту нас там уж точно не учили (справедливости ради: как рисовать диаграммы Гантта в MS Project мы проходили). Короче говоря, приходится самим выращивать специалистов внутри, давать эту самую доменную экспертизу в дате, аналитике и так далее.
Вот и вопрос к уважаемым мной @KarpovCourses и @practicumtech: появится ли такая специальность? Ждать ли в будущем подобных специалистов? 🤔
Предлагаю дискуссию в комментах — ваши мысли на этот счет? Есть ли такая профессия сегодня или это редкий вид?
Рассказываю про продолжение нашего исследования. Я поделился с Андреем файликом из CSE-6040. Там одно из прикольных заданий было разобраться с авиаперелетами в US и построить матрицу, в которой посчитаны вылеты из аэропорта А в аэропорт Б, затем посчитаны вероятности оказаться аэропорту i. После, используем матрицу и марковскую цепь для расчета потенциального состояния, где окажется пассажир, если он рандомно бесконечно вылетает.
И вот мы решили проделать тот же самый эксперимент, поскольку граф и количество связей у нас уже было собрано.
В результате получилось очень интересно. Например, нашли сайд-эффект: ряд телеграм-каналов ссылались только друг на друга, однако ряд крупных телеграм-каналов ссылался на них.
Вместе с тем получили топ-10 "финальных" состояний для двух вариантов расчета вероятностей. С результатом можно ознакомиться в Colab, который Андрей под моим пристальным взглядом любезно собрал.
Расскажите в комментах, на кого из каналов в полученных списках вы подписаны и почему?
И вот мы решили проделать тот же самый эксперимент, поскольку граф и количество связей у нас уже было собрано.
В результате получилось очень интересно. Например, нашли сайд-эффект: ряд телеграм-каналов ссылались только друг на друга, однако ряд крупных телеграм-каналов ссылался на них.
Вместе с тем получили топ-10 "финальных" состояний для двух вариантов расчета вероятностей. С результатом можно ознакомиться в Colab, который Андрей под моим пристальным взглядом любезно собрал.
Расскажите в комментах, на кого из каналов в полученных списках вы подписаны и почему?
Начинается горячая пора осенних конференций и митапов, открываю свое турне петербургским SmartData — конференцией для дата инженеров. Поговорим о self-service подходе и, надеюсь, живо подискутируем.
У ребят насыщенная четырехдневная программа, довольно высокие требования к докладам по теме (чего только стоят подготовительные дискуссии с легендарным своей ежемесячной рассылкой Jet Brains Data Engineering Пашей Финкельштейном), поэтому должно быть интересно. Конференция пройдет онлайн, но я буду выступать из студии 🎙
See ya!
У ребят насыщенная четырехдневная программа, довольно высокие требования к докладам по теме (чего только стоят подготовительные дискуссии с легендарным своей ежемесячной рассылкой Jet Brains Data Engineering Пашей Финкельштейном), поэтому должно быть интересно. Конференция пройдет онлайн, но я буду выступать из студии 🎙
See ya!
SmartData 2025. Конференция по инженерии данных
SmartData 2025 — конференция по инженерии данных. Технические доклады о хранилищах данных, стриминге, data governance, архитектуре DWH и другом, применимые в работе дата-инженера.
Forwarded from SmartData — конференция по инженерии данных
Одной из основных тенденций в бизнес-аналитике становится использование решений класса Self-service BI.
Николай Валиотти на SmartData 2021 покажет, как создается Self-service BI на примере датасета магазина электронной коммерции. Николай расскажет о системе контроля версий для построения модели данных, рассмотрит лучшие практики и представит инструмент Looker. Рекомендуем доклад всем, кто хочет развивать self-service подход в своей компании.
Подробности и билеты: https://vk.cc/c6F0fX
Николай Валиотти на SmartData 2021 покажет, как создается Self-service BI на примере датасета магазина электронной коммерции. Николай расскажет о системе контроля версий для построения модели данных, рассмотрит лучшие практики и представит инструмент Looker. Рекомендуем доклад всем, кто хочет развивать self-service подход в своей компании.
Подробности и билеты: https://vk.cc/c6F0fX
Довольно старенький пост, но симпатично. Интуитивно понятное интерактивное объяснение принципа работы метода к-средних для кластеризации с использованием d3.js.
#визуализация
#визуализация
TECH-NI Blog
Visualizing K-Means algorithm with D3.js
The K-Means algorithm is a popular and simple clustering algorithm. This visualization shows you how it works.Step RestartN (the number of node):K (the number of cluster):NewClick figure or push [Step] button to go to next step.Push [Restart] button to go...
И еще анонсы на ноябрь, раньше с Ромой работали за соседним столом, а теперь вот выступаем 😎
Forwarded from Матемаркетинг: новости конференций
Питер едет на Матемаркетинг!
Матемаркетинг собирает спикеров со всего мира, и жители Северной столицы не остаются в стороне. Со спикерами, которые приедут в Москву, можно будет встретиться в оффлайне уже 18 ноября и послушать их доклады. Вот некоторые из них:
Николай Валиотти, основатель и главный аналитик Valiotti Analytics - Этапы проектирования BI-платформы, которая позволяет строить отчеты и получать данные специалистам без знания SQL
Михаил Алексеев, Okko - Эксперименты на нескольких платформах: как принимать решение, когда метрики расходятся
Рома Осокин, OHM - Изменения в ключевых рекламных системах и типах кампаний после выхода iOS 14+ & SKAD Network, следующий вызов от Google и как подготовиться к 2022
- - - -
✅ Матемаркетинг-21 пройдет 18-19 ноября в Москве, а также будет доступен в онлайне.
↪️ Программа и все подробности доступны на нашем сайте.
- - - -
А пока рекомендуем посмотреть доклад Николая Валиотти с Матемаркетинга прошлого года, в котором он рассказывает о BI-системах и разбирает подходы к разработке дашбордов.
Матемаркетинг собирает спикеров со всего мира, и жители Северной столицы не остаются в стороне. Со спикерами, которые приедут в Москву, можно будет встретиться в оффлайне уже 18 ноября и послушать их доклады. Вот некоторые из них:
Николай Валиотти, основатель и главный аналитик Valiotti Analytics - Этапы проектирования BI-платформы, которая позволяет строить отчеты и получать данные специалистам без знания SQL
Михаил Алексеев, Okko - Эксперименты на нескольких платформах: как принимать решение, когда метрики расходятся
Рома Осокин, OHM - Изменения в ключевых рекламных системах и типах кампаний после выхода iOS 14+ & SKAD Network, следующий вызов от Google и как подготовиться к 2022
- - - -
✅ Матемаркетинг-21 пройдет 18-19 ноября в Москве, а также будет доступен в онлайне.
↪️ Программа и все подробности доступны на нашем сайте.
- - - -
А пока рекомендуем посмотреть доклад Николая Валиотти с Матемаркетинга прошлого года, в котором он рассказывает о BI-системах и разбирает подходы к разработке дашбордов.
matemarketing.ru
MM’25 — Конференция для аналитиков, performance-маркетологов и product-менеджеров
Крупнейшая конференция по маркетинговой и продуктовой аналитике в России, СНГ и Восточной Европе. Даты: 20–21 ноября 2025, онлайн-день — 11 ноября.
Как и для чего экспортировать красивые отчеты из Jupyter Notebook в PDF? 📗
Мы недавно проводили опрос в канале и выяснили, что многие только начинают свой путь в аналитику. Сегодняшний пост будет полезен, ведь мы расскажем об одном из самых важных навыков аналитика — формировании красивого отчета о проделанной работе. Если вы специалист по анализу данных и вам нужно представить отчет для заказчика, если вы ищете работу и не знаете, как лучше всего оформить тестовое задание, если у вас есть учебные проекты, связанные с аналитикой и визуализацией данных, то скорее читайте дальше.
Часто заказчику смотреть на ваши результаты аналтики в Jupyter Notebook бывает проблематично, ведь важная информация часто теряется между строчками кода с подготовкой данных, импортом нужных библиотек и серией попыток реализовать ту или иную идею. В посте мы рассказывает про экспорт ноутбука в PDF-файл в формате LaTeX — это отличный вариант для итоговой визуализации. Он сэкономит время и будет выглядеть презентабельно: графики и таблицы сразу помещаются в документ, верстка отчета происходит автоматически, ячейки с кодом не мешают восприятию информации, а вам нужно лишь выделить важные элементы работы для экспорта и расставить заголовки.
В новой статье блога вы можете посмотреть, как правильно вставлять в отчет графики из Plotly, таблицы в формате LaTeX, а также как экспортировать документ без лишней информации — без кода и сообщений о работе ячейки.
Желаем всем красивых отчетов 👍
Мы недавно проводили опрос в канале и выяснили, что многие только начинают свой путь в аналитику. Сегодняшний пост будет полезен, ведь мы расскажем об одном из самых важных навыков аналитика — формировании красивого отчета о проделанной работе. Если вы специалист по анализу данных и вам нужно представить отчет для заказчика, если вы ищете работу и не знаете, как лучше всего оформить тестовое задание, если у вас есть учебные проекты, связанные с аналитикой и визуализацией данных, то скорее читайте дальше.
Часто заказчику смотреть на ваши результаты аналтики в Jupyter Notebook бывает проблематично, ведь важная информация часто теряется между строчками кода с подготовкой данных, импортом нужных библиотек и серией попыток реализовать ту или иную идею. В посте мы рассказывает про экспорт ноутбука в PDF-файл в формате LaTeX — это отличный вариант для итоговой визуализации. Он сэкономит время и будет выглядеть презентабельно: графики и таблицы сразу помещаются в документ, верстка отчета происходит автоматически, ячейки с кодом не мешают восприятию информации, а вам нужно лишь выделить важные элементы работы для экспорта и расставить заголовки.
В новой статье блога вы можете посмотреть, как правильно вставлять в отчет графики из Plotly, таблицы в формате LaTeX, а также как экспортировать документ без лишней информации — без кода и сообщений о работе ячейки.
Желаем всем красивых отчетов 👍
LEFT JOIN
Как и для чего экспортировать красивые отчеты из Jupyter Notebook в PDF
Если вы специалист по анализу данных и вам нужно представить отчет для заказчика, если вы ищете работу и не знаете, как оформить тестовое задание так, чтобы на вас обратили внимание, если у вас много учебных проектов, связанных с аналитикой и визуализацией…
Офигенная работа с текстом и визуализацией информации: разбор структуры стенда-апа и причины продолжительного смеха над шуткой, очень круто сделано 😍
#визуализация
#визуализация
The Pudding
The Structure of Stand-Up Comedy
The genius of Ali Wong’s Netflix special.
🎧 В последнем выпуске Data Engineering подкаста автор MetriQL (про которую я недавно писал) рассказывает про идею созданию и про концепцию взаимодействия с разными сторонними BI-инструментами.
#podcast
#podcast
Apple Podcasts
«Data Engineering Podcast»: «Make Your Business Metrics Reusable With Open Source Headless BI Using Metriql» в Apple Podcasts
Шоу «Data Engineering Podcast», выпуск «Make Your Business Metrics Reusable With Open Source Headless BI Using Metriql» от 8 окт. 2021 г.
Продолжу делиться информацией о датавизе: техника визуализации данных о текстовых кластерах и классный интерактивный пример на d3.js (пощелкайте там справа в селекторе Order)
#dataviz
#dataviz
Немного о моем сегодняшнем выступлении на SmartData: хорошая новость, оно будет доступно бесплатно всем желающим 🤓
Как посмотреть выступление?
1. Для просмотра нужно зарегистрироваться на сайте конференции, выбрав вариант билета COMMUNITY DAY.
2. Затем в 20:00 перейти на сайт трансляции и запустить ее.
3.🍿🍿🍿
Как посмотреть выступление?
1. Для просмотра нужно зарегистрироваться на сайте конференции, выбрав вариант билета COMMUNITY DAY.
2. Затем в 20:00 перейти на сайт трансляции и запустить ее.
3.🍿🍿🍿
SmartData 2025. Конференция по инженерии данных
SmartData 2025 | Персональный билет | Конференция по инженерии данных
Купить персональный билет на конференцию SmartData 2025.
Эфир с Алексеем Колоколовым
Не успел вчера сделать доклад на SmartData, как в субботу иду на прямой эфир в Инстаграме к Алексею Колоколову. Поговорим о жизни, проектах, карьере, аналитике и немного обо мне.
Алексей — тренер, основатель Института бизнес-аналитики и сообщества «Клуб анонимных аналитиков», автор книги «Дашборд для директора».
Подключайтесь в субботу, 16 октября, в 12.00, будет интересно.
Я уже рассказывал об этом у себя в инстаграме (подпишитесь, чтобы не пропустить), а эфир будет совместно с аккаунтом инстаграма Алексея.
Не успел вчера сделать доклад на SmartData, как в субботу иду на прямой эфир в Инстаграме к Алексею Колоколову. Поговорим о жизни, проектах, карьере, аналитике и немного обо мне.
Алексей — тренер, основатель Института бизнес-аналитики и сообщества «Клуб анонимных аналитиков», автор книги «Дашборд для директора».
Подключайтесь в субботу, 16 октября, в 12.00, будет интересно.
Я уже рассказывал об этом у себя в инстаграме (подпишитесь, чтобы не пропустить), а эфир будет совместно с аккаунтом инстаграма Алексея.
Telegram
Клуб анонимных аналитиков
Канал Алексея Колоколова, директора Института бизнес-аналитики. Автоматизирую корпоративную отчетность, обучаю аналитике и визуализации данных.
Навигация: https://news.1rj.ru/str/analyst_club/3
Чат клуба: https://news.1rj.ru/str/+1cO-ZjpIJtRkODJi
Навигация: https://news.1rj.ru/str/analyst_club/3
Чат клуба: https://news.1rj.ru/str/+1cO-ZjpIJtRkODJi
Squid Game retention rate на d3.js
Ничего особенного, просто собрал retention rate «Игры в кальмара» на d3.js.
Осторожно: спойлеры! 🍿🍿🍿
Ничего особенного, просто собрал retention rate «Игры в кальмара» на d3.js.
Осторожно: спойлеры! 🍿🍿🍿
Партнерство Tableau и Looker (Google)
На прошлой неделе Tableau объявил о партнерстве с Google и Looker в контексте Self-service аналитики, новость сама по себе очень интересная. Казалось бы, два конкурента в вопросах BI. Однако, кажется, Google в большей степени рассматривает Looker в качестве семантического слоя для описания данных в хранилище и видит перспективу именно в LookML, тогда как визуализацию данных можно отдать Tableau.
Я часто привожу ссылку на блог Benn Stancil, и сейчас в блоге есть соответствующая статья на этот счет: BI is dead.
А в статье любопытная цитата:
Looker choosing to partner with Tableau makes particular sense because Looker’s always been a transformation tool first, and a consumption tool second. Looker’s crown jewel is LookML; Tableau’s is visualization. I’d speculate that Looker originally built its visualization tooling in large part so that they could market and sell the value of LookML, rather than the other way around. By launching this integration, Looker is simply doubling down on that long-standing identity.
#ссылка
На прошлой неделе Tableau объявил о партнерстве с Google и Looker в контексте Self-service аналитики, новость сама по себе очень интересная. Казалось бы, два конкурента в вопросах BI. Однако, кажется, Google в большей степени рассматривает Looker в качестве семантического слоя для описания данных в хранилище и видит перспективу именно в LookML, тогда как визуализацию данных можно отдать Tableau.
Я часто привожу ссылку на блог Benn Stancil, и сейчас в блоге есть соответствующая статья на этот счет: BI is dead.
А в статье любопытная цитата:
Looker choosing to partner with Tableau makes particular sense because Looker’s always been a transformation tool first, and a consumption tool second. Looker’s crown jewel is LookML; Tableau’s is visualization. I’d speculate that Looker originally built its visualization tooling in large part so that they could market and sell the value of LookML, rather than the other way around. By launching this integration, Looker is simply doubling down on that long-standing identity.
#ссылка
Tableau
Self-Service Analytics for Google Cloud, now with Looker and Tableau
Tableau and Google Cloud are partnering to help unlock your data's full value. Tableau integrates with Looker, BigQuery, Google Sheets, and more.
Ну, что, где ты и кто ты, пятитысячный подписчик? 🙂
На конференции SmartData у нас была очень интересная и живая дискуссия с приглашенным экспертом Юлией Чертковой, которая руководит направлением Big Data в Яндексе. Очень жаль, что дискуссия не записалась, так как в рамках нее мы говорили много про self-service, да и в целом про дискуссию аналитиков.
В связи с чем, несколько моментов:
1) Полезная ссылка от Юли по теме (ресурс по ссылкам на bi и self-service у нас, конечно, все тот же)
2) Свой доклад на SmartData я уже выложил на Youtube, но ссылочку пришлю чуть позже. Организаторам, конечно, неземной респект за сумасшедшее качество видео. 👏👏
3) Мне очень понравилась живая дискуссия с экспертом по теме, в рамках которой можно обсудить любопытные вопросы/актуальные темы, а сегодня Telegram позволяет устраивать классные голосовые и видео-чаты 🤔, поэтому опрос для моих самых лучших подписчиков ниже 🙂
P.S. Скоро также пришлю результаты опроса про аудиторию канала (там надо немного перевзвесить тех, кто пришел на результаты посмотреть, иначе непонятно).
На конференции SmartData у нас была очень интересная и живая дискуссия с приглашенным экспертом Юлией Чертковой, которая руководит направлением Big Data в Яндексе. Очень жаль, что дискуссия не записалась, так как в рамках нее мы говорили много про self-service, да и в целом про дискуссию аналитиков.
В связи с чем, несколько моментов:
1) Полезная ссылка от Юли по теме (ресурс по ссылкам на bi и self-service у нас, конечно, все тот же)
2) Свой доклад на SmartData я уже выложил на Youtube, но ссылочку пришлю чуть позже. Организаторам, конечно, неземной респект за сумасшедшее качество видео. 👏👏
3) Мне очень понравилась живая дискуссия с экспертом по теме, в рамках которой можно обсудить любопытные вопросы/актуальные темы, а сегодня Telegram позволяет устраивать классные голосовые и видео-чаты 🤔, поэтому опрос для моих самых лучших подписчиков ниже 🙂
P.S. Скоро также пришлю результаты опроса про аудиторию канала (там надо немного перевзвесить тех, кто пришел на результаты посмотреть, иначе непонятно).
benn.substack
Self-serve is a feeling
Lots of houses can be made a home.
❤1
Голосовые чаты LEFT JOIN — быть или не быть?
Anonymous Poll
6%
✅ Да, буду участвовать, комментировать и задавать вопросы
25%
✅ Да, приду послушать
45%
❌ Нет, трата времени
24%
👀 Поглядываю за результатами