Forwarded from vc.ru
«Яндекс», Benchmark Capital и Index Ventures открыли компанию ClickHouse.
Она будет делать коммерческие продукты на основе одноимённой системы управления базами данных. В сумме инвесторы вложили в проект $50 млн
vc.ru/services/295690
Она будет делать коммерческие продукты на основе одноимённой системы управления базами данных. В сумме инвесторы вложили в проект $50 млн
vc.ru/services/295690
На предыдущих конференциях иногда начинал свой доклад с простых примеров в деятельности маркетологов, которые часто используют среднее как основной показатель для различных KPI. Самый типичный пример — средний чек. В ряде случаев использование среднего арифмитического вводило маркетологов, которые использовали эту метрику, в заблуждение, т.к. большой объем крупных покупок (юр.лица, замаскированные под физ.лица) не учитывался в этом расчете.
В несложном новом материале блога рассматриваем и изучаем различия между медианой и средним арифметическим.
В несложном новом материале блога рассматриваем и изучаем различия между медианой и средним арифметическим.
LEFT JOIN
Различия между медианой и средним арифметическим как целевым показателем анализа данных
В сегодняшней статье мы бы хотели осветить простую, но в то же время важную тему выбора простой метрики для оценки того или иного датасета. Со средним арифметическим все давным давно знакомы, чуть ли не каждый школьник отлично знает, что нужно просуммировать…
Ребята на Youtube-канале Listen IT рассказывают про различные IT-технологии в коротких роликах, и, в частности, делится про SQL/NoSQL базы данных и упоминают аналитические каналы, которые читают сами
#кросспост
#кросспост
Любопытная статья с провокационным названием Is BI dead? В статье о том, чем должны быть BI-инструменты сегодня, а чем быть не должны с точки зрения автора (спойлер BI сегодня — это точно не комбайн ETL/ELT, метаслоев и визуализации).
benn.substack
Is BI dead?
On dismantling data's ship of Theseus.
Новость о появлении desktop-версии JupyterLab под Mac, Win и Linux.
Medium
JupyterLab Desktop App now available!
We are pleased to announce the release of desktop application for JupyterLab!
Абсолютно блестящая новость, достойная вечера пятницы: A single person answered 76k questions about SQL on StackOverflow
Наконец-то созрел сделать подборку аналитических блогов в телеграме в виде новой статьи блога. Однако, чтобы было интереснее подборка составлена не вручную, а на основе графа связей, построенного с помощью Python. В качестве стартовой точки были взяты тексты телеграм-канала Интернет-аналитика и выделены те аналитические каналы, на которые Леша Никушин в нем ссылался. Получился список таких каналов и процедура проделана еще раз, итеративно: мы взяли тексты всех записей этих каналов и распарсили их, нашли упоминания всех других аналитических телеграм-каналов. С парсингом текстов помогал стажер Андрей, а затем я построил граф связей на основе полученных данных, используя тулзу из Georgia Tech.
В результате по показателю degree (количество связей), топ-10 каналов выглядит так:
1. Интернет-аналитика @internetanalytics
2. Reveal The Data @revealthedata
3. Инжиниринг Данных @rockyourdata
4. Data Events @data_events
5. Datalytics @datalytx
6. Чартомойка @chartomojka
7. LEFT JOIN @leftjoin
8. Epic Growth @epicgrowth_chat
9. RTD: ссылки и репосты @rtdlinks
10. Дашбордец @dashboardets
По-моему, получилось супер-круто и визуально интересно (тул немного глючит, поэтому сделайте зум-аут в правом нижнем углу), а Андрей – большой молодец! Кстати, он тоже начал свой канал «Это разве аналитика?», где публикуются новости аналитики.
Забегая вперед: у этой задачи имеется продолжение. С помощью Марковской цепи мы смоделировали в каком канале окажется пользователь, если будет переходить итеративно по всем упоминаниям в каналах. Получилось очень интересно, но об этом мы расскажем в следующий раз!
В результате по показателю degree (количество связей), топ-10 каналов выглядит так:
1. Интернет-аналитика @internetanalytics
2. Reveal The Data @revealthedata
3. Инжиниринг Данных @rockyourdata
4. Data Events @data_events
5. Datalytics @datalytx
6. Чартомойка @chartomojka
7. LEFT JOIN @leftjoin
8. Epic Growth @epicgrowth_chat
9. RTD: ссылки и репосты @rtdlinks
10. Дашбордец @dashboardets
По-моему, получилось супер-круто и визуально интересно (тул немного глючит, поэтому сделайте зум-аут в правом нижнем углу), а Андрей – большой молодец! Кстати, он тоже начал свой канал «Это разве аналитика?», где публикуются новости аналитики.
Забегая вперед: у этой задачи имеется продолжение. С помощью Марковской цепи мы смоделировали в каком канале окажется пользователь, если будет переходить итеративно по всем упоминаниям в каналах. Получилось очень интересно, но об этом мы расскажем в следующий раз!
LEFT JOIN
Граф телеграм-каналов по теме аналитики
Авторы самых разных блогов в телеграме часто публикуют подборки любимых каналов, которыми они хотят поделиться со своей аудиторией. Идея, конечно, не новая, но я решил не просто составить рейтинг интересных аналитических телеграм-блогов, а решить эту задачу…
Пару полезных онлайн-сервисов, которые недавно подглядел на HackerNews:
* SQlime.org от Антона Жиянова — минималистичная клауд песочница для работы с SQlite базой данных
* Extract Table from image — сервис для получения таблицы из картинки
* SQlime.org от Антона Жиянова — минималистичная клауд песочница для работы с SQlite базой данных
* Extract Table from image — сервис для получения таблицы из картинки
Sqlime
Sqlime - Online SQLite playground
Sqlime is an online SQLite playground for debugging and sharing SQL snippets.
Классное overview способов визуализации деревьев решений и идеи по современным способам их отображения.
Вчера завершилась онлайн конференция по современному open source data stack, о которой писал ранее.
Несколько докладов с конференции:
* Доклад от Head of Product Meltano ELT
* Доклад от product manager dbt и соведущей подкаста Analytics Engineering. В докладе в основном демка dbt.
* Доклад от фаундера Preset
Несколько докладов с конференции:
* Доклад от Head of Product Meltano ELT
* Доклад от product manager dbt и соведущей подкаста Analytics Engineering. В докладе в основном демка dbt.
* Доклад от фаундера Preset
Telegram
LEFT JOIN
Конференция по современному open-source data stack в онлайне: пройдет 28-30 сентября. Можно зарегистрироваться на сайте.
Хотелось бы чуть больше познакомиться с подписчиками, как бы вы себя охарактеризовали?
Anonymous Poll
22%
Переквалифицируюсь в аналитика
19%
Junior data-спец/аналитик
21%
Middle data-спец/аналитик
10%
Senior data-спец/аналитик
2%
Маркетолог/Digital-маркетолог
4%
Продакт/проджект-менеджер
4%
Head of Data/Data Engineering/Analytics/ML/Data Science
2%
Руководитель бизнес-направления (маректинг, продакт и т.п.)
3%
Топ-менеджер / Собственник / Владелец компании
13%
Хочу посмотреть ответы
В среду принял участие в подкасте Data Coffee, где рассказал кое-что про BI, dbt и, конечно же, про кофе ☕️
Слушайте и подписывайтесь, у ребят уже вышло много интересных выпусков 🎧
Слушайте и подписывайтесь, у ребят уже вышло много интересных выпусков 🎧
Forwarded from Data Coffee
В День Кофе ☕️ отлично поговорили с кандидатом экономических наук, специалистом и руководителем в области данных и BI, который по совместительству ещё и владелец online-магазина кофе. В гостях у подкаста “Data Coffee” — Николай Валиотти!
В честь праздника получили для слушателей подкаста промокод на заказ кофе 🔥🔥🔥
#datacoffee #podcast #data #подкаст #данные #кофе
https://anchor.fm/data-coffee/episodes/19-----SQL--dbt--BI-e185g4a
В честь праздника получили для слушателей подкаста промокод на заказ кофе 🔥🔥🔥
#datacoffee #podcast #data #подкаст #данные #кофе
https://anchor.fm/data-coffee/episodes/19-----SQL--dbt--BI-e185g4a
Spotify for Creators
19. Кофейный бизнес, SQL, dbt и BI (гостевой) by Data Coffee
Тема выпуска "Кофейный бизнес, SQL, dbt и BI"
В гостях у подкаста `Data Coffee` кандидат экономических наук, специалист и руководитель в области BI, руководитель компании Valiotti Analytics — Николай Валиотти (Сайт, Telegram)
Подкаст `Data Coffee` — информационный…
В гостях у подкаста `Data Coffee` кандидат экономических наук, специалист и руководитель в области BI, руководитель компании Valiotti Analytics — Николай Валиотти (Сайт, Telegram)
Подкаст `Data Coffee` — информационный…
Совершенно кайфовый ресурс — визуальное введение в машинное обучение. К сожалению, по-русски у меня почему-то выдает ошибку 500. Но очень красиво и понятно сделано 😍
www.r2d3.us
A visual introduction to machine learning
What is machine learning? See how it works with our animated data visualization.
Data Project Manager — миф или реальность?
Ранее размещал инфу о вакансии проджект-менеджера. И, на удивление, не нашел откликов (в тч и на hh). В начале подумал, что с описанием что-то не так и пробовал разный нейминг вакансии, а затем лишь впоследствии осознал, что на самом деле такой профессии на рынке нет в широком смысле этого слова. Ей нигде не учат. Наверное, в каком-то смысле предполагалось, что моя исходная специальность в ВУЗе про это (информационные системы в экономике), однако проджект-менеджменту нас там уж точно не учили (справедливости ради: как рисовать диаграммы Гантта в MS Project мы проходили). Короче говоря, приходится самим выращивать специалистов внутри, давать эту самую доменную экспертизу в дате, аналитике и так далее.
Вот и вопрос к уважаемым мной @KarpovCourses и @practicumtech: появится ли такая специальность? Ждать ли в будущем подобных специалистов? 🤔
Предлагаю дискуссию в комментах — ваши мысли на этот счет? Есть ли такая профессия сегодня или это редкий вид?
Ранее размещал инфу о вакансии проджект-менеджера. И, на удивление, не нашел откликов (в тч и на hh). В начале подумал, что с описанием что-то не так и пробовал разный нейминг вакансии, а затем лишь впоследствии осознал, что на самом деле такой профессии на рынке нет в широком смысле этого слова. Ей нигде не учат. Наверное, в каком-то смысле предполагалось, что моя исходная специальность в ВУЗе про это (информационные системы в экономике), однако проджект-менеджменту нас там уж точно не учили (справедливости ради: как рисовать диаграммы Гантта в MS Project мы проходили). Короче говоря, приходится самим выращивать специалистов внутри, давать эту самую доменную экспертизу в дате, аналитике и так далее.
Вот и вопрос к уважаемым мной @KarpovCourses и @practicumtech: появится ли такая специальность? Ждать ли в будущем подобных специалистов? 🤔
Предлагаю дискуссию в комментах — ваши мысли на этот счет? Есть ли такая профессия сегодня или это редкий вид?
Рассказываю про продолжение нашего исследования. Я поделился с Андреем файликом из CSE-6040. Там одно из прикольных заданий было разобраться с авиаперелетами в US и построить матрицу, в которой посчитаны вылеты из аэропорта А в аэропорт Б, затем посчитаны вероятности оказаться аэропорту i. После, используем матрицу и марковскую цепь для расчета потенциального состояния, где окажется пассажир, если он рандомно бесконечно вылетает.
И вот мы решили проделать тот же самый эксперимент, поскольку граф и количество связей у нас уже было собрано.
В результате получилось очень интересно. Например, нашли сайд-эффект: ряд телеграм-каналов ссылались только друг на друга, однако ряд крупных телеграм-каналов ссылался на них.
Вместе с тем получили топ-10 "финальных" состояний для двух вариантов расчета вероятностей. С результатом можно ознакомиться в Colab, который Андрей под моим пристальным взглядом любезно собрал.
Расскажите в комментах, на кого из каналов в полученных списках вы подписаны и почему?
И вот мы решили проделать тот же самый эксперимент, поскольку граф и количество связей у нас уже было собрано.
В результате получилось очень интересно. Например, нашли сайд-эффект: ряд телеграм-каналов ссылались только друг на друга, однако ряд крупных телеграм-каналов ссылался на них.
Вместе с тем получили топ-10 "финальных" состояний для двух вариантов расчета вероятностей. С результатом можно ознакомиться в Colab, который Андрей под моим пристальным взглядом любезно собрал.
Расскажите в комментах, на кого из каналов в полученных списках вы подписаны и почему?
Начинается горячая пора осенних конференций и митапов, открываю свое турне петербургским SmartData — конференцией для дата инженеров. Поговорим о self-service подходе и, надеюсь, живо подискутируем.
У ребят насыщенная четырехдневная программа, довольно высокие требования к докладам по теме (чего только стоят подготовительные дискуссии с легендарным своей ежемесячной рассылкой Jet Brains Data Engineering Пашей Финкельштейном), поэтому должно быть интересно. Конференция пройдет онлайн, но я буду выступать из студии 🎙
See ya!
У ребят насыщенная четырехдневная программа, довольно высокие требования к докладам по теме (чего только стоят подготовительные дискуссии с легендарным своей ежемесячной рассылкой Jet Brains Data Engineering Пашей Финкельштейном), поэтому должно быть интересно. Конференция пройдет онлайн, но я буду выступать из студии 🎙
See ya!
SmartData 2025. Конференция по инженерии данных
SmartData 2025 — конференция по инженерии данных. Технические доклады о хранилищах данных, стриминге, data governance, архитектуре DWH и другом, применимые в работе дата-инженера.
Forwarded from SmartData — конференция по инженерии данных
Одной из основных тенденций в бизнес-аналитике становится использование решений класса Self-service BI.
Николай Валиотти на SmartData 2021 покажет, как создается Self-service BI на примере датасета магазина электронной коммерции. Николай расскажет о системе контроля версий для построения модели данных, рассмотрит лучшие практики и представит инструмент Looker. Рекомендуем доклад всем, кто хочет развивать self-service подход в своей компании.
Подробности и билеты: https://vk.cc/c6F0fX
Николай Валиотти на SmartData 2021 покажет, как создается Self-service BI на примере датасета магазина электронной коммерции. Николай расскажет о системе контроля версий для построения модели данных, рассмотрит лучшие практики и представит инструмент Looker. Рекомендуем доклад всем, кто хочет развивать self-service подход в своей компании.
Подробности и билеты: https://vk.cc/c6F0fX
Довольно старенький пост, но симпатично. Интуитивно понятное интерактивное объяснение принципа работы метода к-средних для кластеризации с использованием d3.js.
#визуализация
#визуализация
TECH-NI Blog
Visualizing K-Means algorithm with D3.js
The K-Means algorithm is a popular and simple clustering algorithm. This visualization shows you how it works.Step RestartN (the number of node):K (the number of cluster):NewClick figure or push [Step] button to go to next step.Push [Restart] button to go...