15 частых ошибок в данных от Visual Capitalist. Помню первый день, когда столкнулась с парадоксом Симпсона, очень долго не могла понять, что же не так))
❤61
Решила рассказать, какой у меня был прикол с парадоксом Симпсона. Помню, сидела и думала, что математика меня где-то обманывает, но не могла понять, где.
📍Как проявляется – когда в группах есть какая-то зависимость, а при их объединеннии она пропадает.
У меня были две группы пользователей: с платными и бесплатными триальными подписками. А внутри каждой еще две группы: одним рассылали письмо со статьей, а другим без. И была метрика, вроде открываемость, но может что-то посерьезнее. В разбивке по типам подписок статьи давали положительный эффект, а суммарно по группам негативный.
Я предполагала, что причина в разнице размеров выборок, но не знала, как это решается и что с этим делать.
Решается это нормализацией значений по количеству наблюдений в группах. Я тогда, кажется, ориентировалась на эту статью, но пока искала сейчас нашла еще очень милую и легко читаемую статью в формате комикса. Картинка оттуда – в разбивке по предметам побеждает 7A, а суммарно 7Б, но с нормализацией победит все равно 7А.
📍Как проявляется – когда в группах есть какая-то зависимость, а при их объединеннии она пропадает.
У меня были две группы пользователей: с платными и бесплатными триальными подписками. А внутри каждой еще две группы: одним рассылали письмо со статьей, а другим без. И была метрика, вроде открываемость, но может что-то посерьезнее. В разбивке по типам подписок статьи давали положительный эффект, а суммарно по группам негативный.
Я предполагала, что причина в разнице размеров выборок, но не знала, как это решается и что с этим делать.
Решается это нормализацией значений по количеству наблюдений в группах. Я тогда, кажется, ориентировалась на эту статью, но пока искала сейчас нашла еще очень милую и легко читаемую статью в формате комикса. Картинка оттуда – в разбивке по предметам побеждает 7A, а суммарно 7Б, но с нормализацией победит все равно 7А.
❤90
pylustrator – пакет на Python который поможет вам подготовить графики к публикации. Можно интерактивно изменить размеры, подписи и все само сохранится в код.
https://youtu.be/xXPI4LLrNuM
https://youtu.be/xXPI4LLrNuM
YouTube
pylustrator demonstration
This short video demonstrates how pylustrator can be used to interactively enhance matplotlib plots. https://pylustrator.readthedocs.io
Just import pylustrator and activate it and your matplotlib default window is transformed into an interactive editor!…
Just import pylustrator and activate it and your matplotlib default window is transformed into an interactive editor!…
❤86
Прекрасная статья от Lisa Charlotte Muth про текст в визуализации. Некоторые ее советы:
- Подписывайте данные напрямую. Я больше за то, чтобы подписывать линии в конце, а не посередине, как в примере.
- Повторяйте информацию там, где она может быть полезна: подпишите единицы измерения на оси или продубдлируйте информацию в тултипе.
- Добавляйте аннотации. Даже в бизнес дэши можно притянуть какой-нибудь гуглдок с датами и помечать необычные кейсы.
- Текст помогает задавать направление чтения, поэтому старайтесь делать дизайн таким образом, чтобы глаза сразу понимали, что самое важное, что нет. Чем жирнее и больше текст, тем быстрее его заметят, а какую-то доп информацию можно делать серой и тонкой.
- Не используйте много шрифтов и начертаний (я обычно беру один шрифт и сочетаю жирный с нежирным и черный с серым)
- Выравнивайте текст по краям, а не по середине и делайте подписи читабельными.
- Делайте заголовки короткими и понятным.
- Убирайте излишнюю детализацию числовых значений.
- Подписывайте данные напрямую. Я больше за то, чтобы подписывать линии в конце, а не посередине, как в примере.
- Повторяйте информацию там, где она может быть полезна: подпишите единицы измерения на оси или продубдлируйте информацию в тултипе.
- Добавляйте аннотации. Даже в бизнес дэши можно притянуть какой-нибудь гуглдок с датами и помечать необычные кейсы.
- Текст помогает задавать направление чтения, поэтому старайтесь делать дизайн таким образом, чтобы глаза сразу понимали, что самое важное, что нет. Чем жирнее и больше текст, тем быстрее его заметят, а какую-то доп информацию можно делать серой и тонкой.
- Не используйте много шрифтов и начертаний (я обычно беру один шрифт и сочетаю жирный с нежирным и черный с серым)
- Выравнивайте текст по краям, а не по середине и делайте подписи читабельными.
- Делайте заголовки короткими и понятным.
- Убирайте излишнюю детализацию числовых значений.
❤101
Про дублирование информации в тултипах, кстати, интересная дикуссия может быть. Я раньше пыталась вставлять в тултипы прямо по максимуму: если метрику показываешь, то и все приросты и абсолютные разницы, короче чего я только туда не пихала. Тип почему бы и нет, вдруг будет кому-то очень важно))
Сейчас все больше понимаю, что инфа в тултипе – это ровно та же когнитивная нагрузка, что и на графике и с ней может быть тяжело работать. Возможно это более осознанное желание получить информацию – в том плане, что ты специально куда-то наводишь, чтобы что-то посмотреть, но все равно лучше не перегружать.
Короче начинаю тултипы свои потихоньку сокращать и оставлять там только информацию важную для понимания контекста (периоды данных, референсные значения, иногда методы расчета метрики). Чтобы тултип был не слишком excessive и помогал, а не накидывал инфы столько, что потом не разгрести.
Понравилась вот эта статья про тултипы (больше про дизайн дизайн, но интересно): https://www.nngroup.com/articles/tooltip-guidelines/
Например, если вся информация уже есть текстом, то то же самое добавлять в тултип смысла нет. И форматирование ровно такое же как и с текстом: один шрифт, не больше 2-3 типов начертаний, и управление вниманием при помощи разных размеров и жирности текста.
Сейчас все больше понимаю, что инфа в тултипе – это ровно та же когнитивная нагрузка, что и на графике и с ней может быть тяжело работать. Возможно это более осознанное желание получить информацию – в том плане, что ты специально куда-то наводишь, чтобы что-то посмотреть, но все равно лучше не перегружать.
Короче начинаю тултипы свои потихоньку сокращать и оставлять там только информацию важную для понимания контекста (периоды данных, референсные значения, иногда методы расчета метрики). Чтобы тултип был не слишком excessive и помогал, а не накидывал инфы столько, что потом не разгрести.
Понравилась вот эта статья про тултипы (больше про дизайн дизайн, но интересно): https://www.nngroup.com/articles/tooltip-guidelines/
Например, если вся информация уже есть текстом, то то же самое добавлять в тултип смысла нет. И форматирование ровно такое же как и с текстом: один шрифт, не больше 2-3 типов начертаний, и управление вниманием при помощи разных размеров и жирности текста.
Nielsen Norman Group
Tooltip Guidelines
Tooltips are user-triggered messages that provide additional information about a page element or feature. Although tooltips aren’t new to the web, they are often incorrectly implemented.
❤27
Вы наверняка замечали, что некоторые языки звучат быстрее, а некоторые как будто медленнее. И например, один и тот же текст на японском был бы длиннее, чем на английском, а на тайском наоборот короче. Но если этот текст прочитать вслух, то на прочтение уйдёт примерно одинаковое время.
Люди, которые говорят на простых языках, ускоряют темп и разговор получается более коротким. А те, кто говорят на более сложных – дольше планируют предложение и удлиняют разговор. Но в обоих случаях информация передаётся примерно в одном темпе и скорость восприятия около одна.
https://www.economist.com/graphic-detail/2019/09/28/why-are-some-languages-spoken-faster-than-others
Люди, которые говорят на простых языках, ускоряют темп и разговор получается более коротким. А те, кто говорят на более сложных – дольше планируют предложение и удлиняют разговор. Но в обоих случаях информация передаётся примерно в одном темпе и скорость восприятия около одна.
https://www.economist.com/graphic-detail/2019/09/28/why-are-some-languages-spoken-faster-than-others
❤59
The Pudding подогнали прикольную штуку, чуть похоже немного на Wordle, но соревновательный эффект оч затягивает. Играешь с каким-то рандомным человеком в слова: нужно писать слова, которые содержат букву или сочетание букв или которые рифмуются.
Я проиграла, но не расстроилась)) Сразу такой напрягаешься и пытаешься вспомните все, что можешь.
Я проиграла, но не расстроилась)) Сразу такой напрягаешься и пытаешься вспомните все, что можешь.
❤33
Forwarded from Европейский. Просто о сложном
Кто научит визуализации на хакатоне «ХАРТ»? #афиша
Совсем скоро, 29 и 30 октября, в Европейском пройдет хакатон по визуализации данных в области культуры, организованный центром МАСТ и Школой искусств и культурного наследия.
Вот здесь можно подробнее познакомиться с программой хакатона.
А сейчас хотим немного больше рассказать о наставниках, которые помогут участникам за 2 дня создать собственные проекты.
Обо основах анализа и визуализации данных расскажут дата-журналист Андрей Дорожный, дизайнер инфографики Константин Мшагский и дата-художник Наталья Киселева, автор канала Дата-комиксы. С помощью практических заданий участников научат работать в инструменте Tableau, а затем помогут им в создании собственных визуализаций на основе заранее подготовленных датасетов.
«Хакатоны, основанные на данных о музеях, произведениях искусства или культурных объектах, событие довольно редкое. И для нас очень важно привлечь студентов, которые исследуют разные области знания, вне зависимости от уровня их навыков визуализации, и дать им необходимые инструменты для работы с данными» — поделились организаторы ХАРТа.
До 10 октября (включительно) еще можно успеть подать заявку на участие, ознакомившись с Положением. Для этого переходите по ссылке: https://clck.ru/uR4ph
Совсем скоро, 29 и 30 октября, в Европейском пройдет хакатон по визуализации данных в области культуры, организованный центром МАСТ и Школой искусств и культурного наследия.
Вот здесь можно подробнее познакомиться с программой хакатона.
А сейчас хотим немного больше рассказать о наставниках, которые помогут участникам за 2 дня создать собственные проекты.
Обо основах анализа и визуализации данных расскажут дата-журналист Андрей Дорожный, дизайнер инфографики Константин Мшагский и дата-художник Наталья Киселева, автор канала Дата-комиксы. С помощью практических заданий участников научат работать в инструменте Tableau, а затем помогут им в создании собственных визуализаций на основе заранее подготовленных датасетов.
«Хакатоны, основанные на данных о музеях, произведениях искусства или культурных объектах, событие довольно редкое. И для нас очень важно привлечь студентов, которые исследуют разные области знания, вне зависимости от уровня их навыков визуализации, и дать им необходимые инструменты для работы с данными» — поделились организаторы ХАРТа.
До 10 октября (включительно) еще можно успеть подать заявку на участие, ознакомившись с Положением. Для этого переходите по ссылке: https://clck.ru/uR4ph
❤15
Я уже, кажется, несколько раз постила 3D карты высот и каждый раз они вызывают у меня неописуемый восторг. Мои самые любимые от Sean Conway с мельчайшими деталями и невероятно красивыми цветами.
Евгений Матеров прислал свои работы в таком же стиле и поделился источниками для вдохновения и реализации. Все на R! Но будьте готовы к тому, что рендеринг одной такой карты может занимать несколько часов.
В основном используется библиотека rayshader и плагин rayvista, позволяющий делать 3D визуализации. Евгений таким образом визуализировал горы России и непокоренные вершины мира.
Источники вдохновения:
- https://somethingaboutmaps.wordpress.com/2022/01/13/towards-less-blender-y-relief/
- https://stamen.com/shadows-on-maps-are-getting-a-lot-more-exciting-and-heres-why/
- курс по визуализации гео-данных от Тимофея Самсонова
Евгений Матеров прислал свои работы в таком же стиле и поделился источниками для вдохновения и реализации. Все на R! Но будьте готовы к тому, что рендеринг одной такой карты может занимать несколько часов.
В основном используется библиотека rayshader и плагин rayvista, позволяющий делать 3D визуализации. Евгений таким образом визуализировал горы России и непокоренные вершины мира.
Источники вдохновения:
- https://somethingaboutmaps.wordpress.com/2022/01/13/towards-less-blender-y-relief/
- https://stamen.com/shadows-on-maps-are-getting-a-lot-more-exciting-and-heres-why/
- курс по визуализации гео-данных от Тимофея Самсонова
❤60