настенька и графики – Telegram
настенька и графики
27.1K subscribers
2.62K photos
84 videos
15 files
3.18K links
Датавиз, аналитика и всякое полезное и интересное

💜 Кто я и что делаю: https://nastengraph.notion.site/nastengraph/Anastasiya-Kuznetsova-096ebfb42a9e4014b7700fa00fea54d6

🎓 Мой курс по основам датавиза: https://nastengraph.ru/
Download Telegram
15 частых ошибок в данных от Visual Capitalist. Помню первый день, когда столкнулась с парадоксом Симпсона, очень долго не могла понять, что же не так))
61
Решила рассказать, какой у меня был прикол с парадоксом Симпсона. Помню, сидела и думала, что математика меня где-то обманывает, но не могла понять, где.

📍Как проявляется – когда в группах есть какая-то зависимость, а при их объединеннии она пропадает.

У меня были две группы пользователей: с платными и бесплатными триальными подписками. А внутри каждой еще две группы: одним рассылали письмо со статьей, а другим без. И была метрика, вроде открываемость, но может что-то посерьезнее. В разбивке по типам подписок статьи давали положительный эффект, а суммарно по группам негативный.

Я предполагала, что причина в разнице размеров выборок, но не знала, как это решается и что с этим делать.

Решается это нормализацией значений по количеству наблюдений в группах. Я тогда, кажется, ориентировалась на эту статью, но пока искала сейчас нашла еще очень милую и легко читаемую статью в формате комикса. Картинка оттуда – в разбивке по предметам побеждает 7A, а суммарно 7Б, но с нормализацией победит все равно 7А.
90
pylustrator – пакет на Python который поможет вам подготовить графики к публикации. Можно интерактивно изменить размеры, подписи и все само сохранится в код.

https://youtu.be/xXPI4LLrNuM
86
Прекрасная статья от Lisa Charlotte Muth про текст в визуализации. Некоторые ее советы:
- Подписывайте данные напрямую. Я больше за то, чтобы подписывать линии в конце, а не посередине, как в примере.
- Повторяйте информацию там, где она может быть полезна: подпишите единицы измерения на оси или продубдлируйте информацию в тултипе.
- Добавляйте аннотации. Даже в бизнес дэши можно притянуть какой-нибудь гуглдок с датами и помечать необычные кейсы.
- Текст помогает задавать направление чтения, поэтому старайтесь делать дизайн таким образом, чтобы глаза сразу понимали, что самое важное, что нет. Чем жирнее и больше текст, тем быстрее его заметят, а какую-то доп информацию можно делать серой и тонкой.
- Не используйте много шрифтов и начертаний (я обычно беру один шрифт и сочетаю жирный с нежирным и черный с серым)
- Выравнивайте текст по краям, а не по середине и делайте подписи читабельными.
- Делайте заголовки короткими и понятным.
- Убирайте излишнюю детализацию числовых значений.
101
Про дублирование информации в тултипах, кстати, интересная дикуссия может быть. Я раньше пыталась вставлять в тултипы прямо по максимуму: если метрику показываешь, то и все приросты и абсолютные разницы, короче чего я только туда не пихала. Тип почему бы и нет, вдруг будет кому-то очень важно))

Сейчас все больше понимаю, что инфа в тултипе – это ровно та же когнитивная нагрузка, что и на графике и с ней может быть тяжело работать. Возможно это более осознанное желание получить информацию – в том плане, что ты специально куда-то наводишь, чтобы что-то посмотреть, но все равно лучше не перегружать.

Короче начинаю тултипы свои потихоньку сокращать и оставлять там только информацию важную для понимания контекста (периоды данных, референсные значения, иногда методы расчета метрики). Чтобы тултип был не слишком excessive и помогал, а не накидывал инфы столько, что потом не разгрести.

Понравилась вот эта статья про тултипы (больше про дизайн дизайн, но интересно): https://www.nngroup.com/articles/tooltip-guidelines/

Например, если вся информация уже есть текстом, то то же самое добавлять в тултип смысла нет. И форматирование ровно такое же как и с текстом: один шрифт, не больше 2-3 типов начертаний, и управление вниманием при помощи разных размеров и жирности текста.
27
Вы наверняка замечали, что некоторые языки звучат быстрее, а некоторые как будто медленнее. И например, один и тот же текст на японском был бы длиннее, чем на английском, а на тайском наоборот короче. Но если этот текст прочитать вслух, то на прочтение уйдёт примерно одинаковое время.

Люди, которые говорят на простых языках, ускоряют темп и разговор получается более коротким. А те, кто говорят на более сложных – дольше планируют предложение и удлиняют разговор. Но в обоих случаях информация передаётся примерно в одном темпе и скорость восприятия около одна.

https://www.economist.com/graphic-detail/2019/09/28/why-are-some-languages-spoken-faster-than-others
59
The Pudding подогнали прикольную штуку, чуть похоже немного на Wordle, но соревновательный эффект оч затягивает. Играешь с каким-то рандомным человеком в слова: нужно писать слова, которые содержат букву или сочетание букв или которые рифмуются.

Я проиграла, но не расстроилась)) Сразу такой напрягаешься и пытаешься вспомните все, что можешь.
33
​​Кто научит визуализации на хакатоне «ХАРТ»? #афиша

Совсем скоро, 29 и 30 октября, в Европейском пройдет хакатон по визуализации данных в области культуры, организованный центром МАСТ и Школой искусств и культурного наследия.

Вот здесь можно подробнее познакомиться с программой хакатона.

А сейчас хотим немного больше рассказать о наставниках, которые помогут участникам за 2 дня создать собственные проекты.

Обо основах анализа и визуализации данных расскажут дата-журналист Андрей Дорожный, дизайнер инфографики Константин Мшагский и дата-художник Наталья Киселева, автор канала Дата-комиксы. С помощью практических заданий участников научат работать в инструменте Tableau, а затем помогут им в создании собственных визуализаций на основе заранее подготовленных датасетов.

«Хакатоны, основанные на данных о музеях, произведениях искусства или культурных объектах, событие довольно редкое. И для нас очень важно привлечь студентов, которые исследуют разные области знания, вне зависимости от уровня их навыков визуализации, и дать им необходимые инструменты для работы с данными» — поделились организаторы ХАРТа.

До 10 октября (включительно) еще можно успеть подать заявку на участие, ознакомившись с Положением. Для этого переходите по ссылке: https://clck.ru/uR4ph
15
Аналитика от the Washington Post про стоимость жилья в США.
24
Я уже, кажется, несколько раз постила 3D карты высот и каждый раз они вызывают у меня неописуемый восторг. Мои самые любимые от Sean Conway с мельчайшими деталями и невероятно красивыми цветами.

Евгений Матеров прислал свои работы в таком же стиле и поделился источниками для вдохновения и реализации. Все на R! Но будьте готовы к тому, что рендеринг одной такой карты может занимать несколько часов.

В основном используется библиотека rayshader и плагин rayvista, позволяющий делать 3D визуализации. Евгений таким образом визуализировал горы России и непокоренные вершины мира.

Источники вдохновения:
- https://somethingaboutmaps.wordpress.com/2022/01/13/towards-less-blender-y-relief/
- https://stamen.com/shadows-on-maps-are-getting-a-lot-more-exciting-and-heres-why/
- курс по визуализации гео-данных от Тимофея Самсонова
60