настенька и графики – Telegram
настенька и графики
27.1K subscribers
2.62K photos
84 videos
15 files
3.18K links
Датавиз, аналитика и всякое полезное и интересное

💜 Кто я и что делаю: https://nastengraph.notion.site/nastengraph/Anastasiya-Kuznetsova-096ebfb42a9e4014b7700fa00fea54d6

🎓 Мой курс по основам датавиза: https://nastengraph.ru/
Download Telegram
Интересная статья про фидбек в визуализации. Условно, как разные визуальные обозначения заставляют нас что-то делать или думать определенные вещи (через выделение, прогресс-бары, бенчмарки и тд).

https://link.medium.com/MHyhGRbmVfb
IT Resume сделали подробный гайд по dplyr (пакет для манипуляций с данными на R). Без dplyr точно никуда⚡️

https://habr.com/ru/post/555720/
Собрала гайдлайн по табличкам от Jonathan Schwabish (Better Data Visualizations: A Guide for Scholars, Researchers, and Wonks)⚡️ Глазами можно посмотреть здесь.

1. Заголовки не должны сливаться со значениями таблицы.
2. Старайтесь минимизировать количество разделителей, не обязательно нужна сеточная структура, иногда нужно линией отделить только заголовок, а не все строчки друг от друга.
3. Числа и заголовки к числам выравниваются по правому краю.
4. Текстовые значения и заголовки строк (обычно это первые колонки с названиями категорий) по левому краю.
5. Выбирайте нужный уровень точности (не 0.327 и не 0, а 0.3)
6. Добавляется свободное пространство между строками и колонками, чтобы значения не налеплялись друг на друга.
7. Старайтесь не повторяться, например, нет смысла писать % в каждой строчке, если можно указать, что все цифры в процентах в названии колонки.
8. Выделяете выбросы и другие значения, на которые стоит обратить внимание цветом/шрифтом.
9. Группируйте похожие данные, если у вас есть иерархия в категориях (страна - город), то нет смысла повторять страны в каждой строчке, можно подписать один раз для всего блока под эту страну.
10. Добавляйте визуализации внутрь таблиц (спарклайны и подсветка).

Про графики vs таблички, советую видео от Ромы Бунина. От себя коротко добавлю, что таблички лучше, когда нужны конкретные значения и нужно сравнивать их друг с другом, а графики больше для поиска паттернов и того, что можно отобразить через какие-то формы. Супер круто делать таблицы с подсветкой или добавлять спарклайны. Их можно рисовать и в экселе и в google sheets (получается такой мини-график в ячейке).
пример из его книги
Настоящая научная статья про то, что котики воспринимают треугольник Каниза так же, как и мы - видят замкнутое пространство и садятся в него 🐱 Все это близко к теме гештальт-принципов, так что правила датавиза для них такие же, как и для нас))

https://twitter.com/Explanimals/status/1389623777781239816
Скрещивам R и Tableau через shinytableau💫

https://rstudio.github.io/shinytableau/
Не так давно был пост про оттенки серого и Питер, так вот оказывается есть реальная палитра Питера, утвержденная еще в 1966 году! Она была сделана для окраски фасадов зданий, но мне кажется, ее было бы очень прикольно использовать в визах, связанных с городом.

Вообще тема цвета в архитектуре очень классная штука. В моем родном Мурманске, например, красят дома в оранжевый и фиолетовый, чтобы было не так грустно в полярную ночь 💜
Меня немножко ударило в урбанистику и вспомнила про такой очень красивый проект от Moritz Stefaner - портрет Парижа через тысячи фотографий. Он был представлен на выставке и там можно было рассмотреть каждый кластер, но можно на это полюбоваться через видео. Интересные кластеры с людьми в необычных позах и фотографии панно «Кувшинки» Моне, где, кстати, запрещено фотографировать📷
«Итоги пятилетнего плана СССР» 1933 года выпуска через кучу пиктограмм. Я прямо люблю такие штуки смотреть. Прислали VATNIKSTAN⚡️
Lux - библиотека на питоне, которая помогает выбирать визы к вашим данным. У авторов хороший поинт про то, что билиотек с графиками много, но часто на создание простых графиков уходит много времени и куча строчек кода. Перегонять данные куда-то, где рисовать графики проще - долго и недоубно. И они предлагают все иметь в одном месте:
- интерактивные визы прямо в Jupyter Notebook
- меньше кода
- рекомендации по визу

У них есть пример, как это работает с датасетом про пингвинчиков. Выглядит прикольно, почти как мини-tableau внутри питона. Статья на медиуме воспринимается попроще, но есть и публикация со всеми техническими моментами🐍
Текстовые данные - это классно, а их анализ помогает получить много информации за короткое время с возможностью углубиться в данные. Очень многие исследования не состоялись бы без развития текстового анализа, потому что руками столько обработать просто нереально. А тут без прочтения текста мы можем выделять темы, строить семантические сети, определять "настроение" текстов и еще кучу классного!

⚡️Мой топ ссылок про анализ текстов на R:
- Прекрасный блог Julia Silge
- Variance Explained от David Robinson
- STHDA (просто топ, у них самые лучшие тьюториалы по анализу данных)

Если вы питонист, то обязательно идите послушать Серёжу Чувакина про текстовый анализ на питоне в рамках мастер-класса от ИНИД 21 мая. Он дата-сайентист в EPAM, организатор мастерской по обработке естественного языка и просто очень классный спец (по совместительству мой хороший знакомый) 🧡

А картинка со времен, когда мне очень захотелось поанализировать хабр.
Переходим от grammar of graphics к glamour of graphics 💫Интересный видос с rstudio::conf20 от William Chase. Никакого чарт-шейминга - это его слова, очень мне понравились))) Советую посмотреть, его поинты ниже, но с картинками всегда прикольнее.

Как сделать график привлекательнее (и больше glamour):
📌Макет:
- Загловки выравнивать по левому краю, как и большие текстовые части. По правому краю можно подписи (все супер зависит от кейса, недавно писала про выравнивание табличек).
- Барчарты с длинными подписями просто переворачиваем в горизонтальные, потому что вертикальные подписи читать сложно.
- Меньше рамочек, гридлайны по возможности убираем, если же нужны (например, линейный графикам) делаем светло-серыми.
- Легенды лучше менять на цветовое кодирование текста или подписывать данные напрямую.
- Больше пустого места - оно дает возможность передохнуть и разграничить пространство.

🅰️Типографика:
- Часто дефолтные шрифты оч не оч, лучше поискать что-то недефолтное, но я здесь за шрифты без засечек.
- Выстраиваем иерархию через шрифт: размер, цвет, начертания.
- Проверяйте шрифт на цифрах (лучше те, где они идут по одной линии и где каждая цифра занимает одинаковое пространство).

🌈Цвет:
- Тырьте цвета, которые вам нравятся! Причем это могут быть какие-то объекты, фотографии, обложки - что угодно.
- Часто белый цвет можно поменять на другие светлые цвета (бежевые, светло-серый), которые будут похожи на белый, но не такие яркие, как чистый белый. С чёрным тоже работаем, иногда графитовый выглядит лучше, чем чистый чёрный. Здесь, конечно, зависит от того, что вы делаете и где это будет публиковаться.
- Проверяйте цвета на то, как это видят люди с дальтонизмом. Это важно, очень! Как с этим работать в датавизе от Datawrapper.

И у него оч красивый сайт с классными работами!
А вообще пост нашла в твиттере у Cole Knaflic❤️
1
нельзя делать длинные посты к картинкам, так что вот картинки...