настенька и графики – Telegram
настенька и графики
27.2K subscribers
2.62K photos
84 videos
15 files
3.18K links
Датавиз, аналитика и всякое полезное и интересное

💜 Кто я и что делаю: https://nastengraph.notion.site/nastengraph/Anastasiya-Kuznetsova-096ebfb42a9e4014b7700fa00fea54d6

🎓 Мой курс по основам датавиза: https://nastengraph.ru/
Download Telegram
OutlierConf2021_ggplot-wizardry.pdf
10 MB
Отдельно презентация Cédric Scherer, если хочется просто полистать🐤
Попалось сразу два виза про бьюти-фэшн индустрию. Первый от the Pudding про названия тональных кремов. У них интересный график с фильтрацией по брендам и типам названий, например, тональные крема часто называют в честь напитков.

А Quartz сделали анализ оттенков кожи на фотографиях в инстаграмме известных брендов. Много beeswarm графиков, они классные.

Если темы не близки, то советую просто посмотреть на представление результатов (хоршие графики, интерактивность и понятный разбор), второй прямо полноценный рисеч
​​Друзья, ближайшие две недели я буду в отпуске, поэтому в канале будет не особо много новых материалов. Но на период отпуска я подготовил посты в которых отобрал наиболее полезный на свой взгляд материалы, из ранее опубликованных.

По возможности, конечно, буду постить и свежие материалы.

—————————————
И так марафон наиболее полезных материалов я решил открыть своим курсом "Язык R для пользователей Excel".

О курсе:
Курс посвящён введению в манипуляцию данных на языке R средствами библиотеки tidyverse, и входящих в неё пакетов: dplyr, tidyr, ggplot2, forcats и так далее.

К каждому уроку есть тест, предназначенный для проверки полученных в ходе урока знаний. Найти ссылку на тест можно в описании видео на YouTube, или в статье на Хабре.

Требований к уровню подготовки нет, я думаю что в курсе для себя найдут что то полезное как совсем новички, так и те, кто уже имеет опыт работы с R.

Видео уроки:
1. Установка языка R и среды разработки RStudio
2. Структуры данных в R
3. Загрузка данных из csv, tsv, excel файлов и Google таблиц в R
4. Фильтрация строк, выбор и переименование столбцов, пайпланы в R
5. Добавление вычисляемых столбцов в таблицу на языке R
6. Группировка и агрегация данных на языке R
7. Вертикальное и горизонтальное объединение таблиц на языке R
8. Оконные функции в R
9. Вращение таблиц или аналог сводных таблиц в R
10. Загрузка JSON файлов в R и преобразование списков в таблицы
11. Простейшая визуализация данных, пакет ggplot2 и функции qplot
12. Построение графиков слой за слоем на языке R с помощью ggplot2
13. Изменение элементов графика и темы в ggplot2

Ссылки:
- плейлист на YouTube
- подписаться на YouTube канал
- статья о курсе на Хабре

#курс_R
Про 8 марта в Твиттере. Каждая точка - твит (учитывались только твиты на английском), размер, по-видимому, зависит от лайков, а цветовую легенду не разобрала. Очень нравится идея с таким одуванчиком
Приятные оттенки серого для разнообразия. Серый вообще топ цвет для визуализаций, когда нужно делать фокус на чем-то одном (тогда серым делаете все категории, а какую-то выделяете другим более ярким). Связка серый+синий уже немного классическая, но часто берут самые дефолтные серый и синий, а вот такие оттенки могут сделать виз ещё симпатичнее 🦭
Как правильно отметил Николай, нам в Питере все оттенки серого очень нравятся)) Вот мой самый любимый сервис для поиска палитр https://coolors.co, там же можно загрузить картинку и выбрать цвета по ней. Фотографии природы, кстати, проверенный способ находить хорошие сочетания, потому что там уж все идеально. А следующим постом представляю вам палетку по последней фотке Питера, какая у меня была💫
Визуализация, в которой можно найти сравнить праздники разных культур, ну и просто найти себе праздник на день🎉
Forwarded from Reveal the Data
Сделал трибьют знаменитой работы Вильяма Плейфэира про баланс экспорта и импорта Англии на современных данных для UK и Евросоюза. Визуализация показывает, как развивались события после объявления брекзита и полного выхода из Евросоюза.

Ещё собрал работы, которые являются переделками знаменитых визов или выполнены в cтиле состаренных или печатных работ:
Charles Minard's Napoleons March
Tribute to Edvard Tufte
Atlantic Sea Routes
Anti Asian Hate Incidents
Traveling World
Spell O and I

#пример #ссылка
В рамках #30DayChartChallenge в Твиттере очень много интересных работ. Вот, например, лепестковая диаграмма про столкновения птиц с самолетами. Очень красиво сделано🌻

https://twitter.com/jakekaupp/status/1380214121711435776?s=21
Внезапно нашла на 9GAG в ВКонтакте🙃
Вот это да! Чуть легенду поменял и уже совершенно другая картинка! Ошибка прямо как из учебника 🌎

Про выбор цветов для хороплета есть хорошая статья от Datawrapper. Есть много способов выбора палитр, но в основном нужно искать баланс между данными и тем, какую мысль хотите донести. Одна из классических книг про карты - "How to Lie with Maps" и в "How Charts lie" тоже много примеров с картами.

Оригинал поста в инсте и там вообще достаточно много карт и графиков, которые очень не очень((

Спасибо Марусе за этот прекрасный твит.
Не отпускает мысль со вчерашнего поста, что дата-журналистика - это безумно круто, но при этом на дата-журналистах лежит огромная ответственность в плане визуализаций. Проблема не в том, чтобы нарисовать график и сделать его понятным, а в том, чтобы этот график не смещал восприятие аудитории, закладывая идеи автора внутрь, и не создавал ощущение того, чего на самом деле нет. И если в бизнесе люди могут достаточно быстро понять, что с данными или графиком что-то не так, тк видят их каждый день, то тут аудитория часто "сырая", да и времени на подробное чтение графика нет, из-за чего можно поверить буквально любой картинке. Я сама часто не делаю графики по каким-то темам (например, политическим) именно из-за этого груза ответственности.

И как говорит Alberto Cairo: “We need to stop sharing charts and news stories mindlessly. We all have the civic duty to avoid spreading charts and stories that may be misleading. We must contribute to a healthier informational environment.❤️
Я раньше думала, что буду работать веб-аналитиком, очень мне нравилась вся эта тема с гугл аналитикой и яндекс метрикой. Примерно в это же время обнаружила для себя пакеты на R для работы с метрикой от ryandexdirect, я тогда была в таком восторге от удобства работы с ним, да и до сих пор считаю, что пакет просто супер🍀

Автор пакета - Алексей Селезнёв, как и множества других для работы с API фейсбука, вконтакте и тд. Он также ведет канал про R, где делится последними материалами, митапами, бесплатными уроками и всем прочим про R. Вот, например, как работать с API вконтакте пакетов rvkstat или как сделать лемматизацию русского текста.
Опять не очень весёлый виз - экспедиции в Гималаи. Нравится сочетание графиков 🏔

https://twitter.com/cnicault/status/1378673876171907076?s=21
Совокупное время в космосе космонавтов и астронавтов в рамках миссий с 23 апреля 1961 по 15 января 2020
И снова ggplot
23 апреля Алексей Колоколов устраивает в Москве необычную вечеринку для всех, кто занимается аналитикой данных и визуализацией. Целый бал для любителей данных!

Интересные люди, еда и дэээээшборды. Даже немножко жалко, что я не в Москве, но если вы пойдете - присылайте фоточки🙈

Подобности на сайте — https://alexkolokolov.com/bal
Мне по жизни очень нравится позиция Alberto Cairo с интеграцией разных сервисов для создания итоговых красивых графиков. Я сама очень люблю собирать все не в одном месте, а рисовать что-то в R/Tableau, а потом уже докручивать красивую легенду, подписи в редакторах типа фотошопа (но чаще беру маковский Numbers). Мне, конечно, до него еще супер далеко, но хочется напомнить, что необязательно упираться во что-то одно и за одним графиком может стоять сразу несколько инструментов.

Он в своем интервью идем примерно по схеме:
1. Чистка данных в R или Excel
2. Визуализация в R, Flourish, iNZight
(он также советует Datawrapper, Flourish, RAWGraphs, Power BI, Tableau)
3. А дальше идет в Adobe Illustrator

Причем часто все можно было бы сделать в чем-то одном (R и Tableau более чем способны на это все), но иногда на это тратится куда больше времени, чем быстренько приклеить легенду в фш))
Хорошая схема про сравнение инструментов для визуализации из книги Better Data Visualizations: A Guide for Scholars, Researchers, and Wonks