настенька и графики – Telegram
настенька и графики
27.2K subscribers
2.62K photos
84 videos
15 files
3.18K links
Датавиз, аналитика и всякое полезное и интересное

💜 Кто я и что делаю: https://nastengraph.notion.site/nastengraph/Anastasiya-Kuznetsova-096ebfb42a9e4014b7700fa00fea54d6

🎓 Мой курс по основам датавиза: https://nastengraph.ru/
Download Telegram
Люблю, когда научные публикации сопровождают хорошим визом. Вот, например, результаты исследования о связи между психическими расстройствами и последующими заболеваниями. Цветом обозначены психические заболевания, каждая точка - конкретное заболевание. Например, расстройство пищевого поведения в несколько раз увеличивает вероятность заболеваний почек.

Вот мы все про статистику в анализе данных, а в медицине она все же куда важнее! Со мной недавно поделились чатом про медстатистику и мне самой было очень интересно почитать, что обсуждают медики. Учитывая, что я подписана на много таких чатов про анализ всяких бизнесовых данных, то было прямо круто посравнивать, что где обсуждается. А еще у них есть полезный инстаграм с удобными картинками про статистику, научные публикации и даже графики🍀
Презентация Cédric Scherer на конферецнии Outlier 2021. Я не так давно постила его тьюториал по добавлению надписей на примере датасета с пингвинами, в презентации он тоже есть, но еще куча крутых других крутых визов. Ну невозможно красиво!

А еще нашла в канале у Александра Богачева список видео с этой прекрасной конфенерции. Такое приятное общее про датавиз от Guillermina Sutter Schneider и Luis Ahumada, много чего-то конкретного по софту и просто интересные проекты.
OutlierConf2021_ggplot-wizardry.pdf
10 MB
Отдельно презентация Cédric Scherer, если хочется просто полистать🐤
Попалось сразу два виза про бьюти-фэшн индустрию. Первый от the Pudding про названия тональных кремов. У них интересный график с фильтрацией по брендам и типам названий, например, тональные крема часто называют в честь напитков.

А Quartz сделали анализ оттенков кожи на фотографиях в инстаграмме известных брендов. Много beeswarm графиков, они классные.

Если темы не близки, то советую просто посмотреть на представление результатов (хоршие графики, интерактивность и понятный разбор), второй прямо полноценный рисеч
​​Друзья, ближайшие две недели я буду в отпуске, поэтому в канале будет не особо много новых материалов. Но на период отпуска я подготовил посты в которых отобрал наиболее полезный на свой взгляд материалы, из ранее опубликованных.

По возможности, конечно, буду постить и свежие материалы.

—————————————
И так марафон наиболее полезных материалов я решил открыть своим курсом "Язык R для пользователей Excel".

О курсе:
Курс посвящён введению в манипуляцию данных на языке R средствами библиотеки tidyverse, и входящих в неё пакетов: dplyr, tidyr, ggplot2, forcats и так далее.

К каждому уроку есть тест, предназначенный для проверки полученных в ходе урока знаний. Найти ссылку на тест можно в описании видео на YouTube, или в статье на Хабре.

Требований к уровню подготовки нет, я думаю что в курсе для себя найдут что то полезное как совсем новички, так и те, кто уже имеет опыт работы с R.

Видео уроки:
1. Установка языка R и среды разработки RStudio
2. Структуры данных в R
3. Загрузка данных из csv, tsv, excel файлов и Google таблиц в R
4. Фильтрация строк, выбор и переименование столбцов, пайпланы в R
5. Добавление вычисляемых столбцов в таблицу на языке R
6. Группировка и агрегация данных на языке R
7. Вертикальное и горизонтальное объединение таблиц на языке R
8. Оконные функции в R
9. Вращение таблиц или аналог сводных таблиц в R
10. Загрузка JSON файлов в R и преобразование списков в таблицы
11. Простейшая визуализация данных, пакет ggplot2 и функции qplot
12. Построение графиков слой за слоем на языке R с помощью ggplot2
13. Изменение элементов графика и темы в ggplot2

Ссылки:
- плейлист на YouTube
- подписаться на YouTube канал
- статья о курсе на Хабре

#курс_R
Про 8 марта в Твиттере. Каждая точка - твит (учитывались только твиты на английском), размер, по-видимому, зависит от лайков, а цветовую легенду не разобрала. Очень нравится идея с таким одуванчиком
Приятные оттенки серого для разнообразия. Серый вообще топ цвет для визуализаций, когда нужно делать фокус на чем-то одном (тогда серым делаете все категории, а какую-то выделяете другим более ярким). Связка серый+синий уже немного классическая, но часто берут самые дефолтные серый и синий, а вот такие оттенки могут сделать виз ещё симпатичнее 🦭
Как правильно отметил Николай, нам в Питере все оттенки серого очень нравятся)) Вот мой самый любимый сервис для поиска палитр https://coolors.co, там же можно загрузить картинку и выбрать цвета по ней. Фотографии природы, кстати, проверенный способ находить хорошие сочетания, потому что там уж все идеально. А следующим постом представляю вам палетку по последней фотке Питера, какая у меня была💫
Визуализация, в которой можно найти сравнить праздники разных культур, ну и просто найти себе праздник на день🎉
Forwarded from Reveal the Data
Сделал трибьют знаменитой работы Вильяма Плейфэира про баланс экспорта и импорта Англии на современных данных для UK и Евросоюза. Визуализация показывает, как развивались события после объявления брекзита и полного выхода из Евросоюза.

Ещё собрал работы, которые являются переделками знаменитых визов или выполнены в cтиле состаренных или печатных работ:
Charles Minard's Napoleons March
Tribute to Edvard Tufte
Atlantic Sea Routes
Anti Asian Hate Incidents
Traveling World
Spell O and I

#пример #ссылка
В рамках #30DayChartChallenge в Твиттере очень много интересных работ. Вот, например, лепестковая диаграмма про столкновения птиц с самолетами. Очень красиво сделано🌻

https://twitter.com/jakekaupp/status/1380214121711435776?s=21
Внезапно нашла на 9GAG в ВКонтакте🙃
Вот это да! Чуть легенду поменял и уже совершенно другая картинка! Ошибка прямо как из учебника 🌎

Про выбор цветов для хороплета есть хорошая статья от Datawrapper. Есть много способов выбора палитр, но в основном нужно искать баланс между данными и тем, какую мысль хотите донести. Одна из классических книг про карты - "How to Lie with Maps" и в "How Charts lie" тоже много примеров с картами.

Оригинал поста в инсте и там вообще достаточно много карт и графиков, которые очень не очень((

Спасибо Марусе за этот прекрасный твит.
Не отпускает мысль со вчерашнего поста, что дата-журналистика - это безумно круто, но при этом на дата-журналистах лежит огромная ответственность в плане визуализаций. Проблема не в том, чтобы нарисовать график и сделать его понятным, а в том, чтобы этот график не смещал восприятие аудитории, закладывая идеи автора внутрь, и не создавал ощущение того, чего на самом деле нет. И если в бизнесе люди могут достаточно быстро понять, что с данными или графиком что-то не так, тк видят их каждый день, то тут аудитория часто "сырая", да и времени на подробное чтение графика нет, из-за чего можно поверить буквально любой картинке. Я сама часто не делаю графики по каким-то темам (например, политическим) именно из-за этого груза ответственности.

И как говорит Alberto Cairo: “We need to stop sharing charts and news stories mindlessly. We all have the civic duty to avoid spreading charts and stories that may be misleading. We must contribute to a healthier informational environment.❤️
Я раньше думала, что буду работать веб-аналитиком, очень мне нравилась вся эта тема с гугл аналитикой и яндекс метрикой. Примерно в это же время обнаружила для себя пакеты на R для работы с метрикой от ryandexdirect, я тогда была в таком восторге от удобства работы с ним, да и до сих пор считаю, что пакет просто супер🍀

Автор пакета - Алексей Селезнёв, как и множества других для работы с API фейсбука, вконтакте и тд. Он также ведет канал про R, где делится последними материалами, митапами, бесплатными уроками и всем прочим про R. Вот, например, как работать с API вконтакте пакетов rvkstat или как сделать лемматизацию русского текста.