OutlierConf2021_ggplot-wizardry.pdf
10 MB
Отдельно презентация Cédric Scherer, если хочется просто полистать🐤
Попалось сразу два виза про бьюти-фэшн индустрию. Первый от the Pudding про названия тональных кремов. У них интересный график с фильтрацией по брендам и типам названий, например, тональные крема часто называют в честь напитков.
А Quartz сделали анализ оттенков кожи на фотографиях в инстаграмме известных брендов. Много beeswarm графиков, они классные.
Если темы не близки, то советую просто посмотреть на представление результатов (хоршие графики, интерактивность и понятный разбор), второй прямо полноценный рисеч✨
А Quartz сделали анализ оттенков кожи на фотографиях в инстаграмме известных брендов. Много beeswarm графиков, они классные.
Если темы не близки, то советую просто посмотреть на представление результатов (хоршие графики, интерактивность и понятный разбор), второй прямо полноценный рисеч✨
Forwarded from R4marketing | канал Алексея Селезнёва | Язык R (Alexey Seleznev)
Друзья, ближайшие две недели я буду в отпуске, поэтому в канале будет не особо много новых материалов. Но на период отпуска я подготовил посты в которых отобрал наиболее полезный на свой взгляд материалы, из ранее опубликованных.
По возможности, конечно, буду постить и свежие материалы.
—————————————
И так марафон наиболее полезных материалов я решил открыть своим курсом "Язык R для пользователей Excel".
О курсе:
Курс посвящён введению в манипуляцию данных на языке R средствами библиотеки
К каждому уроку есть тест, предназначенный для проверки полученных в ходе урока знаний. Найти ссылку на тест можно в описании видео на YouTube, или в статье на Хабре.
Требований к уровню подготовки нет, я думаю что в курсе для себя найдут что то полезное как совсем новички, так и те, кто уже имеет опыт работы с R.
Видео уроки:
1. Установка языка R и среды разработки RStudio
2. Структуры данных в R
3. Загрузка данных из csv, tsv, excel файлов и Google таблиц в R
4. Фильтрация строк, выбор и переименование столбцов, пайпланы в R
5. Добавление вычисляемых столбцов в таблицу на языке R
6. Группировка и агрегация данных на языке R
7. Вертикальное и горизонтальное объединение таблиц на языке R
8. Оконные функции в R
9. Вращение таблиц или аналог сводных таблиц в R
10. Загрузка JSON файлов в R и преобразование списков в таблицы
11. Простейшая визуализация данных, пакет ggplot2 и функции qplot
12. Построение графиков слой за слоем на языке R с помощью ggplot2
13. Изменение элементов графика и темы в ggplot2
Ссылки:
- плейлист на YouTube
- подписаться на YouTube канал
- статья о курсе на Хабре
#курс_R
По возможности, конечно, буду постить и свежие материалы.
—————————————
И так марафон наиболее полезных материалов я решил открыть своим курсом "Язык R для пользователей Excel".
О курсе:
Курс посвящён введению в манипуляцию данных на языке R средствами библиотеки
tidyverse, и входящих в неё пакетов: dplyr, tidyr, ggplot2, forcats и так далее.К каждому уроку есть тест, предназначенный для проверки полученных в ходе урока знаний. Найти ссылку на тест можно в описании видео на YouTube, или в статье на Хабре.
Требований к уровню подготовки нет, я думаю что в курсе для себя найдут что то полезное как совсем новички, так и те, кто уже имеет опыт работы с R.
Видео уроки:
1. Установка языка R и среды разработки RStudio
2. Структуры данных в R
3. Загрузка данных из csv, tsv, excel файлов и Google таблиц в R
4. Фильтрация строк, выбор и переименование столбцов, пайпланы в R
5. Добавление вычисляемых столбцов в таблицу на языке R
6. Группировка и агрегация данных на языке R
7. Вертикальное и горизонтальное объединение таблиц на языке R
8. Оконные функции в R
9. Вращение таблиц или аналог сводных таблиц в R
10. Загрузка JSON файлов в R и преобразование списков в таблицы
11. Простейшая визуализация данных, пакет ggplot2 и функции qplot
12. Построение графиков слой за слоем на языке R с помощью ggplot2
13. Изменение элементов графика и темы в ggplot2
Ссылки:
- плейлист на YouTube
- подписаться на YouTube канал
- статья о курсе на Хабре
#курс_R
Про 8 марта в Твиттере. Каждая точка - твит (учитывались только твиты на английском), размер, по-видимому, зависит от лайков, а цветовую легенду не разобрала. Очень нравится идея с таким одуванчиком✨
Приятные оттенки серого для разнообразия. Серый вообще топ цвет для визуализаций, когда нужно делать фокус на чем-то одном (тогда серым делаете все категории, а какую-то выделяете другим более ярким). Связка серый+синий уже немного классическая, но часто берут самые дефолтные серый и синий, а вот такие оттенки могут сделать виз ещё симпатичнее 🦭
Как правильно отметил Николай, нам в Питере все оттенки серого очень нравятся)) Вот мой самый любимый сервис для поиска палитр https://coolors.co, там же можно загрузить картинку и выбрать цвета по ней. Фотографии природы, кстати, проверенный способ находить хорошие сочетания, потому что там уж все идеально. А следующим постом представляю вам палетку по последней фотке Питера, какая у меня была💫
Визуализация, в которой можно найти сравнить праздники разных культур, ну и просто найти себе праздник на день🎉
Forwarded from Reveal the Data
Сделал трибьют знаменитой работы Вильяма Плейфэира про баланс экспорта и импорта Англии на современных данных для UK и Евросоюза. Визуализация показывает, как развивались события после объявления брекзита и полного выхода из Евросоюза.
Ещё собрал работы, которые являются переделками знаменитых визов или выполнены в cтиле состаренных или печатных работ:
— Charles Minard's Napoleons March
— Tribute to Edvard Tufte
— Atlantic Sea Routes
— Anti Asian Hate Incidents
— Traveling World
— Spell O and I
#пример #ссылка
Ещё собрал работы, которые являются переделками знаменитых визов или выполнены в cтиле состаренных или печатных работ:
— Charles Minard's Napoleons March
— Tribute to Edvard Tufte
— Atlantic Sea Routes
— Anti Asian Hate Incidents
— Traveling World
— Spell O and I
#пример #ссылка
В рамках #30DayChartChallenge в Твиттере очень много интересных работ. Вот, например, лепестковая диаграмма про столкновения птиц с самолетами. Очень красиво сделано🌻
https://twitter.com/jakekaupp/status/1380214121711435776?s=21
https://twitter.com/jakekaupp/status/1380214121711435776?s=21
Вот это да! Чуть легенду поменял и уже совершенно другая картинка! Ошибка прямо как из учебника 🌎
Про выбор цветов для хороплета есть хорошая статья от Datawrapper. Есть много способов выбора палитр, но в основном нужно искать баланс между данными и тем, какую мысль хотите донести. Одна из классических книг про карты - "How to Lie with Maps" и в "How Charts lie" тоже много примеров с картами.
Оригинал поста в инсте и там вообще достаточно много карт и графиков, которые очень не очень((
Спасибо Марусе за этот прекрасный твит.
Про выбор цветов для хороплета есть хорошая статья от Datawrapper. Есть много способов выбора палитр, но в основном нужно искать баланс между данными и тем, какую мысль хотите донести. Одна из классических книг про карты - "How to Lie with Maps" и в "How Charts lie" тоже много примеров с картами.
Оригинал поста в инсте и там вообще достаточно много карт и графиков, которые очень не очень((
Спасибо Марусе за этот прекрасный твит.
Не отпускает мысль со вчерашнего поста, что дата-журналистика - это безумно круто, но при этом на дата-журналистах лежит огромная ответственность в плане визуализаций. Проблема не в том, чтобы нарисовать график и сделать его понятным, а в том, чтобы этот график не смещал восприятие аудитории, закладывая идеи автора внутрь, и не создавал ощущение того, чего на самом деле нет. И если в бизнесе люди могут достаточно быстро понять, что с данными или графиком что-то не так, тк видят их каждый день, то тут аудитория часто "сырая", да и времени на подробное чтение графика нет, из-за чего можно поверить буквально любой картинке. Я сама часто не делаю графики по каким-то темам (например, политическим) именно из-за этого груза ответственности.
И как говорит Alberto Cairo: “We need to stop sharing charts and news stories mindlessly. We all have the civic duty to avoid spreading charts and stories that may be misleading. We must contribute to a healthier informational environment.”❤️
И как говорит Alberto Cairo: “We need to stop sharing charts and news stories mindlessly. We all have the civic duty to avoid spreading charts and stories that may be misleading. We must contribute to a healthier informational environment.”❤️
Я раньше думала, что буду работать веб-аналитиком, очень мне нравилась вся эта тема с гугл аналитикой и яндекс метрикой. Примерно в это же время обнаружила для себя пакеты на R для работы с метрикой от ryandexdirect, я тогда была в таком восторге от удобства работы с ним, да и до сих пор считаю, что пакет просто супер🍀
Автор пакета - Алексей Селезнёв, как и множества других для работы с API фейсбука, вконтакте и тд. Он также ведет канал про R, где делится последними материалами, митапами, бесплатными уроками и всем прочим про R. Вот, например, как работать с API вконтакте пакетов rvkstat или как сделать лемматизацию русского текста.
Автор пакета - Алексей Селезнёв, как и множества других для работы с API фейсбука, вконтакте и тд. Он также ведет канал про R, где делится последними материалами, митапами, бесплатными уроками и всем прочим про R. Вот, например, как работать с API вконтакте пакетов rvkstat или как сделать лемматизацию русского текста.
Опять не очень весёлый виз - экспедиции в Гималаи. Нравится сочетание графиков 🏔
https://twitter.com/cnicault/status/1378673876171907076?s=21
https://twitter.com/cnicault/status/1378673876171907076?s=21
Совокупное время в космосе космонавтов и астронавтов в рамках миссий с 23 апреля 1961 по 15 января 2020✨
И снова ggplot
И снова ggplot
23 апреля Алексей Колоколов устраивает в Москве необычную вечеринку для всех, кто занимается аналитикой данных и визуализацией. Целый бал для любителей данных!
Интересные люди, еда и дэээээшборды. Даже немножко жалко, что я не в Москве, но если вы пойдете - присылайте фоточки🙈
Подобности на сайте — https://alexkolokolov.com/bal
Интересные люди, еда и дэээээшборды. Даже немножко жалко, что я не в Москве, но если вы пойдете - присылайте фоточки🙈
Подобности на сайте — https://alexkolokolov.com/bal
Мне по жизни очень нравится позиция Alberto Cairo с интеграцией разных сервисов для создания итоговых красивых графиков. Я сама очень люблю собирать все не в одном месте, а рисовать что-то в R/Tableau, а потом уже докручивать красивую легенду, подписи в редакторах типа фотошопа (но чаще беру маковский Numbers). Мне, конечно, до него еще супер далеко, но хочется напомнить, что необязательно упираться во что-то одно и за одним графиком может стоять сразу несколько инструментов.
Он в своем интервью идем примерно по схеме:
1. Чистка данных в R или Excel
2. Визуализация в R, Flourish, iNZight
(он также советует Datawrapper, Flourish, RAWGraphs, Power BI, Tableau)
3. А дальше идет в Adobe Illustrator
Причем часто все можно было бы сделать в чем-то одном (R и Tableau более чем способны на это все), но иногда на это тратится куда больше времени, чем быстренько приклеить легенду в фш))
Он в своем интервью идем примерно по схеме:
1. Чистка данных в R или Excel
2. Визуализация в R, Flourish, iNZight
(он также советует Datawrapper, Flourish, RAWGraphs, Power BI, Tableau)
3. А дальше идет в Adobe Illustrator
Причем часто все можно было бы сделать в чем-то одном (R и Tableau более чем способны на это все), но иногда на это тратится куда больше времени, чем быстренько приклеить легенду в фш))
Global Investigative Journalism Network
My Favorite Tools: Alberto Cairo on Data Visualization
For our series on journalists’ favorite tools, we spoke to Alberto Cairo, head of visualization at the University of Miami's Institute for Data Science and Computing. Cairo shared several user-friendly tools and core principles to help investigative reporters…
Хорошая схема про сравнение инструментов для визуализации из книги Better Data Visualizations: A Guide for Scholars, Researchers, and Wonks