Люблю, когда научные публикации сопровождают хорошим визом. Вот, например, результаты исследования о связи между психическими расстройствами и последующими заболеваниями. Цветом обозначены психические заболевания, каждая точка - конкретное заболевание. Например, расстройство пищевого поведения в несколько раз увеличивает вероятность заболеваний почек.
Вот мы все про статистику в анализе данных, а в медицине она все же куда важнее! Со мной недавно поделились чатом про медстатистику и мне самой было очень интересно почитать, что обсуждают медики. Учитывая, что я подписана на много таких чатов про анализ всяких бизнесовых данных, то было прямо круто посравнивать, что где обсуждается. А еще у них есть полезный инстаграм с удобными картинками про статистику, научные публикации и даже графики🍀
Вот мы все про статистику в анализе данных, а в медицине она все же куда важнее! Со мной недавно поделились чатом про медстатистику и мне самой было очень интересно почитать, что обсуждают медики. Учитывая, что я подписана на много таких чатов про анализ всяких бизнесовых данных, то было прямо круто посравнивать, что где обсуждается. А еще у них есть полезный инстаграм с удобными картинками про статистику, научные публикации и даже графики🍀
Презентация Cédric Scherer на конферецнии Outlier 2021. Я не так давно постила его тьюториал по добавлению надписей на примере датасета с пингвинами, в презентации он тоже есть, но еще куча крутых других крутых визов. Ну невозможно красиво!
А еще нашла в канале у Александра Богачева список видео с этой прекрасной конфенерции. Такое приятное общее про датавиз от Guillermina Sutter Schneider и Luis Ahumada, много чего-то конкретного по софту и просто интересные проекты.
А еще нашла в канале у Александра Богачева список видео с этой прекрасной конфенерции. Такое приятное общее про датавиз от Guillermina Sutter Schneider и Luis Ahumada, много чего-то конкретного по софту и просто интересные проекты.
OutlierConf2021_ggplot-wizardry.pdf
10 MB
Отдельно презентация Cédric Scherer, если хочется просто полистать🐤
Попалось сразу два виза про бьюти-фэшн индустрию. Первый от the Pudding про названия тональных кремов. У них интересный график с фильтрацией по брендам и типам названий, например, тональные крема часто называют в честь напитков.
А Quartz сделали анализ оттенков кожи на фотографиях в инстаграмме известных брендов. Много beeswarm графиков, они классные.
Если темы не близки, то советую просто посмотреть на представление результатов (хоршие графики, интерактивность и понятный разбор), второй прямо полноценный рисеч✨
А Quartz сделали анализ оттенков кожи на фотографиях в инстаграмме известных брендов. Много beeswarm графиков, они классные.
Если темы не близки, то советую просто посмотреть на представление результатов (хоршие графики, интерактивность и понятный разбор), второй прямо полноценный рисеч✨
Forwarded from R4marketing | канал Алексея Селезнёва | Язык R (Alexey Seleznev)
Друзья, ближайшие две недели я буду в отпуске, поэтому в канале будет не особо много новых материалов. Но на период отпуска я подготовил посты в которых отобрал наиболее полезный на свой взгляд материалы, из ранее опубликованных.
По возможности, конечно, буду постить и свежие материалы.
—————————————
И так марафон наиболее полезных материалов я решил открыть своим курсом "Язык R для пользователей Excel".
О курсе:
Курс посвящён введению в манипуляцию данных на языке R средствами библиотеки
К каждому уроку есть тест, предназначенный для проверки полученных в ходе урока знаний. Найти ссылку на тест можно в описании видео на YouTube, или в статье на Хабре.
Требований к уровню подготовки нет, я думаю что в курсе для себя найдут что то полезное как совсем новички, так и те, кто уже имеет опыт работы с R.
Видео уроки:
1. Установка языка R и среды разработки RStudio
2. Структуры данных в R
3. Загрузка данных из csv, tsv, excel файлов и Google таблиц в R
4. Фильтрация строк, выбор и переименование столбцов, пайпланы в R
5. Добавление вычисляемых столбцов в таблицу на языке R
6. Группировка и агрегация данных на языке R
7. Вертикальное и горизонтальное объединение таблиц на языке R
8. Оконные функции в R
9. Вращение таблиц или аналог сводных таблиц в R
10. Загрузка JSON файлов в R и преобразование списков в таблицы
11. Простейшая визуализация данных, пакет ggplot2 и функции qplot
12. Построение графиков слой за слоем на языке R с помощью ggplot2
13. Изменение элементов графика и темы в ggplot2
Ссылки:
- плейлист на YouTube
- подписаться на YouTube канал
- статья о курсе на Хабре
#курс_R
По возможности, конечно, буду постить и свежие материалы.
—————————————
И так марафон наиболее полезных материалов я решил открыть своим курсом "Язык R для пользователей Excel".
О курсе:
Курс посвящён введению в манипуляцию данных на языке R средствами библиотеки
tidyverse, и входящих в неё пакетов: dplyr, tidyr, ggplot2, forcats и так далее.К каждому уроку есть тест, предназначенный для проверки полученных в ходе урока знаний. Найти ссылку на тест можно в описании видео на YouTube, или в статье на Хабре.
Требований к уровню подготовки нет, я думаю что в курсе для себя найдут что то полезное как совсем новички, так и те, кто уже имеет опыт работы с R.
Видео уроки:
1. Установка языка R и среды разработки RStudio
2. Структуры данных в R
3. Загрузка данных из csv, tsv, excel файлов и Google таблиц в R
4. Фильтрация строк, выбор и переименование столбцов, пайпланы в R
5. Добавление вычисляемых столбцов в таблицу на языке R
6. Группировка и агрегация данных на языке R
7. Вертикальное и горизонтальное объединение таблиц на языке R
8. Оконные функции в R
9. Вращение таблиц или аналог сводных таблиц в R
10. Загрузка JSON файлов в R и преобразование списков в таблицы
11. Простейшая визуализация данных, пакет ggplot2 и функции qplot
12. Построение графиков слой за слоем на языке R с помощью ggplot2
13. Изменение элементов графика и темы в ggplot2
Ссылки:
- плейлист на YouTube
- подписаться на YouTube канал
- статья о курсе на Хабре
#курс_R
Про 8 марта в Твиттере. Каждая точка - твит (учитывались только твиты на английском), размер, по-видимому, зависит от лайков, а цветовую легенду не разобрала. Очень нравится идея с таким одуванчиком✨
Приятные оттенки серого для разнообразия. Серый вообще топ цвет для визуализаций, когда нужно делать фокус на чем-то одном (тогда серым делаете все категории, а какую-то выделяете другим более ярким). Связка серый+синий уже немного классическая, но часто берут самые дефолтные серый и синий, а вот такие оттенки могут сделать виз ещё симпатичнее 🦭
Как правильно отметил Николай, нам в Питере все оттенки серого очень нравятся)) Вот мой самый любимый сервис для поиска палитр https://coolors.co, там же можно загрузить картинку и выбрать цвета по ней. Фотографии природы, кстати, проверенный способ находить хорошие сочетания, потому что там уж все идеально. А следующим постом представляю вам палетку по последней фотке Питера, какая у меня была💫
Визуализация, в которой можно найти сравнить праздники разных культур, ну и просто найти себе праздник на день🎉
Forwarded from Reveal the Data
Сделал трибьют знаменитой работы Вильяма Плейфэира про баланс экспорта и импорта Англии на современных данных для UK и Евросоюза. Визуализация показывает, как развивались события после объявления брекзита и полного выхода из Евросоюза.
Ещё собрал работы, которые являются переделками знаменитых визов или выполнены в cтиле состаренных или печатных работ:
— Charles Minard's Napoleons March
— Tribute to Edvard Tufte
— Atlantic Sea Routes
— Anti Asian Hate Incidents
— Traveling World
— Spell O and I
#пример #ссылка
Ещё собрал работы, которые являются переделками знаменитых визов или выполнены в cтиле состаренных или печатных работ:
— Charles Minard's Napoleons March
— Tribute to Edvard Tufte
— Atlantic Sea Routes
— Anti Asian Hate Incidents
— Traveling World
— Spell O and I
#пример #ссылка
В рамках #30DayChartChallenge в Твиттере очень много интересных работ. Вот, например, лепестковая диаграмма про столкновения птиц с самолетами. Очень красиво сделано🌻
https://twitter.com/jakekaupp/status/1380214121711435776?s=21
https://twitter.com/jakekaupp/status/1380214121711435776?s=21
Вот это да! Чуть легенду поменял и уже совершенно другая картинка! Ошибка прямо как из учебника 🌎
Про выбор цветов для хороплета есть хорошая статья от Datawrapper. Есть много способов выбора палитр, но в основном нужно искать баланс между данными и тем, какую мысль хотите донести. Одна из классических книг про карты - "How to Lie with Maps" и в "How Charts lie" тоже много примеров с картами.
Оригинал поста в инсте и там вообще достаточно много карт и графиков, которые очень не очень((
Спасибо Марусе за этот прекрасный твит.
Про выбор цветов для хороплета есть хорошая статья от Datawrapper. Есть много способов выбора палитр, но в основном нужно искать баланс между данными и тем, какую мысль хотите донести. Одна из классических книг про карты - "How to Lie with Maps" и в "How Charts lie" тоже много примеров с картами.
Оригинал поста в инсте и там вообще достаточно много карт и графиков, которые очень не очень((
Спасибо Марусе за этот прекрасный твит.
Не отпускает мысль со вчерашнего поста, что дата-журналистика - это безумно круто, но при этом на дата-журналистах лежит огромная ответственность в плане визуализаций. Проблема не в том, чтобы нарисовать график и сделать его понятным, а в том, чтобы этот график не смещал восприятие аудитории, закладывая идеи автора внутрь, и не создавал ощущение того, чего на самом деле нет. И если в бизнесе люди могут достаточно быстро понять, что с данными или графиком что-то не так, тк видят их каждый день, то тут аудитория часто "сырая", да и времени на подробное чтение графика нет, из-за чего можно поверить буквально любой картинке. Я сама часто не делаю графики по каким-то темам (например, политическим) именно из-за этого груза ответственности.
И как говорит Alberto Cairo: “We need to stop sharing charts and news stories mindlessly. We all have the civic duty to avoid spreading charts and stories that may be misleading. We must contribute to a healthier informational environment.”❤️
И как говорит Alberto Cairo: “We need to stop sharing charts and news stories mindlessly. We all have the civic duty to avoid spreading charts and stories that may be misleading. We must contribute to a healthier informational environment.”❤️
Я раньше думала, что буду работать веб-аналитиком, очень мне нравилась вся эта тема с гугл аналитикой и яндекс метрикой. Примерно в это же время обнаружила для себя пакеты на R для работы с метрикой от ryandexdirect, я тогда была в таком восторге от удобства работы с ним, да и до сих пор считаю, что пакет просто супер🍀
Автор пакета - Алексей Селезнёв, как и множества других для работы с API фейсбука, вконтакте и тд. Он также ведет канал про R, где делится последними материалами, митапами, бесплатными уроками и всем прочим про R. Вот, например, как работать с API вконтакте пакетов rvkstat или как сделать лемматизацию русского текста.
Автор пакета - Алексей Селезнёв, как и множества других для работы с API фейсбука, вконтакте и тд. Он также ведет канал про R, где делится последними материалами, митапами, бесплатными уроками и всем прочим про R. Вот, например, как работать с API вконтакте пакетов rvkstat или как сделать лемматизацию русского текста.