This media is not supported in your browser
VIEW IN TELEGRAM
не думала, что канал r/ретранслятор когда-нибудь поможет найти такую полезность (помимо рандомных интересных видосов)
официальное нетикток видео
официальное нетикток видео
❤85
И еще тогда полезное, я обычно все скачиваю через DataMiner. Это, наверное, мой самый любимый тул для быстрого скрапинга (я смотрела другие и этот самый понятный и удобный).
Можно очень легко скрапить данные, создавая простые автоматические “рецепты”. Я так качала hh, airbnb, booking и даже частично гугл новости. Понятно, что маленькие объемы, но дальше бесплатной версии я и не ходила (а там, судя по видосам, начинается сказка).
На некоторые сайты есть готовые рецепты скрапинга. Ну и таблицы тоже качать, конечно, можно. А работает простым экстеншном. Короче, я очень рекомменд!
Можно очень легко скрапить данные, создавая простые автоматические “рецепты”. Я так качала hh, airbnb, booking и даже частично гугл новости. Понятно, что маленькие объемы, но дальше бесплатной версии я и не ходила (а там, судя по видосам, начинается сказка).
На некоторые сайты есть готовые рецепты скрапинга. Ну и таблицы тоже качать, конечно, можно. А работает простым экстеншном. Короче, я очень рекомменд!
❤74
Forwarded from LEFT JOIN
This media is not supported in your browser
VIEW IN TELEGRAM
🤿 Глубокое погружение в визуализацию данных 🌊
Недавно прочитал объемную книжку Hands-On Data Visualization про визуализацию данных. Чтобы сэкономить вам время, структурировал самые полезные главы из книги в этом посте.
▪Суперский список ресурсов по поиску датасетов
▪ Классная глава про очистку данных и про функцию Smart Cleanup в Google
▪Инструмент Tabula для извлечения таблиц из pdf
▪Инструмент Open Refine: мощная вещь для очистки данных, которую я изучал в Georgia Tech
▪Важные правила построения графиков:
▪Клевые мануалы по созданию чартов в DataWrapper
▪Полезные принципы дизайна таблиц
▪Серия мануалов по созданию графиков на Chart.js
▪Любопытная глава по определению лжи на графиках
▪Как лгать с помощью графиков и как лгать с помощью карт
▪Полезный прием: выставление акцентов в данных при сторителлинге
❕Не мог не выделить отдельно главу про важность отличий медианы и среднего следующей старой шуткой:
There’s an old joke that when a billionaire walks into a room, everyone becomes a millionaire—on average—but the median barely changes.
Сохраняйте себе этот список, оставляйте ❤️, если хотите больше контента про датавиз!
Недавно прочитал объемную книжку Hands-On Data Visualization про визуализацию данных. Чтобы сэкономить вам время, структурировал самые полезные главы из книги в этом посте.
▪Суперский список ресурсов по поиску датасетов
▪ Классная глава про очистку данных и про функцию Smart Cleanup в Google
▪Инструмент Tabula для извлечения таблиц из pdf
▪Инструмент Open Refine: мощная вещь для очистки данных, которую я изучал в Georgia Tech
▪Важные правила построения графиков:
▪Клевые мануалы по созданию чартов в DataWrapper
▪Полезные принципы дизайна таблиц
▪Серия мануалов по созданию графиков на Chart.js
▪Любопытная глава по определению лжи на графиках
▪Как лгать с помощью графиков и как лгать с помощью карт
▪Полезный прием: выставление акцентов в данных при сторителлинге
❕Не мог не выделить отдельно главу про важность отличий медианы и среднего следующей старой шуткой:
There’s an old joke that when a billionaire walks into a room, everyone becomes a millionaire—on average—but the median barely changes.
Сохраняйте себе этот список, оставляйте ❤️, если хотите больше контента про датавиз!
❤136
RStudio расширяются и переименовываются в Posit
Our charter defines our mission as the creation of free and open source software for data science, scientific research, and technical communication. This mission intentionally goes beyond “R for Data Science”—we hope to take the approach that’s succeeded with R and apply it more broadly.
RStudio в сердечке навсегда, конечно
Our charter defines our mission as the creation of free and open source software for data science, scientific research, and technical communication. This mission intentionally goes beyond “R for Data Science”—we hope to take the approach that’s succeeded with R and apply it more broadly.
RStudio в сердечке навсегда, конечно
Posit
RStudio is becoming Posit - Posit
We are very excited to announce that RStudio has a new name, Posit.
❤40
Материалы с воркшопа про генеративное искусство на R от Danielle Navarro в рамках #RStudioConf2022. Очень красивое, первая картинка - стандартный датасет mtcars, например.
❤52
Способы визуализации неопределенности от Claus Wilke в его книге Fundamentals of Data Visualization. Отмечает, что нужно обязательно указывать уровень доверия в доверительных интервалах. Кажется очень лаконичным решение с толщиной линий.
❤43
Мини-инфографика про сильнейших бегунов на 200 метров от Damola Ladipo. Мне только не очень зашло расположение подписей, как будто хочется поменять местами их по порядку.
ps спасибо Наташе, показала, что автор обновил вариант с более упорядоченными подписями :3
ps спасибо Наташе, показала, что автор обновил вариант с более упорядоченными подписями :3
❤30
Forwarded from Чартомойка
Симпатичный проект от команды data-to-viz.com. Ребята собрали 128 качественных визуализаций из интернета и добавили к ним фильтров: по типу визуализации и по использованному инструменту.
Всё это богатство предлагается использовать для вдохновения, когда вы испытываете трудности с выбором конкретной графической формы для вашей визуализации.
Если вы в теме, многие визуализации вам покажутся знакомыми, но все равно что-то новенькое и интересное точно найдётся.
https://www.dataviz-inspiration.com/
Всё это богатство предлагается использовать для вдохновения, когда вы испытываете трудности с выбором конкретной графической формы для вашей визуализации.
Если вы в теме, многие визуализации вам покажутся знакомыми, но все равно что-то новенькое и интересное точно найдётся.
https://www.dataviz-inspiration.com/
❤46
Marie Patino для Bloomberg про варианты визуализации экстремальной жары. Радужная шкала, где фиолетовый - экстремально холодно, красный - экстремально жарко, критикуется, так как сложно сказать, насколько фиолетовый отличается от желтого, например. Сводится к идее, что лучше брать градиент от синего к красному, как в warming stripes.
❤39
Основные причины смертей в мире а формате карты-анаморфозы. Данные за 2016 год, показывают причины смерти, которые превысили 20% от общего числа смертей как минимум в 1 стране.
❤30