доказательный ⎵ пробел – Telegram
доказательный ⎵ пробел
1.26K subscribers
181 photos
1 video
10 files
285 links
Про causal inference, данные для исследований и принятие решений на основе данных.

Чат: @evidence_chat
Download Telegram
🔹 Единый кодбук в формате гугл-таблички Российского мониторинга экономического положения и здоровья населения НИУ ВШЭ от @tochno_st. Внутри — вопросы и варианты ответов для 5-31 волн обследования. Можно быстро посмотреть, есть ли нужные для вашего исследования данные, и для каких конкретно волн они доступны.

@evidencespace
🔥12👍3
О СОВПАДЕНИЯХ

Сегодня среди еженедельной понедельничной серии препринтоа NBER был опубликован такой
👍9
☝️О красивых совпадениях:

NBER: публикует препринт Клаудии Голдин Why Women Won

Нобелевский комитет: вручает нобелевскую премию по экономике Клаудии Голдин
🔥11🤔4
Золотистый ретривер на первой иллюстрации к анонсу тоже не случаен.

@evidencespace
5👍5🥰3😱1
An R reproducibility toolkit for the practical researcher 🐑

Для практического исследователя важно иметь инструментарий для R-воспроизводимых вычислений. Курс от Elio Campitelli и Paola Corrales, который проводился 9-12 октября 2023 г., нацелен на то, чтобы понять как организовать проект, ускорить совместную работу и максимизировать ее воспроизводимость, используя существующие инструменты экосистемы R, такие как RMarkdown, renv и другие, контроль версий и рабочие среды.

Материалы курса кратко, но довольно содержательно с хорошими иллюстрациями показывают, в частности:

✔️ как создать проект R
✔️ управлять воспроизводимой средой
✔️ публиковать данные
✔️ отслеживать изменения с помощью Git
✔️ создавать и публиковать контейнеры

📙 Напомню про книгу Building reproducible analytical pipelines with R by Bruno Rodrigues и сайт по воспроизводимому анализу данных.
👍52
Telling Stories with Data 🔥

▪️ Книга Telling Stories with Data призвана помочь исследователям работать с данными, включая сбор данных (например, с использованием API и частично структурированных данных, таких как JSON и XML), очистку данных, документирование и моделирование на основе воспроизводимых рабочих процессов.

▪️ В книге приводятся примеры на основе социальных, культурных и экономических данных используя разнообразные методы, в частности, разведочный анализ данных, поиск причинно-следственных связей, регрессионный анализ. Книга пошагово подробно показывает все аспекты работы с данными и имеет хорошие отзывы.

Автор - Rohan Alexander создал несколько курсов на основе книги для бакалавриата, магистратуры и профессионального обучения. Книга недавно издана и доступна в печатном виде.
8
Издательство ДМК Пресс незаметно перевело и выпустило одну из лучших вводных книжек по анализу и интерпретации данных — Thinking Clearly with Data: A Guide to Quantitative Reasoning and Analysis (Статистика без подвоха: Методы критического анализа данных и причинного вывода). На английском языке она вышла два года назад. Ее авторы — Энтони Фаулер и Итан Буэно де Мескита из Университета Чикаго.

И это не просто еще одна книжка по статистике. Впервые на русском языке (есть, правда, небольшая глава в Дружелюбной эконометрике Филиппа Картаева) появился учебник, в котором простым и понятным языком авторы рассказывают про основные методы причинно-следственного вывода — вся третья часть про это:

• Глава 9. Почему корреляция и причинно-следственная связь не одно и то же
• Глава 10. Выявление и ограничение искажающих факторов
• Глава 11. Рандомизированные эксперименты
• Глава 12. Модели разрывной регрессии
• Глава 13. Метод разности различий
• Глава 14. Механизмы причинно-следственных связей

Конечно, есть и про базовые методы статистики (Части 1, 2) и про принятие решений на основе данных (Часть 4). Вот что писал Константин Сонин по поводу английской версии книжки в 2021 году:

Вот ещё одно. Эта книга мне кажется идеальным учебником для курса по работе с данными — на первом курсе. Российское образование отстаёт, и очень сильно, в преподавании анализа данных — прежде всего для тех, кто на этом не специализируется. У нас по-прежнему базовая статистика требует до этого теорвера, с вероятностным пространством и функциями распределения, а ведь это — совсем не, что нужно. Можно — вот книжка прекрасный пример — говорить об интересном и сложном, без аксиом независимости и интегрирования функции плотности.

В прекрасной России будущего любой государственный служащий, который захочет занять позицию выше средней, будет сдавать экзамен по этой книжке (можно начинать готовиться 👨‍🏫).

💻 а еще в канал возвращается чат

@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👍32
Causal Inference in R 💡

Книга Causal Inference in R (Malcolm Barrett, Lucy D’Agostino McGowan, Travis Gerke) предназначена как для академических исследователей, так и для специалистов по обработке данных и позволит разобраться с причинно-следственным анализом с помощью R.

Авторы ведут свой блог и создали ряд соответствующих библиотек на основе {tidyverse}. Здесь же содержатся материалы практического семинара Causal Inference in R Workshop.

Еще две книги с элементами кода на R, Stata и Python также являются введением в предметную область опираясь на эконометрику:

🔹Causal Inference. The Mixtape by Scott Cunningham
🔹The Effect: An Introduction to Research Design and Causality by Nick Huntington-Klein

Отмечу аналогичные книги написанные на Python 🐍:

🔹Causal Inference for The Brave and True
🔹Causal Inference and Discovery in Python
👍143🔥2
Stata, R, Python

* из твиттера
😁101👎1🎉1
"Применение этого метода позволяет идентифицировать фактические причины. Информация представляется в виде диаграммы "рыбьего скелета" (метод также называют диаграммой Исикавы, используемой для измерения, оценки, контроля и усовершенствования качества производственных процессов) или в виде древовидной схемы." — пишет Минтруд 🐟.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔8😱2
🔹 Новая открытая база данных по смертности на основе административных источников. Данных за 2022/2023 годы там, правда, нет.

«Российская база данных краткосрочных колебаний смертности
(РосБКС) Международной лаборатории исследований населения и здоровья НИУ ВШЭ содержит понедельные общие и стандартизованные по возрасту коэффициенты смертности по регионам России и стране в целом за 2000-2021 гг.

Все представленные в РосБКС показатели рассчитаны на основе данных статистики населения, полученных от Федеральной службы государственной статистики. РосБКС ориентирована прежде всего на специалистов, занимающихся профессиональным анализом демографических показателей. Данные представлены в формате *.csv».

@evidencespace
🔥12👍1
#CausalInference #ML #MachineLearning #методы #МашинноеОбучение

Машинное обучение - это про предсказания и классификацию. Статистический причинно-следственный вывод (causal inference) - про количественную оценку эффекта воздействия одной конкретной переменной (например, насколько снизится - и снизится ли вообще - уровень насильственной преступности в уездном городе Ковылкино N, если алкоголь будут продавать до 21, а не до 22 часов). Казалось бы, что у этих задач и методов общего?

Долгое время они действительно развивались параллельно и почти без пересечений. Однако в какой-то момент выяснилось, что впечатляющие вычислительные инструменты ML очень подходят для таких типичных и важных для causal inference вещей, как моделирование конфаундинга (воздействия третьих переменных), гетерогенности эффекта воздействия (то же самое лекарство от головной боли одному человеку поможет, а другому - нет), а также динамических и сетевых (а если все с крыши пойдут прыгать?) контекстов.

Если вам знакомы такие слова, как мэтчинг, обратное взвешивание по вероятности, инструментальные переменные или разрывный дизайн, хотим обратить ваше внимание на новый обзор в Annual Review of Sociology от Дженни Брэнд, Шиань Джоу и Ю Сиэ (сразу просим прощения за потенциально ошибочную транскрипцию), в котором рассказывается, как во всех этих подходах (и других!) можно использовать методы машинного обучения с пользой для себя и для дела.

А если не знакомы, в статье идеи, лежащие в основании соответствующих дизайнов, объясняются просто и доступно - настолько, что вполне можно давать студентам-неэкономистам в качестве введения в проблематику causal inference.

Brand, J. E., Zhou, X., & Xie, Y. (2023). Recent Developments in Causal Inference and Machine Learning. Annual Review of Sociology, 49. https://doi.org/10.1146/annurev-soc-030420-015345

P.S. В качестве бонуса для тех, кто осилил до конца, - ссылка на лекционные слайды курса Кирилла Борусяка по прикладной эконометрике, прочитанного минувшей осенью в Беркли. Тоже много полезного и интересного.
🔥233👏3👍2