доказательный ⎵ пробел – Telegram
доказательный ⎵ пробел
1.26K subscribers
181 photos
1 video
10 files
285 links
Про causal inference, данные для исследований и принятие решений на основе данных.

Чат: @evidence_chat
Download Telegram
Семинар по Causal Inference

🔸 20 июля (среда) в 21:30 МСК — на Electronic Health Economics Colloquium «Summer Special‎»🗣 Jonathan Roth (Brown University) расскажет про новые направления в оценке методом «разность разностей» (difference-in-difference, DiD). В обсуждении примет участие 🗣 Andrew Goodman-Bacon, который, напомним, в своей статье 2021 года разобрал, что происходит, если применить классическую схему оценивания DiD для случая, когда есть больше двух периодов, а воздействие наступает в разные моменты времени.

Зарегистрироваться на семинар можно по ссылке .

Перед семинаром можно почитать обзорную статью про новые методологические подходы к оценке с помощью «разности разностей».

👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
👍41
NBER SUMMER INSTITUTE 2022

В понедельник стартовала самая мощная экономическая конференция NBER Summer Institute. В программе — почти все разделы современной прикладной экономической науки.

Программа: https://www.nber.org/conferences/summer-institute-2022

В этом году все сессии доступны в трансляции и записях на youtube-канале NBER https://www.youtube.com/nbervideos

На что обратить внимание:

14 июля на сессии по международным финансам и макроэкономике Дмитрий Мухин и Олег Ицхоки с работой "Optimal Exchange Rate Policy" https://www.nber.org/conferences/si-2022-international-finance-macroeconomics

15 июля на сессии по монетарной экономике — Дмитрий Архангельский и Василий Коровкин с работой "On Policy Evaluation with Aggregate Time-Series Shocks" https://www.nber.org/conferences/si-2022-monetary-economics

19 июля — Почетная лекция в честь основателя NBER Мартина Фельдстайна от Гиты Гопинат: Managing a Turn in the Global Financial Cycle https://www.nber.org/conferences/si-2022-martin-feldstein-lecture

28 июля — традиционный цикл лекций по эмпирическим методам в этот раз посвящен Байесовской эконометрике https://www.nber.org/conferences/si-2022-methods-lecture-empirical-bayes-methods-theory-and-application
👍3
РАЗРЫВНЫЙ ДИЗАЙН В МЕДИЦИНЕ

Разрывный дизайн
(Regression Discontinuity Design, RDD) — один из основных методов оценки причинно-следственных связей, в последнее время все активнее применяется в биомедицинских исследованиях. 🗣Boon et al. (2021) нашли 325 статей c RDD в области исследований здоровья, опубликованных с 1980 по 2019 годы.

При совершении медицинских интервенций (назначение лекарств, выбор метода лечения и т.п.) врачи часто пользуются результатами медицинских анализов. Границы на значения отдельных показателей учитываются в правилах принятия решений. Например, если значение показателя по результатам анализа крови превышает определенный порог, то назначается специальное лечение. Это как раз то, что нужно, для применения RDD — можно сравнивать пациентов, находящихся слева и справа от такой границы, чтобы оценивать эффекты от лечения.

В новом гайде 🗣 Matias D. Cattaneo, 🗣 Luke Keele, 🗣 Roc ́ıo Titiunik разбирают особенности применения разрывного дизайна в медицине. Прикладная часть построена на анализе трех кейсов:

• The Hlabisa HIV Treatment and Care Programme (Южная Африка): пациентам с ВИЧ назначалось прохождение антиретровирусной терапии, если концентрация СВ-4 лимфоцитов в крови не превышала 350 клеток/мл

• Когорта пациенток с раком молочной железы (the Penn Breast Database): для принятия решения о целесообразности назначения химиотерапии после операции используются специальные генетические тесты для предсказания вероятности рецидива (если вероятность превышает определенный порог, то назначается химиотерапия)

• Программа медицинского страхования в Тайване: любые медицинские услуги для детей младше трех лет полностью бесплатны

💻 Данные и код на R для репликации кейсов доступны в репозитории

👨‍🏫 Подборку с учебниками, лекциями и статьями по RDD можно посмотреть тут
👍11
Forwarded from Записки Ппилифа (Ppilif Uliankin)
Мой друг Леша Царёв принес к нам в канал новость недели:

Брюс Хансен всё-таки дописал свои учебники по Теории вероятностей и статистике для экономистов, а также по Эконометрике. По моему мнению, это лучшие книги продвинутого уровня для изучения этой части науки о данных. Во-первых, потому что они достаточно глубокие и дотошные. Во-вторых, потому что Хансен хорошо и понятно пишет. И в-третьих, электронный формат не ограничивает автора и позволяет достигнуть бОльшей гибкости в плане эмпирических примеров, данных и кода.

В общем, как я уже сказал, отличная новость под конец недели!

P.S. Добавлю от себя, что это именно тот Хансен, который доказал, что из ТГМ можно выбросить одно из условий 🙂
👍11
Курсы по анализу причинно-следственных связей в открытом доступе

В 📀 github-репозитории Mixtape Sessions, организованных 🗣Скоттом Каннингемом, доступны материалы пяти курсов по causal inference:

Causal Inference Part I
Causal Inference Part II (пока наполняется)
Instrumental variables (IV)
Shift-Share Instrumental Variables (SSIV)
Advanced Difference-in-Differences

👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
🔥14👍2
Эконометристам:

16 сентября (19:00 МСК) — семинар памяти Гэри Чермберлена
Zoom, язык - английский
Докладчик - Ashesh Rambachan (Microsoft Research)
Тема: "Identifying Prediction Mistakes in Observational Data".
Модератор - Jann Spiess (Stanford GSB), дискутанты - Ismael Mourifie (университет Торонто и NBER) и Peter Hull (Университет Брауна и NBER)

Регистрация и подробности:
https://www.chamberlainseminar.org/home
Драфт статьи:
https://asheshrambachan.github.io/assets/files/asheshr_identifyingPredictionMistakes_Main.pdf
👍5
Семинар по Causal Inference

🔸 14 октября (пятница) в 19:00 МСК — на Chamberlain Seminar 🗣 Charles Manski (Northwestern) представит своё исследование «Probabilistic Prediction for Binary Treatment Choice: with focus on personalized medicine»‎.

Зарегистрироваться на семинар можно по ссылке.

👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
👍5🔥1🎉1
Нашли мероприятие, которое объединит подписчиков из академии и индустрии🧑🏼‍🎓👩‍💻

➡️ 7-8 ноября будет проходить второй Causal Data Science Meeting. Формат — онлайн. Зарегистрироваться можно по ссылке.

Главные спикеры — профессор 🗣 Judea Pearl (UCLA) и 🗣 Silvia Chiappa из британской компании DeepMind.

👌 В программе много интересного: от рассказов про прикладные тулы для причинно-следственного вывода в машинном обучении до теоретических докладов. И, конечно, достаточно прикладных кейсов от Netflix, Microsoft, eBay, LinkedIn и одной запрещенной в России компании.

Увидимся в зуме 👀

👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤩31
Онлайн-научные семинары в пятницу 28.10.22 г. (классные, но к сожалению, идут одновременно)

📌Семинар памяти Гэри Чемберлена
5pm London (19:00 по Москве), Zoom.
Кирилл Пономарёв (Чикаго) "Selecting Inequalities for Sharp Identification in Models with Set-Valued Predictions."
Модератор - Stephane Bonhomme.
Регистрация: https://www.chamberlainseminar.org/home
Семинар проходит раз в 2 недели. На сайте выложены старые записи и слайды.

📌Applied Machine Learning, Economics, and Data Science (AMLEDS)
Alberto Cavallo (Harvard) - "Big Data and Covid Inflation"
11:00 EDT / 16:00 GMT / 17:00 CET (19:00 по Москве), Zoom
Регистрация:
https://sites.google.com/view/amleds/home
Мероприятие интересное, среди организаторов Jesús Fernández-Villaverde, например. Проходит раз в месяц, докладчики - Радж Четти, Хелен Рэй, Francis X. Diebold...
На сайте выложены старые записи.
👍4
🎲 Рандомизированные контролируемые эксперименты (Randomized Control Trials, RCT) часто называют «золотым стандартом» эмпирического анализа. Но у RCT, как у любого другого метода, есть ограничения и недостатки. О них, а также о причинах стремительного взлета методологии рандомизированных экспериментов до передних краев экономического мейнстрима, рассуждает 🗣 Ростилав Капелюшников:

➡️ На практике достигать посредством рандомизации абсолютной сбалансированности между экспериментальной и контрольной группами почти никогда не удается.

➡️ Ограниченность бюджета вынуждает использовать небольшие по размеру выборки, тогда как идеальная схема RCT предполагает использование большого числа наблюдений.

➡️ RCT не застрахованы от проблемы аутлайерства, то есть появления выбросов, которые сильно искажают результаты.

➡️ RCT в экономике не являются двойными слепыми. Отсюда высокий риск возникновения эффекта самоотбора: участники эксперимента могут переходить из одной группы в другую, если надеются, что их положение от этого улучшится.

➡️ Нередко разбивка на экспериментальную и контрольную группу производится по целым кластерам— деревням, школам, больницам и т.д. Однако разбивка на две случайные группы кластеров не гарантирует разбивки на две случайные группы индивидов.

➡️ Даже в идеальных условиях с помощью RCT чаще всего оценивается только один показатель — средний эффект воздействия. Но политикам и спонсорам программ могут быть важны и другие характеристики распределения, т.к. любое вмешательство чаще всего порождает как выигрывающих, так и проигрывающих — в зависимости от характеристик индивидов и социальных групп, к которым они принадлежат.

➡️ Как правило, RCT ограничиваются оценкой краткосрочных эффектов вмешательства, игнорируя долгосрочные.

➡️ Проблема внутренней валидности — успешный RCT говорит лишь о том, что для данной группы населения данного региона программа оказалась эффективной. Но он ничего не говорит о том, есть ли смысл распространять эту программу на другие группы населения других регионов.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥41
🧐 Так, нас становится больше, и мы планируем дальше развивать этот островок иллюзорной стабильности. Расскажите, чем вы сейчас занимаетесь, чтобы нам было проще подбирать интересный контент.
Please open Telegram to view this post
VIEW IN TELEGRAM
Семинар по Causal Inference

🔸 15 ноября (вторник) в 19:30 МСК — на The Online Causal Inference Seminar 🗣 Karthik Rajkumar (LinkedIn) расскажет про результаты масштабного пятилетнего рандомизированного эксперимента на платформе LinkedIn, направленного на оценку влияния слабых связей на трудовую мобильность.

Подключиться к семинару можно по ссылке. Пароль: 386638.

👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
👍4🔥2
Эффекты от размещения видеокамер на избирательных участках

Мы уже рассматривали использование разрывного дизайна (Regression Discontinuity Design, RDD) в медицинских исследованиях. Сегодня будет пример из политологии. 🗣 Анастасия Файкина (University of California San Diego) в своей job market paper оценила, как размещение видеокамер на избирательных участках во время президентских выборов 2018 года в России повлияло на явку и результаты голосования.

Напомним, что RDD для оценки эффектов использует тот факт, что государство или иной агент устанавливают правило, в соответствии с которым попадание в программу (воздействие) определяется значением переменной участия. В случае с видеокамерами на избирательных участках такая переменная — число избирателей. В 2018 году Центральная избирательная комиссия решила, что камеры должны устанавливаться на тех участках, где число прикрепленных избирателей превышает одну тысячу. Тогда, сравнивая участки слева и справа от этого значения, можно оценить средний локальный эффект воздействия.

Подробнее об интерпретации разрывного дизайна можно прочитать тут.

➡️ Получились следующие результаты: наличие видеонаблюдения на участке в среднем снижает официальную явку на 5,2%, а голосование за действующую власть — на 8,3%. При этом растет явка и результаты кандидата от действующей власти на соседних участках без камер, а эффект проявляется сильнее в сельской местности.

👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍3
Тройная разность (The triple difference)

Сегодня поговорим про метод тройной разности (triple difference, TD difference-in-difference-in-differences, DDD).

Предположим, что есть два региона. В первом регионе T (treatment) вводится новая медицинская программа, а во втором регионе C (control) — нет. При этом и в регионе T, и в регионе C есть две группы граждан — A и B. Воздействию новой программы подвергается только группа B в регионе T. Кроме того, как и в стандартном методе DiD, есть два временных периода — Pre (до введения новой программы в регионе T) и Post (после введения новой программы в регионе T).

Цель исследователя — оценить средний эффект от внедрения программы на интересующие полисимейкеров показатели здоровья для подвергшихся воздействию.

➡️ Для этого можно, во-первых, сравнить изменение показателей здоровья в группах A и B только в регионе T (в котором вводится программа). Это обычный метод DiD. Но такая оценка получится смещенной, если в регионе T программа приводит к появлению внешних эффектов, которые действуют на группу A, или если есть разнонаправленные тренды в целевой переменной, которые связаны с характеристиками групп A и B (group-specific trends / shocks).

➡️ Во-вторых, можно сравнить изменение показателей здоровья только в группе B, но для регионов Т и С. Это опять обычный метод DiD. Но оценка получится смещенной, если в регионах T и C сильно различаются внешние экономические условия (state-specific trends / shocks), так, что даже без воздействия показатели здоровья для группы B будут меняться очень по-разному.

➡️ Однако можно предположить, что различия во внешних экономических условиях не повлияют на относительные результаты группы А и группы В в двух регионах, и оценить требуемый эффект. Метод тройной разности позволяет получить несмещенную оценку эффекта, даже если есть location-specific trends (относительно регионов T и C) и partition-specific trends (относительно групп A и B).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍112🔥2🎉1
Что посмотреть про метод тройной разности:

Запись семинара 🗣 Pedro Sant'Anna (Microsoft, Vanderbilt University): тут и про базовую спецификацию, и про ситуации, когда периодов много, объекты подвергаются воздействию неединовременно, а в модели вводятся дополнительные ковариаты. Слайды к семинару доступны по ссылке.

• Статья Olden A., Møen J. (2022). The triple difference estimator. The Econometrics Journal, 25(3).

➡️ Бонус — два исследования 2022 года на российских данных, в которых используется метод тройной разности:

🗣Руслан Кучаков и 🗣Дмитрий Скугаревский из Института проблем правоприменения Европейского университета про оценку эффекта зарплатных субсидий, на которые могли претендовать российские компании малого и среднего бизнеса в период COVID-19

🗣Елена Котырло и 🗣Елена Варшавская из НИУ ВШЭ о влиянии сокращения продолжительности срочной службы в армии с одного до двух лет в 2007-2008 гг. на спрос на высшее образование
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥63👍3👨‍💻1
Open-source библиотека по A/B тестированию от МТС

Big Data МТС вывели в open source библиотеку Ambrosia для проведения A/B тестов и экспериментов. Инструмент позволяет работать с разными этапами жизненного цикла A/B тестирования от дизайна эксперимента до расчета эффекта, также реализованы основные методы ускорения экспериментов.

💻 Репозиторий Github
✔️ Есть несколько туториалов по работе с библиотекой

@evidencespace
👍92
SUNDAY READING LIST: НЕЗНАЧИМЫЕ РЕЗУЛЬТАТЫ

1. Simmons, J. P., Nelson, L. D., & Simonsohn, U. (2011). False-Positive Psychology: Undisclosed Flexibility in Data Collection and Analysis Allows Presenting Anything as Significant. Psychological Science, 22(11), 1359–1366. https://doi.org/10.1177/0956797611417632
Показывают, что из-за "гибкости" в сборе и анализе данных исследователь вероятнее получит ложно-положительный, чем ложно-отрицательный результат. Поэтому предлагают простые правила для авторов и рецензентов: заранее определить момент окончания сбора данных, подробно описывать все условия эксперимента, приводить список всех переменных, приводить результаты с исключаемыми наблюдениями и без них и т.д.

2. Benjamin, D.J., Berger, J.O., Johannesson, M. et al. Redefine statistical significance. Nature Human Behaviour 2, 6–10 (2018). https://doi.org/10.1038/s41562-017-0189-z
Предлагают более строгий порог для р-значения, чтобы повысить надёжность результатов.

3. A. Abadie Statistical Non-Significance in Empirical Economics // NBER working paper, 2018
https://www.nber.org/papers/w24403
Абади утверждает, что результаты эмпирического исследования в экономике интересны, если они меняют наши изначальные представления. Например, ожидаемое воздействие большинства мер государственной политики ненулевое. В этом случае незначимые результаты могут изменить наши убеждения, а значит, они не бесполезны.

4. Часто имеет место publication bias — ситуация, когда вероятнее будет опубликован значимый результат. В нескольких областях науки созданы журналы, где публикуются статьи с незначимыми результатами: психология — Journal of Articles in Support of the Null Hypothesis https://www.jasnh.com/, биомедицина — Journal of Negative Results in Biomedicine https://jnrbm.biomedcentral.com/, экология и эволюционная биология — Journal of Negative Results http://www.jnr-eeb.org/index.php/jnr/index

#sundayreadinglist_efmsu
1