Семинар по Causal Inference
🔸 14 октября (пятница) в 19:00 МСК — на Chamberlain Seminar 🗣 Charles Manski (Northwestern) представит своё исследование «Probabilistic Prediction for Binary Treatment Choice: with focus on personalized medicine».
Зарегистрироваться на семинар можно по ссылке.
👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
🔸 14 октября (пятница) в 19:00 МСК — на Chamberlain Seminar 🗣 Charles Manski (Northwestern) представит своё исследование «Probabilistic Prediction for Binary Treatment Choice: with focus on personalized medicine».
Зарегистрироваться на семинар можно по ссылке.
👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
NBER
Probabilistic Prediction for Binary Treatment Choice: with Focus on Personalized Medicine
This paper extends my research applying statistical decision theory to treatment choice with sample data, using maximum regret to evaluate the performance of treatment rules. The specific new contribution is to study as-if optimization using estimates of…
👍5🔥1🎉1
Нашли мероприятие, которое объединит подписчиков из академии и индустрии🧑🏼🎓👩💻
➡️ 7-8 ноября будет проходить второй Causal Data Science Meeting. Формат — онлайн. Зарегистрироваться можно по ссылке.
Главные спикеры — профессор 🗣 Judea Pearl (UCLA) и 🗣 Silvia Chiappa из британской компании DeepMind.
👌 В программе много интересного: от рассказов про прикладные тулы для причинно-следственного вывода в машинном обучении до теоретических докладов. И, конечно, достаточно прикладных кейсов от Netflix, Microsoft, eBay, LinkedIn и одной запрещенной в России компании.
Увидимся в зуме 👀
👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
Главные спикеры — профессор 🗣 Judea Pearl (UCLA) и 🗣 Silvia Chiappa из британской компании DeepMind.
Увидимся в зуме 👀
👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🤩3❤1
Forwarded from Совет молодых учёных ЭФ МГУ (СМУч)
Онлайн-научные семинары в пятницу 28.10.22 г. (классные, но к сожалению, идут одновременно)
📌Семинар памяти Гэри Чемберлена
5pm London (19:00 по Москве), Zoom.
Кирилл Пономарёв (Чикаго) "Selecting Inequalities for Sharp Identification in Models with Set-Valued Predictions."
Модератор - Stephane Bonhomme.
Регистрация: https://www.chamberlainseminar.org/home
Семинар проходит раз в 2 недели. На сайте выложены старые записи и слайды.
📌Applied Machine Learning, Economics, and Data Science (AMLEDS)
Alberto Cavallo (Harvard) - "Big Data and Covid Inflation"
11:00 EDT / 16:00 GMT / 17:00 CET (19:00 по Москве), Zoom
Регистрация:
https://sites.google.com/view/amleds/home
Мероприятие интересное, среди организаторов Jesús Fernández-Villaverde, например. Проходит раз в месяц, докладчики - Радж Четти, Хелен Рэй, Francis X. Diebold...
На сайте выложены старые записи.
📌Семинар памяти Гэри Чемберлена
5pm London (19:00 по Москве), Zoom.
Кирилл Пономарёв (Чикаго) "Selecting Inequalities for Sharp Identification in Models with Set-Valued Predictions."
Модератор - Stephane Bonhomme.
Регистрация: https://www.chamberlainseminar.org/home
Семинар проходит раз в 2 недели. На сайте выложены старые записи и слайды.
📌Applied Machine Learning, Economics, and Data Science (AMLEDS)
Alberto Cavallo (Harvard) - "Big Data and Covid Inflation"
11:00 EDT / 16:00 GMT / 17:00 CET (19:00 по Москве), Zoom
Регистрация:
https://sites.google.com/view/amleds/home
Мероприятие интересное, среди организаторов Jesús Fernández-Villaverde, например. Проходит раз в месяц, докладчики - Радж Четти, Хелен Рэй, Francis X. Diebold...
На сайте выложены старые записи.
www.chamberlainseminar.org
Chamberlain Seminar
The Gary Chamberlain Online Seminar in Econometrics
👍4
🎲 Рандомизированные контролируемые эксперименты (Randomized Control Trials, RCT) часто называют «золотым стандартом» эмпирического анализа. Но у RCT, как у любого другого метода, есть ограничения и недостатки. О них, а также о причинах стремительного взлета методологии рандомизированных экспериментов до передних краев экономического мейнстрима, рассуждает 🗣 Ростилав Капелюшников:
➡️ На практике достигать посредством рандомизации абсолютной сбалансированности между экспериментальной и контрольной группами почти никогда не удается.
➡️ Ограниченность бюджета вынуждает использовать небольшие по размеру выборки, тогда как идеальная схема RCT предполагает использование большого числа наблюдений.
➡️ RCT не застрахованы от проблемы аутлайерства, то есть появления выбросов, которые сильно искажают результаты.
➡️ RCT в экономике не являются двойными слепыми. Отсюда высокий риск возникновения эффекта самоотбора: участники эксперимента могут переходить из одной группы в другую, если надеются, что их положение от этого улучшится.
➡️ Нередко разбивка на экспериментальную и контрольную группу производится по целым кластерам— деревням, школам, больницам и т.д. Однако разбивка на две случайные группы кластеров не гарантирует разбивки на две случайные группы индивидов.
➡️ Даже в идеальных условиях с помощью RCT чаще всего оценивается только один показатель — средний эффект воздействия. Но политикам и спонсорам программ могут быть важны и другие характеристики распределения, т.к. любое вмешательство чаще всего порождает как выигрывающих, так и проигрывающих — в зависимости от характеристик индивидов и социальных групп, к которым они принадлежат.
➡️ Как правило, RCT ограничиваются оценкой краткосрочных эффектов вмешательства, игнорируя долгосрочные.
➡️ Проблема внутренней валидности — успешный RCT говорит лишь о том, что для данной группы населения данного региона программа оказалась эффективной. Но он ничего не говорит о том, есть ли смысл распространять эту программу на другие группы населения других регионов.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥4❤1
доказательный ⎵ пробел
Нашли мероприятие, которое объединит подписчиков из академии и индустрии🧑🏼🎓👩💻 ➡️ 7-8 ноября будет проходить второй Causal Data Science Meeting. Формат — онлайн. Зарегистрироваться можно по ссылке. Главные спикеры — профессор 🗣 Judea Pearl (UCLA) и 🗣 Silvia…
Webinar ID: 670 7981 6673
Passcode: CDSM22
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Семинар по Causal Inference
🔸 15 ноября (вторник) в 19:30 МСК — на The Online Causal Inference Seminar 🗣 Karthik Rajkumar (LinkedIn) расскажет про результаты масштабного пятилетнего рандомизированного эксперимента на платформе LinkedIn, направленного на оценку влияния слабых связей на трудовую мобильность.
Подключиться к семинару можно по ссылке. Пароль: 386638.
👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
🔸 15 ноября (вторник) в 19:30 МСК — на The Online Causal Inference Seminar 🗣 Karthik Rajkumar (LinkedIn) расскажет про результаты масштабного пятилетнего рандомизированного эксперимента на платформе LinkedIn, направленного на оценку влияния слабых связей на трудовую мобильность.
Подключиться к семинару можно по ссылке. Пароль: 386638.
👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
👍4🔥2
Эффекты от размещения видеокамер на избирательных участках
Мы уже рассматривали использование разрывного дизайна (Regression Discontinuity Design, RDD) в медицинских исследованиях. Сегодня будет пример из политологии. 🗣 Анастасия Файкина (University of California San Diego) в своей job market paper оценила, как размещение видеокамер на избирательных участках во время президентских выборов 2018 года в России повлияло на явку и результаты голосования.
Напомним, что RDD для оценки эффектов использует тот факт, что государство или иной агент устанавливают правило, в соответствии с которым попадание в программу (воздействие) определяется значением переменной участия. В случае с видеокамерами на избирательных участках такая переменная — число избирателей. В 2018 году Центральная избирательная комиссия решила, что камеры должны устанавливаться на тех участках, где число прикрепленных избирателей превышает одну тысячу. Тогда, сравнивая участки слева и справа от этого значения, можно оценить средний локальный эффект воздействия.
Подробнее об интерпретации разрывного дизайна можно прочитать тут.
➡️ Получились следующие результаты: наличие видеонаблюдения на участке в среднем снижает официальную явку на 5,2%, а голосование за действующую власть — на 8,3%. При этом растет явка и результаты кандидата от действующей власти на соседних участках без камер, а эффект проявляется сильнее в сельской местности.
👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
Мы уже рассматривали использование разрывного дизайна (Regression Discontinuity Design, RDD) в медицинских исследованиях. Сегодня будет пример из политологии. 🗣 Анастасия Файкина (University of California San Diego) в своей job market paper оценила, как размещение видеокамер на избирательных участках во время президентских выборов 2018 года в России повлияло на явку и результаты голосования.
Напомним, что RDD для оценки эффектов использует тот факт, что государство или иной агент устанавливают правило, в соответствии с которым попадание в программу (воздействие) определяется значением переменной участия. В случае с видеокамерами на избирательных участках такая переменная — число избирателей. В 2018 году Центральная избирательная комиссия решила, что камеры должны устанавливаться на тех участках, где число прикрепленных избирателей превышает одну тысячу. Тогда, сравнивая участки слева и справа от этого значения, можно оценить средний локальный эффект воздействия.
Подробнее об интерпретации разрывного дизайна можно прочитать тут.
👉 Подписаться на доказательный ⎵ пробел: https://news.1rj.ru/str/evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍3
Тройная разность (The triple difference)
Сегодня поговорим про метод тройной разности (triple difference, TD difference-in-difference-in-differences, DDD).
Предположим, что есть два региона. В первом регионе T (treatment) вводится новая медицинская программа, а во втором регионе C (control) — нет. При этом и в регионе T, и в регионе C есть две группы граждан — A и B. Воздействию новой программы подвергается только группа B в регионе T. Кроме того, как и в стандартном методе DiD, есть два временных периода — Pre (до введения новой программы в регионе T) и Post (после введения новой программы в регионе T).
Цель исследователя — оценить средний эффект от внедрения программы на интересующие полисимейкеров показатели здоровья для подвергшихся воздействию.
➡️ Для этого можно, во-первых, сравнить изменение показателей здоровья в группах A и B только в регионе T (в котором вводится программа). Это обычный метод DiD. Но такая оценка получится смещенной, если в регионе T программа приводит к появлению внешних эффектов, которые действуют на группу A, или если есть разнонаправленные тренды в целевой переменной, которые связаны с характеристиками групп A и B (group-specific trends / shocks).
➡️ Во-вторых, можно сравнить изменение показателей здоровья только в группе B, но для регионов Т и С. Это опять обычный метод DiD. Но оценка получится смещенной, если в регионах T и C сильно различаются внешние экономические условия (state-specific trends / shocks), так, что даже без воздействия показатели здоровья для группы B будут меняться очень по-разному.
➡️ Однако можно предположить, что различия во внешних экономических условиях не повлияют на относительные результаты группы А и группы В в двух регионах, и оценить требуемый эффект. Метод тройной разности позволяет получить несмещенную оценку эффекта, даже если есть location-specific trends (относительно регионов T и C) и partition-specific trends (относительно групп A и B).
Сегодня поговорим про метод тройной разности (triple difference, TD difference-in-difference-in-differences, DDD).
Предположим, что есть два региона. В первом регионе T (treatment) вводится новая медицинская программа, а во втором регионе C (control) — нет. При этом и в регионе T, и в регионе C есть две группы граждан — A и B. Воздействию новой программы подвергается только группа B в регионе T. Кроме того, как и в стандартном методе DiD, есть два временных периода — Pre (до введения новой программы в регионе T) и Post (после введения новой программы в регионе T).
Цель исследователя — оценить средний эффект от внедрения программы на интересующие полисимейкеров показатели здоровья для подвергшихся воздействию.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤2🔥2🎉1
Что посмотреть про метод тройной разности:
• Запись семинара 🗣 Pedro Sant'Anna (Microsoft, Vanderbilt University): тут и про базовую спецификацию, и про ситуации, когда периодов много, объекты подвергаются воздействию неединовременно, а в модели вводятся дополнительные ковариаты. Слайды к семинару доступны по ссылке.
• Статья Olden A., Møen J. (2022). The triple difference estimator. The Econometrics Journal, 25(3).
➡️ Бонус — два исследования 2022 года на российских данных, в которых используется метод тройной разности:
• 🗣Руслан Кучаков и 🗣Дмитрий Скугаревский из Института проблем правоприменения Европейского университета про оценку эффекта зарплатных субсидий, на которые могли претендовать российские компании малого и среднего бизнеса в период COVID-19
• 🗣Елена Котырло и 🗣Елена Варшавская из НИУ ВШЭ о влиянии сокращения продолжительности срочной службы в армии с одного до двух лет в 2007-2008 гг. на спрос на высшее образование
• Запись семинара 🗣 Pedro Sant'Anna (Microsoft, Vanderbilt University): тут и про базовую спецификацию, и про ситуации, когда периодов много, объекты подвергаются воздействию неединовременно, а в модели вводятся дополнительные ковариаты. Слайды к семинару доступны по ссылке.
• Статья Olden A., Møen J. (2022). The triple difference estimator. The Econometrics Journal, 25(3).
• 🗣Руслан Кучаков и 🗣Дмитрий Скугаревский из Института проблем правоприменения Европейского университета про оценку эффекта зарплатных субсидий, на которые могли претендовать российские компании малого и среднего бизнеса в период COVID-19
• 🗣Елена Котырло и 🗣Елена Варшавская из НИУ ВШЭ о влиянии сокращения продолжительности срочной службы в армии с одного до двух лет в 2007-2008 гг. на спрос на высшее образование
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Triple Differences Research Designs at Causal Solutions
Difference-in-Differences (DiD) is one of the most popular methods in the social sciences for estimating causal effects in non-experimental settings. Its primary identifying assumption is a so-called parallel trends assumption that states that, in the absence…
🔥6❤3👍3👨💻1
Open-source библиотека по A/B тестированию от МТС
Big Data МТС вывели в open source библиотеку Ambrosia для проведения A/B тестов и экспериментов. Инструмент позволяет работать с разными этапами жизненного цикла A/B тестирования от дизайна эксперимента до расчета эффекта, также реализованы основные методы ускорения экспериментов.
💻 Репозиторий Github
✔️ Есть несколько туториалов по работе с библиотекой
@evidencespace
Big Data МТС вывели в open source библиотеку Ambrosia для проведения A/B тестов и экспериментов. Инструмент позволяет работать с разными этапами жизненного цикла A/B тестирования от дизайна эксперимента до расчета эффекта, также реализованы основные методы ускорения экспериментов.
💻 Репозиторий Github
✔️ Есть несколько туториалов по работе с библиотекой
@evidencespace
Хабр
Ambrosia – Open Source-библиотека для работы с A/B-тестами
Всем привет! На связи Аслан Байрамкулов и Артем Хакимов из Big Data МТС . Мы вывели в Open Source первую версию библиотеки под названием Ambrosia . Ее назначение – работа с A/B тестами и...
👍9❤2
Forwarded from Совет молодых учёных ЭФ МГУ (СМУч)
SUNDAY READING LIST: НЕЗНАЧИМЫЕ РЕЗУЛЬТАТЫ
1. Simmons, J. P., Nelson, L. D., & Simonsohn, U. (2011). False-Positive Psychology: Undisclosed Flexibility in Data Collection and Analysis Allows Presenting Anything as Significant. Psychological Science, 22(11), 1359–1366. https://doi.org/10.1177/0956797611417632
Показывают, что из-за "гибкости" в сборе и анализе данных исследователь вероятнее получит ложно-положительный, чем ложно-отрицательный результат. Поэтому предлагают простые правила для авторов и рецензентов: заранее определить момент окончания сбора данных, подробно описывать все условия эксперимента, приводить список всех переменных, приводить результаты с исключаемыми наблюдениями и без них и т.д.
2. Benjamin, D.J., Berger, J.O., Johannesson, M. et al. Redefine statistical significance. Nature Human Behaviour 2, 6–10 (2018). https://doi.org/10.1038/s41562-017-0189-z
Предлагают более строгий порог для р-значения, чтобы повысить надёжность результатов.
3. A. Abadie Statistical Non-Significance in Empirical Economics // NBER working paper, 2018
https://www.nber.org/papers/w24403
Абади утверждает, что результаты эмпирического исследования в экономике интересны, если они меняют наши изначальные представления. Например, ожидаемое воздействие большинства мер государственной политики ненулевое. В этом случае незначимые результаты могут изменить наши убеждения, а значит, они не бесполезны.
4. Часто имеет место publication bias — ситуация, когда вероятнее будет опубликован значимый результат. В нескольких областях науки созданы журналы, где публикуются статьи с незначимыми результатами: психология — Journal of Articles in Support of the Null Hypothesis https://www.jasnh.com/, биомедицина — Journal of Negative Results in Biomedicine https://jnrbm.biomedcentral.com/, экология и эволюционная биология — Journal of Negative Results http://www.jnr-eeb.org/index.php/jnr/index
#sundayreadinglist_efmsu
1. Simmons, J. P., Nelson, L. D., & Simonsohn, U. (2011). False-Positive Psychology: Undisclosed Flexibility in Data Collection and Analysis Allows Presenting Anything as Significant. Psychological Science, 22(11), 1359–1366. https://doi.org/10.1177/0956797611417632
Показывают, что из-за "гибкости" в сборе и анализе данных исследователь вероятнее получит ложно-положительный, чем ложно-отрицательный результат. Поэтому предлагают простые правила для авторов и рецензентов: заранее определить момент окончания сбора данных, подробно описывать все условия эксперимента, приводить список всех переменных, приводить результаты с исключаемыми наблюдениями и без них и т.д.
2. Benjamin, D.J., Berger, J.O., Johannesson, M. et al. Redefine statistical significance. Nature Human Behaviour 2, 6–10 (2018). https://doi.org/10.1038/s41562-017-0189-z
Предлагают более строгий порог для р-значения, чтобы повысить надёжность результатов.
3. A. Abadie Statistical Non-Significance in Empirical Economics // NBER working paper, 2018
https://www.nber.org/papers/w24403
Абади утверждает, что результаты эмпирического исследования в экономике интересны, если они меняют наши изначальные представления. Например, ожидаемое воздействие большинства мер государственной политики ненулевое. В этом случае незначимые результаты могут изменить наши убеждения, а значит, они не бесполезны.
4. Часто имеет место publication bias — ситуация, когда вероятнее будет опубликован значимый результат. В нескольких областях науки созданы журналы, где публикуются статьи с незначимыми результатами: психология — Journal of Articles in Support of the Null Hypothesis https://www.jasnh.com/, биомедицина — Journal of Negative Results in Biomedicine https://jnrbm.biomedcentral.com/, экология и эволюционная биология — Journal of Negative Results http://www.jnr-eeb.org/index.php/jnr/index
#sundayreadinglist_efmsu
❤1
Forwarded from Reliable ML
Митап ODS Reliable ML по АБ-тестированию и Causal Inference - 17 декабря
Анонсы докладов
Всем привет!
Не всё же читать про АБ-тесты, давайте про них говорить!
17 декабря мы с Димой приглашаем вас на митап по АБ-тестам от канала @Reliable ML и Open Data Science.
В программе 9 докладов от мэтров в этой области. Начнем в 11 утра по Мск, закончим - примерно в 18 (или как пойдет).
Регистрация на митап туть!
Очень хотелось бы, чтобы этот митап получился в формате живого обсуждения сложных и интересных тем, с которыми мы с вами встречаемся на практике. А не просто рассказа докладов. Так что просим начинать готовить вопросы участникам и ваши практические кейсы, связанные с АБ, которыми готовы поделиться.
Программа:
11:00 - Ваагн Минасян, Lead DS @ X5 Tech - Оценки с двойной надёжностью для выявления причинно-следственных связей в бизнесе
11:45 - Дмитрий Васькин, Data Scientist @ Lenta - Synthetic Control для AB тестов на малых размерах выборок
12:30 - Аслан Байрамкулов, Head of Experimental Group @ МТС BigData - Ambrosia - open-source библиотека для быстрой и удобной работы с A/B тестами
13:15 - Артем Ерохин, Lead DS @ X5 Tech - Balancing Methods in Causal Inference
14:30 - Александр Сахнов - Парный, пуассоновский и дикий бутстреп
15:15 - Валерий Бабушкин, VP, Data Science @ Blockchain.com - Метрики: от офлайна до иерархии
16:00 - Максим Кочуров, PyMC Labs - Планирование Байесовских АБ тестов
16:45 - Дмитрий Торшин, Data Scientist @ Lenta - Causal Impact и как его готовить
17:30 - Григорий Чернов, PhD in Economics, University of Tuebingen, ВШЭ - Causal Discovery Methods for Experimental Design
Далее постараемся рассказать подробнее об отдельных докладах!
#анонс #tech #ab_testing
Анонсы докладов
Всем привет!
Не всё же читать про АБ-тесты, давайте про них говорить!
17 декабря мы с Димой приглашаем вас на митап по АБ-тестам от канала @Reliable ML и Open Data Science.
В программе 9 докладов от мэтров в этой области. Начнем в 11 утра по Мск, закончим - примерно в 18 (или как пойдет).
Регистрация на митап туть!
Очень хотелось бы, чтобы этот митап получился в формате живого обсуждения сложных и интересных тем, с которыми мы с вами встречаемся на практике. А не просто рассказа докладов. Так что просим начинать готовить вопросы участникам и ваши практические кейсы, связанные с АБ, которыми готовы поделиться.
Программа:
11:00 - Ваагн Минасян, Lead DS @ X5 Tech - Оценки с двойной надёжностью для выявления причинно-следственных связей в бизнесе
11:45 - Дмитрий Васькин, Data Scientist @ Lenta - Synthetic Control для AB тестов на малых размерах выборок
12:30 - Аслан Байрамкулов, Head of Experimental Group @ МТС BigData - Ambrosia - open-source библиотека для быстрой и удобной работы с A/B тестами
13:15 - Артем Ерохин, Lead DS @ X5 Tech - Balancing Methods in Causal Inference
14:30 - Александр Сахнов - Парный, пуассоновский и дикий бутстреп
15:15 - Валерий Бабушкин, VP, Data Science @ Blockchain.com - Метрики: от офлайна до иерархии
16:00 - Максим Кочуров, PyMC Labs - Планирование Байесовских АБ тестов
16:45 - Дмитрий Торшин, Data Scientist @ Lenta - Causal Impact и как его готовить
17:30 - Григорий Чернов, PhD in Economics, University of Tuebingen, ВШЭ - Causal Discovery Methods for Experimental Design
Далее постараемся рассказать подробнее об отдельных докладах!
#анонс #tech #ab_testing
🎉3❤1👍1
Что послушать на ASSA в 2023 году?
Приближаются новогодние праздники, а значит нас снова ждет конференция ASSA от Американской экономической ассоциации. Как и в прошлом году, выбрали секции про доказательную политику и оценку причинно-следственных связей.
6️⃣ января
Causal Inference Methods and Applications in Tech: экстраполяция оценок эффектов от Netflix, платформа проведения ценовых экспериментов от Amazon, оценка долгосрочных эффектов от Microsoft и компромисс между справедливостью и эффективностью на маркетплейсах от Susan Athey.
Adaptive Experimentation and Policy Learning: двурукие гауссовские бандиты при фиксированном бюджете, многорукие бандиты и общие причины (confounding), экспериментальный дизайн при наличии внешних эффектов.
Quasi-Experimental Identification and Estimation: оценка внешних эффектов, выбор валидных инструментальных переменных, анализ чувствительности при эндогенных пропущенных переменных.
Machine Learning and High Dimensional Methods for Causal and Policy Learning: оптимальные алгоритмы для многоруких бандитов, causal inference на зашумленных данных и статистический вывод в ситуации, когда точечные оценки эффекта получить невозможно.
7️⃣ января
Treatment Effects: двухшаговый метод наименьших квадратов и локальный средний эффект воздействия, эффекты воздействия при изучении двусторонних рынков, bunching design, разность в разностях с непрерывным воздействием.
Evidence Use in Policymaking: как в Китае проводят полиси-эксперименты и какие у них ограничения, как полисимейкеры адаптируют свои оценки программ на основе научной экспертизы (полисимейкеры запоминают хорошие результаты и игнорируют плохие), эффекты от обучения чиновников основам эконометрики.
8️⃣ января
Replications in Economics: определение реплицируемости, презентация the Institute for Replication (I4R) и итоги репликации результатов нескольких статей.
@evidencespace
Приближаются новогодние праздники, а значит нас снова ждет конференция ASSA от Американской экономической ассоциации. Как и в прошлом году, выбрали секции про доказательную политику и оценку причинно-следственных связей.
6️⃣ января
Causal Inference Methods and Applications in Tech: экстраполяция оценок эффектов от Netflix, платформа проведения ценовых экспериментов от Amazon, оценка долгосрочных эффектов от Microsoft и компромисс между справедливостью и эффективностью на маркетплейсах от Susan Athey.
Adaptive Experimentation and Policy Learning: двурукие гауссовские бандиты при фиксированном бюджете, многорукие бандиты и общие причины (confounding), экспериментальный дизайн при наличии внешних эффектов.
Quasi-Experimental Identification and Estimation: оценка внешних эффектов, выбор валидных инструментальных переменных, анализ чувствительности при эндогенных пропущенных переменных.
Machine Learning and High Dimensional Methods for Causal and Policy Learning: оптимальные алгоритмы для многоруких бандитов, causal inference на зашумленных данных и статистический вывод в ситуации, когда точечные оценки эффекта получить невозможно.
7️⃣ января
Treatment Effects: двухшаговый метод наименьших квадратов и локальный средний эффект воздействия, эффекты воздействия при изучении двусторонних рынков, bunching design, разность в разностях с непрерывным воздействием.
Evidence Use in Policymaking: как в Китае проводят полиси-эксперименты и какие у них ограничения, как полисимейкеры адаптируют свои оценки программ на основе научной экспертизы (полисимейкеры запоминают хорошие результаты и игнорируют плохие), эффекты от обучения чиновников основам эконометрики.
8️⃣ января
Replications in Economics: определение реплицируемости, презентация the Institute for Replication (I4R) и итоги репликации результатов нескольких статей.
@evidencespace
🔥9👍3
Forwarded from Путеводитель по доказательной политике
Окей, доказательная политика.
Задача приоритизации (выбора одной из нескольких альтернатив) - самая часто встречающаяся задача в госуправлении. Речь может идти о выборе одного из нескольких инвестиционных проектов, программ с наибольшим риском для достижения цели,оптимальных технологий здоровья или нуждающихся в долговременном уходе.
При этом критерий выбора обычно не единственный. Как правило, необходимо рассматривать целый ряд критериев - например, критериев доступности, влияния
на окружающую среду, здоровья населения и т.д. Задача осложняется тем, что критерии часто имеют сложную структуру и могут конфликтовать между собой.
В таких условиях могут помочь мультикритериальные методы - один из классов алгоритмов теории принятия решений. Важно, что мультикритериальные методы могут быть инструментом, который позволяет сделать более
прозрачным процесс выбора критериев и оценки их важности - этот процесс предполагает вовлечение и диалог между заинтересованными сторонами.
Об этом и о двух полезных алгоритмах MCDA (с примерами и тетрадками Python) экспертная записка Счетной палаты.
Задача приоритизации (выбора одной из нескольких альтернатив) - самая часто встречающаяся задача в госуправлении. Речь может идти о выборе одного из нескольких инвестиционных проектов, программ с наибольшим риском для достижения цели,оптимальных технологий здоровья или нуждающихся в долговременном уходе.
При этом критерий выбора обычно не единственный. Как правило, необходимо рассматривать целый ряд критериев - например, критериев доступности, влияния
на окружающую среду, здоровья населения и т.д. Задача осложняется тем, что критерии часто имеют сложную структуру и могут конфликтовать между собой.
В таких условиях могут помочь мультикритериальные методы - один из классов алгоритмов теории принятия решений. Важно, что мультикритериальные методы могут быть инструментом, который позволяет сделать более
прозрачным процесс выбора критериев и оценки их важности - этот процесс предполагает вовлечение и диалог между заинтересованными сторонами.
Об этом и о двух полезных алгоритмах MCDA (с примерами и тетрадками Python) экспертная записка Счетной палаты.
ach.gov.ru
Официальный сайт Счетной палаты Российской Федерации
👍7
Оценка долгосрочных эффектов
Как в индустрии, так и в академии приходится обращать внимание на долгосрочные эффекты от имплементируемых изменений. Например, в онлайн экспериментах кликбейтная вызывающая реклама может приводить в краткосрочном периоде к росту CTR (кликабельности), но в будущем вызовет отток клиентов и снижение прибыли. Многие государственные программы имеют отложенный эффект воздействия.
Основная проблема — результаты оценки для принятия решений нужны здесь и сейчас, а собирать данные долго и дорого. В онлайн-экспериментах увеличение их продолжительности приводит к дополнительным проблемам: потеря пользователей из-за неизбежного удаления куки-файлов, а также смешение тестовой и контрольной групп.
Что можно сделать? Стандартное решение — использование прокси-метрик (driver metrics, surrogate, intermediate short-term outcome), по которым можно предсказать долгосрочный эффект.
Собрали основные статьи про этот и другие подходы с примерами реализации.
@evidencespace
Как в индустрии, так и в академии приходится обращать внимание на долгосрочные эффекты от имплементируемых изменений. Например, в онлайн экспериментах кликбейтная вызывающая реклама может приводить в краткосрочном периоде к росту CTR (кликабельности), но в будущем вызовет отток клиентов и снижение прибыли. Многие государственные программы имеют отложенный эффект воздействия.
Основная проблема — результаты оценки для принятия решений нужны здесь и сейчас, а собирать данные долго и дорого. В онлайн-экспериментах увеличение их продолжительности приводит к дополнительным проблемам: потеря пользователей из-за неизбежного удаления куки-файлов, а также смешение тестовой и контрольной групп.
Что можно сделать? Стандартное решение — использование прокси-метрик (driver metrics, surrogate, intermediate short-term outcome), по которым можно предсказать долгосрочный эффект.
Собрали основные статьи про этот и другие подходы с примерами реализации.
@evidencespace
👍4
👩🏻🎓 АКАДЕМИЯ
📄Chetty et al. (2019). The Surrogate Index: Combining Short-Term Proxies to Estimate Long-Term Treatment Effects More Rapidly and Precisely
⌨️ Код (только Stata, правда😞)
📄Athey S., Chetty R., Imbens G. (2020). Combining Experimental and Observational Data to Estimate Treatment Effects on Long Term Outcomes
📄Chen J., Ritzwoller D.M. (2022). Semiparametric Estimation of Long-Term Treatment Effects
⌨️ Пакет для R
📄Imbens et al. (2022). Long-term Causal Inference Under Persistent Confounding via Data Combination
🧑🏼💻 ИНДУСТРИЯ
📄 Hassan et al. (2013). Beyond clicks: query reformulation as a predictor of search satisfaction
📄 Hohnhold H., O’Brien D., Tang D. (2015). Focusing on the Long-term: It’s Good for Users and Business
📄 Duan W., Ba S., Zhang C. (2019). Online Experimentation with Surrogate Metrics: Guidelines and a Case Study
📬 Пост на medium
⌨️ Код в R
📄 Yang et al. (2020). Targeting for long-term outcomes
📄 Sadeghi et al. (2022). Novelty and primacy: a long-term estimator for online experiments
📄Wang at al. (2022). Surrogate for Long-Term User Experience in Recommender Systems
@evidencespace
📄Chetty et al. (2019). The Surrogate Index: Combining Short-Term Proxies to Estimate Long-Term Treatment Effects More Rapidly and Precisely
⌨️ Код (только Stata, правда😞)
📄Athey S., Chetty R., Imbens G. (2020). Combining Experimental and Observational Data to Estimate Treatment Effects on Long Term Outcomes
📄Chen J., Ritzwoller D.M. (2022). Semiparametric Estimation of Long-Term Treatment Effects
⌨️ Пакет для R
📄Imbens et al. (2022). Long-term Causal Inference Under Persistent Confounding via Data Combination
🧑🏼💻 ИНДУСТРИЯ
📄 Hassan et al. (2013). Beyond clicks: query reformulation as a predictor of search satisfaction
📄 Hohnhold H., O’Brien D., Tang D. (2015). Focusing on the Long-term: It’s Good for Users and Business
📄 Duan W., Ba S., Zhang C. (2019). Online Experimentation with Surrogate Metrics: Guidelines and a Case Study
📬 Пост на medium
⌨️ Код в R
📄 Yang et al. (2020). Targeting for long-term outcomes
📄 Sadeghi et al. (2022). Novelty and primacy: a long-term estimator for online experiments
📄Wang at al. (2022). Surrogate for Long-Term User Experience in Recommender Systems
@evidencespace
Opportunity Insights
The Surrogate Index: Combining Short-Term Proxies to Estimate Long-Term Treatment Effects More Rapidly and Precisely | Opportunity…
🔥6❤2👍2