Ранее мы уже рассказывали про развитие микросимуляционных моделей с открытым кодом, позволяющих моделировать эффекты от реформ в налоговом администрировании. Такие модели получают развитие, и вслед за Policy Simulation Library (PSL), которая - с последнего нашего упоминания о ней - заапгредилась в части новых библиотек (появились модели оценки поведенческих факторов населения при изменении подоходного налога, макроэкономические оценки общего равновесия, новые python-библиотеки Tax-Brain) к PSL подключился новый проект PolicyEngine, который использует репрезентативные микроданные опросов домохозяйств (US, UK) и позволяет пользователям моделировать системы налогообложения и льгот в США и Великобритании, предоставляя в том числе low-code платформы (подробнее на странице youtube проекта), которые дают возможность разрабатывать индивидуальные реформы налоговых льгот и видеть, как они влияют на население (бюджет домохозяйств, уровень бедности и неравенство).
Проекты, аналогичные PSL, кратно повышают ценность микроданных выборочных опросов населения, позволяя видеть потенциальные эффекты от планируемых реформ, повышая открытость данных и популяризируя культуру доказательной политики. К сожалению, на сегодняшний день такие решения на данных выборочных обследований Росстата имплементированы только в нескольких российских вузах, не являясь при этом открытыми. Зачастую эти решения выступают инструментами монополии на определенного рода экспертизу конкретного вуза. Отсутствует open-source площадка, где научные школы могли бы развивать подходы к микросимулированию налоговых (и не только) реформ в стране. Такая площадка могла бы стать хорошим проектом для организаций из научной отечественной институциональной среды. А солидарность исследовательских школ к подходам, порядку и механикам расчетов микросимуляционных моделей могла бы лечь в основу стандартов оценки реформ на уровне реализации госполитики. «Так поставим перед собою цель — высшее благо, чтобы стремиться к ней изо всех сил и иметь ее в виду в каждом деле, в каждом слове» )
@evidencespace
Проекты, аналогичные PSL, кратно повышают ценность микроданных выборочных опросов населения, позволяя видеть потенциальные эффекты от планируемых реформ, повышая открытость данных и популяризируя культуру доказательной политики. К сожалению, на сегодняшний день такие решения на данных выборочных обследований Росстата имплементированы только в нескольких российских вузах, не являясь при этом открытыми. Зачастую эти решения выступают инструментами монополии на определенного рода экспертизу конкретного вуза. Отсутствует open-source площадка, где научные школы могли бы развивать подходы к микросимулированию налоговых (и не только) реформ в стране. Такая площадка могла бы стать хорошим проектом для организаций из научной отечественной институциональной среды. А солидарность исследовательских школ к подходам, порядку и механикам расчетов микросимуляционных моделей могла бы лечь в основу стандартов оценки реформ на уровне реализации госполитики. «Так поставим перед собою цель — высшее благо, чтобы стремиться к ней изо всех сил и иметь ее в виду в каждом деле, в каждом слове» )
@evidencespace
👍8
Forwarded from Если быть точным
На сайтах хранится очень много данных — и часть из них не видна пользователям. Рассказываем, как найти труднодоступную информацию
В 2019 году журналисты и исследователи из США обнаружили, что «умные» дверные звонки со встроенными камерами используются правоохранителями. Сеть таких устройств слежки постоянно растет, охватывая всю страну.
Сеть была раскрыта через данные приложения Ring Neighbors, в котором владельцы «умных» звонков делились с соседями видео- и текстовыми сообщениями об обстановке в районе. Помог им в этом недокументированный API — и другого способа получить такие данные не было.
Дело в том, что информация с любого сайта выводится на экран пользователя через интерфейсы. Один из них — API, своего рода цифровая бюрократия. Отправляете шаблонный запрос и получаете ответ в понятном и заранее определенном формате. Часто API создаются в технических целях и инструкций, как ими пользоваться, разработчики не оставляют — их называют «недокументированными». Если научиться их находить, то можно сильно упростить выгрузку данных, а иногда — даже скачать больше данных, чем видно.
Через недокументированный API Росприроднадзора мы нашли, кто отвечает за выбросы самых опасных веществ от промышленных объектов в России. Правда, через несколько месяцев после публикации ведомство удалило API, а совсем недавно закрыло и весь реестр.
⚫️ О том, как без специальных навыков выгрузить много данных, читайте в новой инструкции «Если быть точным». В качестве примера — финансовая отчетность компаний от ФНС.
В 2019 году журналисты и исследователи из США обнаружили, что «умные» дверные звонки со встроенными камерами используются правоохранителями. Сеть таких устройств слежки постоянно растет, охватывая всю страну.
Сеть была раскрыта через данные приложения Ring Neighbors, в котором владельцы «умных» звонков делились с соседями видео- и текстовыми сообщениями об обстановке в районе. Помог им в этом недокументированный API — и другого способа получить такие данные не было.
Дело в том, что информация с любого сайта выводится на экран пользователя через интерфейсы. Один из них — API, своего рода цифровая бюрократия. Отправляете шаблонный запрос и получаете ответ в понятном и заранее определенном формате. Часто API создаются в технических целях и инструкций, как ими пользоваться, разработчики не оставляют — их называют «недокументированными». Если научиться их находить, то можно сильно упростить выгрузку данных, а иногда — даже скачать больше данных, чем видно.
Через недокументированный API Росприроднадзора мы нашли, кто отвечает за выбросы самых опасных веществ от промышленных объектов в России. Правда, через несколько месяцев после публикации ведомство удалило API, а совсем недавно закрыло и весь реестр.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍4🔥4👏1🤔1
1. Подготовительный этап, предполагающий формирование предмета оценки и организацию команды на основе проектных принципов (несколько блоков книги посвящены команде, ее компетенциям и порядкам взаимодействия).
2. Начальный этап, итогом которого являются уточненные вопросы оценки, матрица оценки (посвящен отдельный раздел) и методология оценки.
3. Промежуточный этап, включающий сбор и анализ данных, в том числе кабинетные и полевые исследования.
4. Этап синтеза полученных доказательств - формирование основных выводов и уроков в формате кейсов.
5. Этап распространения до заинтересованных лиц, принимающих решения.
6. Этап обратной связи, обеспечивающий наблюдение и контроль за выполнением субъектами, ответственными за принятие решений, рекомендаций оценки.
Отдельное внимание уделено методам и принципам оценки. В каждом разделе описаны требования к качеству результатов, прилагаются чек-листы. В свою очередь, бегло изучив документ, можно отметить, что вопросы качества самих доказательств во многом остаются открытыми. Безусловно будем возвращаться к этой теме в нашем канале: на сегодня есть много подходов к валидации доказательств при принятии решений на основе результатов оценки.
@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14👍6
🔥Это лето очень богато на публикации материалов по casual inference и оценке. Рады сообщить о новом издании CasualML-Book от Виктора Черножукова (MIT): Applied Causal Inference Powered by ML and AI.
⚡️ Самое вкусное, что этот фундаментальный труд упакован в отдельный бесплатный общедоступный курс CasualML-Book. Теория интегрируется с практикой: главы книги разбиты на модули с детальным разбором практических кейсов в Google Colab (R и python). Большое внимание уделяется Double ML, что не удивительно, поскольку это авторская разработка Виктора Черножукова. Разделите эту радостную новость вместе с нами.
@evidencespace
«Эта книга, основанная как на традиционной эконометрической теории, так и на современных методах машинного обучения, обязательна к прочтению специалистам по прикладной эконометрике любого возраста с любым бэкграундом!»
Джошуа Ангрист, лауреат премии по экономике памяти Нобеля «за методологический вклад в анализ причинно-следственных связей»
@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
❤18🔥12😱2🤩1
Forwarded from Polina Okuneva
Всем привет!
На майской конференции МТС у меня было выступление с докладом про Causal Inference (причинно-следственный анализ) по мотивам проекта, который мы реализовывали вместе с командой.
На примере оценки эффекта от нетаргетированной кампании рассказываю про этапы в работе по оценке эффекта от нетаргетированного предложения.
Этапы:
- построение причинно-следственного графа
- определение корректного набора переменных для оценки эффекта
- непосредственно оценка эффекта
Делюсь ссылкой. Будем рады вопросам😉
https://www.youtube.com/watch?v=oyQsIx-JjAU
На майской конференции МТС у меня было выступление с докладом про Causal Inference (причинно-следственный анализ) по мотивам проекта, который мы реализовывали вместе с командой.
На примере оценки эффекта от нетаргетированной кампании рассказываю про этапы в работе по оценке эффекта от нетаргетированного предложения.
Этапы:
- построение причинно-следственного графа
- определение корректного набора переменных для оценки эффекта
- непосредственно оценка эффекта
Делюсь ссылкой. Будем рады вопросам😉
https://www.youtube.com/watch?v=oyQsIx-JjAU
YouTube
Causal Inference на примере оценки эффекта от нетаргетированной кампании | Полина Окунева
Подписывайтесь на True Tech в Telegram: https://news.1rj.ru/str/truetechcommunity
На примере конкретной задачи для телекома об обещанном платеже обсудим пайплайн ее решения. Поговорим о важности построения причинно-следственной байесовской сети, необходимости и способах…
На примере конкретной задачи для телекома об обещанном платеже обсудим пайплайн ее решения. Поговорим о важности построения причинно-следственной байесовской сети, необходимости и способах…
❤7
В 2021 году в свет вышла книга профессора ЦЕУ Габора Бекеша и профессора Мичиганского университета Габора Кезди «Анализ данных для бизнеса, экономики и госуправления», опубликованная Cambridge University Press. Основным преимуществом книги является ее развитие от простого к сложному, а также большое количество прикладных кейсов, на примере которых рассматриваются процессы постановки исследовательской задачи, сбора и обработки данных, выбора и применения методов анализа с целью принятия решений.
В это же время появился интерактивный ресурс, посвященный изданию: https://gabors-data-analysis.com. В конце июля этого года ресурс обновился, предоставив в открытый доступ презентационные материалы по всем 24 разделам книги. Каждый кейс - мини-исследование. Например, разбираются следующие вопросы (возможно, какие-то из них будут отвечать вашим исследовательским интересам, и вы сможете реализовать описанные подходы на своих данных):
- как удаленная работа влияет на производительность труда;
- прогнозирование цен на жилье;
- как употребление овощей и фруктов влияет на здоровье;
- оценка гендерных и возрастных различий в доходах;
- как связаны продолжительность жизни и средний доход в стране;
- оценка портфеля акций и вероятности его убытков;
- оценка распределения доходов (как выбрать наилучшее распределение для аппроксимации результатов выборочных наблюдений)
🖥 Примеры кода на R, Stata и Python по кейсам можно найти здесь, примеры кода по другим разделам книги - здесь.
Однако полная книга доступна только за деньги. Но для наших читателей мы постарались (надеемся, что нас не закидают претензиями на авторское право🤫): pdf-копия - в аттаче. Знания должны быть доступными.
@evidencespace
В это же время появился интерактивный ресурс, посвященный изданию: https://gabors-data-analysis.com. В конце июля этого года ресурс обновился, предоставив в открытый доступ презентационные материалы по всем 24 разделам книги. Каждый кейс - мини-исследование. Например, разбираются следующие вопросы (возможно, какие-то из них будут отвечать вашим исследовательским интересам, и вы сможете реализовать описанные подходы на своих данных):
- как удаленная работа влияет на производительность труда;
- прогнозирование цен на жилье;
- как употребление овощей и фруктов влияет на здоровье;
- оценка гендерных и возрастных различий в доходах;
- как связаны продолжительность жизни и средний доход в стране;
- оценка портфеля акций и вероятности его убытков;
- оценка распределения доходов (как выбрать наилучшее распределение для аппроксимации результатов выборочных наблюдений)
Однако полная книга доступна только за деньги. Но для наших читателей мы постарались (надеемся, что нас не закидают претензиями на авторское право🤫): pdf-копия - в аттаче. Знания должны быть доступными.
@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
❤20👍9🔥7🥰2
Forwarded from ЦенСИБ (ex-ЛССИ)
#учебники #textbook #методы #methods #learning #Causal_Inference #CI
В преддверии стремительно (особенно для преподавателей) приближающейся летней школы ЛССИ по методам статистического причинно-следственного вывода (ака causal inference) публикуем небольшой список учебников и других образовательных ресурсов по теме, который читатели нашего канала могут найти для себя полезными.
Перечень, разумеется, далеко не полный: в этой области давно уже наступилатехнологическая текстовая сингулярность - пока прочитаешь один учебник, опубликуют ещё восемь. Представленные в списке источники отображают в первую очередь читательский опыт авторов курса, чьи память и свободное время ограничены и не позволяют объять необъятное. Поэтому не ругайтесь сильно, если мы упустили что-то интересное и важное - лучше просто напишите нам и поставьте в известность.
Итак, вот что мы рекомендуем:
Основные учебники
Cunningham, S. (2021). Causal Inference: The Mixtape. Yale University Press. Доступен в электронном виде: https://mixtape.scunning.com/index.html
Hernán M., and J.M. Robins. (2020). Causal Inference: What if. Boca Raton: Chapman & Hall/CRC. Обновленный вариант препринта доступен в электронном виде (и с примерами кода, причём не только в R!): https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/
Дополнительные учебники:
Ding, P. (2024). A first course in causal inference. CRC Press. Препринт доступен в электронном виде: https://arxiv.org/abs/2305.18793. Много примеров в R, которые позволяют понять механику соответствующих расчётов в терминах кода. Может быть сложновато для новичков, но зато идеально для тех, кто хочет понять, как статистический причинно-следственный вывод работает «под капотом» с программно-вычислительной точки зрения.
Morgan, S. L., & Winship, C. (2015). Counterfactuals and causal inference. Cambridge University Press. Используют много каузальных диаграмм (DAGs/НАГов). Однако и стандартную перспективу Рубина и др., а также классические дизайны эти авторы излагают неплохо.
Imbens, G. W., & Rubin, D. B. (2015). Causal inference in statistics, social, and biomedical sciences. Cambridge University Press. Самый математически нагруженный учебник из всех. Для тех, кто любит формулы и доказательства, а также готов разбираться с ними без соответствующего кода. Зато написан нобелиатом вместе с крёстным отцом всей дисциплины.
Angrist, J., and J. Pischke. (2008). Mostly Harmless Econometrics: An Empiricist's Companion. Princeton University Press. Не баян, а Классика, но примерно гомеровских времён. База изложена понятно и достойно, хотя детали относительно конкретных методов во многом уже устарели.
Chernozhukov, V., Hansen, C., Kallus, N., Spindler, M., & Syrgkanis, V. (2024). Applied causal inference powered by ML and AI. Доступен в электронном виде (с примерами в Python и R): https://causalml-book.org/. Помимо классических тем (потенциальные исходы, стандартные обсервационные дизайны, НАГи) много внимания уделяется интеграции каузального вывода и методов машинного обучения с акцентом на сценарии с реально большими данными. Много математики, зато очень пригодится, если вы хотите решать по-настоящему сложные прикладные задачи. Также есть отличный сайт-компаньон, посвященный одному из семейств методов, рассматриваемых в книге: https://docs.doubleml.org/stable/
Deng, A. (2021). Causal Inference and Its Applications in Online Industry. Доступен в электронном виде: https://alexdeng.github.io/causal/. Это черновик, причём, насколько можно судить, заброшенный. Однако даёт хорошее представление о том, как с методами каузального вывода работают в онлайн-индустрии. Впрочем, будет полезен и для тех, кто планирует научную карьеру и интересуется онлайн-процессами и/или большими данными.
В преддверии стремительно (особенно для преподавателей) приближающейся летней школы ЛССИ по методам статистического причинно-следственного вывода (ака causal inference) публикуем небольшой список учебников и других образовательных ресурсов по теме, который читатели нашего канала могут найти для себя полезными.
Перечень, разумеется, далеко не полный: в этой области давно уже наступила
Итак, вот что мы рекомендуем:
Основные учебники
Cunningham, S. (2021). Causal Inference: The Mixtape. Yale University Press. Доступен в электронном виде: https://mixtape.scunning.com/index.html
Hernán M., and J.M. Robins. (2020). Causal Inference: What if. Boca Raton: Chapman & Hall/CRC. Обновленный вариант препринта доступен в электронном виде (и с примерами кода, причём не только в R!): https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/
Дополнительные учебники:
Ding, P. (2024). A first course in causal inference. CRC Press. Препринт доступен в электронном виде: https://arxiv.org/abs/2305.18793. Много примеров в R, которые позволяют понять механику соответствующих расчётов в терминах кода. Может быть сложновато для новичков, но зато идеально для тех, кто хочет понять, как статистический причинно-следственный вывод работает «под капотом» с программно-вычислительной точки зрения.
Morgan, S. L., & Winship, C. (2015). Counterfactuals and causal inference. Cambridge University Press. Используют много каузальных диаграмм (DAGs/НАГов). Однако и стандартную перспективу Рубина и др., а также классические дизайны эти авторы излагают неплохо.
Imbens, G. W., & Rubin, D. B. (2015). Causal inference in statistics, social, and biomedical sciences. Cambridge University Press. Самый математически нагруженный учебник из всех. Для тех, кто любит формулы и доказательства, а также готов разбираться с ними без соответствующего кода. Зато написан нобелиатом вместе с крёстным отцом всей дисциплины.
Angrist, J., and J. Pischke. (2008). Mostly Harmless Econometrics: An Empiricist's Companion. Princeton University Press. Не баян, а Классика, но примерно гомеровских времён. База изложена понятно и достойно, хотя детали относительно конкретных методов во многом уже устарели.
Chernozhukov, V., Hansen, C., Kallus, N., Spindler, M., & Syrgkanis, V. (2024). Applied causal inference powered by ML and AI. Доступен в электронном виде (с примерами в Python и R): https://causalml-book.org/. Помимо классических тем (потенциальные исходы, стандартные обсервационные дизайны, НАГи) много внимания уделяется интеграции каузального вывода и методов машинного обучения с акцентом на сценарии с реально большими данными. Много математики, зато очень пригодится, если вы хотите решать по-настоящему сложные прикладные задачи. Также есть отличный сайт-компаньон, посвященный одному из семейств методов, рассматриваемых в книге: https://docs.doubleml.org/stable/
Deng, A. (2021). Causal Inference and Its Applications in Online Industry. Доступен в электронном виде: https://alexdeng.github.io/causal/. Это черновик, причём, насколько можно судить, заброшенный. Однако даёт хорошее представление о том, как с методами каузального вывода работают в онлайн-индустрии. Впрочем, будет полезен и для тех, кто планирует научную карьеру и интересуется онлайн-процессами и/или большими данными.
🔥10❤2
Forwarded from ЦенСИБ (ex-ЛССИ)
Blair, G., Coppock, A., & Humphreys, M. (2023). Research design in the social sciences: declaration, diagnosis, and redesign. Princeton University Press. Доступен в электронном виде: https://book.declaredesign.org/. Это не про причинно-следственный вывод в чистом виде, а про ex ante количественную оценку сильных и слабых сторон исследовательского дизайна с помощью статистических экспериментов, но идеи и принципы, изложенные в этой книге, окажут вам неоценимую помощь при анализе каузальных вопросов на практике.
Pearl, J., Glymour, M., & Jewell, N. P. (2016). Causal inference in statistics: A primer. John Wiley & Sons. Хорошее нетехническое введение в теорию направленных ациклических диаграмм (НАГов), но (мнение первого автора курса, а также, например, лауреата премии Шве́дского национа́льного ба́нка по экономи́ческим нау́кам па́мяти А́льфреда Но́беля Гвидо Имбенса) не особо полезное с точки зрения решения прикладных задач в социальных науках/оценке эффективности. То же самое замечание можно в целом предъявить и другим учебникам Пёрла и соавторов, да и математики в них больше, а их доступных бесплатных pdf-версий в информационно-телекоммуникационной сети «Интернет» – меньше.
Еще более дополнительные учебники
Вот ещё несколько учебников, которые могут кому-то оказаться полезными и доступны онлайн. Однако доступные ресурсы памяти и свободного времени у авторов ограничены, поэтому подробные отзывы предоставить [пока] не можем. Так что ограничимся ссылками:
Huntington-Klein, N. (2021). The effect: An introduction to research design and causality. Chapman and Hall/CRC. Доступен в электронном виде (с примерами в R, Python и Stata): https://theeffectbook.net/.
Barrett, M., D’Agostino McGowan, L. (2024). Causal Inference in R. Черновик. Доступен в электронном виде: https://www.r-causal.org/.
Bauer, P. (2020). Applied Causal Analysis (with R). Черновик. Доступен в электронном виде: https://bookdown.org/paul/applied-causal-analysis/.
Chabe-Ferre, S. (2024). Statistical Tools for Causal Inference. Черновик. Доступен в электронном виде: https://chabefer.github.io/STCI/.
Brumback, B.A. (2021). Fundamentals of causal inference: With R. Chapman and Hall/CRC.
P.S. И вот ещё немного полезных ссылок на закуску:
- Материалы курса (для политологов) Мэттью Блэквелла, прочитанного в Гарварде в 2022 году: https://mattblackwell.github.io/gov2003-f21-site/.
- Материалы курса (для политологов) Сайруса Самии, прочитанного в Нью-Йоркском университете (NYU) в 2024 году: https://cyrussamii.com/?page_id=3893.
-Материалы курса (для экономистов) Кирилла Боруcяка, прочитанного в Беркли в 2023 году: https://github.com/borusyak/are213.
- Материалы курса (для политологов) Косуке Имаи, прочитанного в Гарварде (NYU) в 2021 году: https://imai.fas.harvard.edu/teaching/cause.html
- Список пакетов R, в той или иной сфере затрагивающих проблематику статистического причинно-следственного вывода: https://cran.r-project.org/web/views/CausalInference.html.
- Личная страница Джуды Пёрла на сайте UCLA: https://bayes.cs.ucla.edu/jp_home.html. А также его блог, в котором в том числе публикуются интересные обзоры на свежую литературу: https://causality.cs.ucla.edu/blog/.
Pearl, J., Glymour, M., & Jewell, N. P. (2016). Causal inference in statistics: A primer. John Wiley & Sons. Хорошее нетехническое введение в теорию направленных ациклических диаграмм (НАГов), но (мнение первого автора курса, а также, например, лауреата премии Шве́дского национа́льного ба́нка по экономи́ческим нау́кам па́мяти А́льфреда Но́беля Гвидо Имбенса) не особо полезное с точки зрения решения прикладных задач в социальных науках/оценке эффективности. То же самое замечание можно в целом предъявить и другим учебникам Пёрла и соавторов, да и математики в них больше, а их доступных бесплатных pdf-версий в информационно-телекоммуникационной сети «Интернет» – меньше.
Еще более дополнительные учебники
Вот ещё несколько учебников, которые могут кому-то оказаться полезными и доступны онлайн. Однако доступные ресурсы памяти и свободного времени у авторов ограничены, поэтому подробные отзывы предоставить [пока] не можем. Так что ограничимся ссылками:
Huntington-Klein, N. (2021). The effect: An introduction to research design and causality. Chapman and Hall/CRC. Доступен в электронном виде (с примерами в R, Python и Stata): https://theeffectbook.net/.
Barrett, M., D’Agostino McGowan, L. (2024). Causal Inference in R. Черновик. Доступен в электронном виде: https://www.r-causal.org/.
Bauer, P. (2020). Applied Causal Analysis (with R). Черновик. Доступен в электронном виде: https://bookdown.org/paul/applied-causal-analysis/.
Chabe-Ferre, S. (2024). Statistical Tools for Causal Inference. Черновик. Доступен в электронном виде: https://chabefer.github.io/STCI/.
Brumback, B.A. (2021). Fundamentals of causal inference: With R. Chapman and Hall/CRC.
P.S. И вот ещё немного полезных ссылок на закуску:
- Материалы курса (для политологов) Мэттью Блэквелла, прочитанного в Гарварде в 2022 году: https://mattblackwell.github.io/gov2003-f21-site/.
- Материалы курса (для политологов) Сайруса Самии, прочитанного в Нью-Йоркском университете (NYU) в 2024 году: https://cyrussamii.com/?page_id=3893.
-Материалы курса (для экономистов) Кирилла Боруcяка, прочитанного в Беркли в 2023 году: https://github.com/borusyak/are213.
- Материалы курса (для политологов) Косуке Имаи, прочитанного в Гарварде (NYU) в 2021 году: https://imai.fas.harvard.edu/teaching/cause.html
- Список пакетов R, в той или иной сфере затрагивающих проблематику статистического причинно-следственного вывода: https://cran.r-project.org/web/views/CausalInference.html.
- Личная страница Джуды Пёрла на сайте UCLA: https://bayes.cs.ucla.edu/jp_home.html. А также его блог, в котором в том числе публикуются интересные обзоры на свежую литературу: https://causality.cs.ucla.edu/blog/.
lcsr.hse.ru
Летняя школа ЛССИ – 2024
Лаборатория сравнительных социальных исследований им. Р. Ф. Инглхарта приглашает к участию в летней школе «Методы статистического причинно-следственного вывода».
❤5👍3🔥3
Рекомендуем подкаст коллег ЭФ МГУ «Экономическая политика» (12 выпуск с Ириной Денисовой - один из любимых ❤️ ). Вообще подкасты - это отличный инструмент повышения лояльности ЦА вуза, и даже больше: исследования показывают, что подкасты эффективные инструменты обучения, которые развивают навыки студентов и повышают их академическую успеваемость. Например, Габриэль Кени и Юнис Одуро в рамках серии постов Teaching of Evaluation TIG week рассказывают о том, как можно встроить подкасты в процесс подготовки специалистов по оценке, а также приводят свои подборки и подборки подкастов от своих коллег, посвященные темам оценки программ и политик. Возможно, среди них найдете что-то интересное для себя: например, один из выпусков подкаста GEI (Global Evaluation Initiative) о проекте Программы развития ООН M&E Sandbox и результатах его реализации (расскажем о них как-нибудь в других постах, в основном это фреймворки по работе с изменениями систем: AAER, The Six Conditions of Systems Change и другие), которые способствуют внедрению новаторских подходов к мониторингу и оценке.
@evidencespace
@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Совет молодых учёных ЭФ МГУ (СМУч)
Пока есть время до начала учебы, можно послушать Подкаст программы “Экономическая политика” экономического факультета МГУ. 36 интересных эпизодов.
Говорим с преподавателями программы и гостями о важном в современной экономической политике, о профессии,…
Говорим с преподавателями программы и гостями о важном в современной экономической политике, о профессии,…
❤7👍4🎉2
J-pal пишут, что 27 августа 2024 года MIT (Massachusetts Institute of Technology) планирует провести вебинар, посвященный набору на программу обучения по анализу данных, экономике и разработке политик (The MicroMasters® Program in Data, Economics, and Design of Policy (DEDP). Все материалы курса будут доступны бесплатно онлайн 😌, если вы захотите получить сертификат MIT, то придется что-то заплатить (подробнее - на вебинаре). А если вы успешно закончите три основных и два факультативных модуля - получите право подать заявку на магистерскую программу DEDP. Программа уникальна тем, что делает акцент на проведении рандомизированных оценок эффективности социальных программ и на практических навыках анализа данных. Регистрируйтесь по ссылке 〰️ даже если не сможете быть, чтобы получить запись вебинара на почту. Думаем, это отличная возможность прокачать свои навыки в оценке.
@evidencespace
@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6❤4👨💻3
#wylse
Сейчас должно быть интересно исследователям вопросов неравенства. Oxford Open Economics опубликовал один из обзоров IFs Deaton на тему взаимосвязи неравенства и здоровья населения. Основной вопрос, на который пытается ответить обзор: «Какова причинно-следственная связь между здоровьем и неравенством?». Вот некоторые инсайты обзора:
I. Приводит ли плохое здоровье к экономическому неравенству? (умеренная связь)
1. Ухудшение здоровья объясняет до 15% снижения занятости населения в возрасте от 50 до 70 лет [1]
2. Шоки связанные с ухудшением здоровья детей в перинатальный и / или в ранние периоды после рождения (инфекционные заболевания, вирусы, материнский стресс, отсутствие доступа к первичной медико-санитарной помощи) имеют долгосрочные негативные последствия в части снижения доходов [2] [3] [4]
3. Начало депрессии, биполярного расстройства и шизофрении связано с сокращением доходов на 34%, 38% и 74% [5]
II. Приводит ли экономическое неравенство к ущербу здоровья? (слабая связь)
1. Экономическое неравенство имеет опосредованное влияние на ущерб здоровью, прежде всего, через депривацию и ограничение доступности к качественной медицинской помощи [6] [7] [8]
2. Один из механизмов снижения дифференциации в части доступа различных слоев населения к медицинской помощи - ОМС (косвенно эту гипотезу авторы обсуждают здесь - [9])
III. Приводит ли экономическое неравенство к росту «смертности от отчаяния»? (слабая связь)
1. Эксплицитной связи не наблюдается, но наблюдается влияние на смертность от отчаяния (суицид, смертность от наркотических веществ и пр.) среди мужчин в результате потери работы [10]
Также обзор рассматривает оценки известных программ Food Stamp Program, Medicare и перечень законов, которые снизили смертность в США от опиоидов.
@evidencespace
Сейчас должно быть интересно исследователям вопросов неравенства. Oxford Open Economics опубликовал один из обзоров IFs Deaton на тему взаимосвязи неравенства и здоровья населения. Основной вопрос, на который пытается ответить обзор: «Какова причинно-следственная связь между здоровьем и неравенством?». Вот некоторые инсайты обзора:
I. Приводит ли плохое здоровье к экономическому неравенству? (умеренная связь)
1. Ухудшение здоровья объясняет до 15% снижения занятости населения в возрасте от 50 до 70 лет [1]
2. Шоки связанные с ухудшением здоровья детей в перинатальный и / или в ранние периоды после рождения (инфекционные заболевания, вирусы, материнский стресс, отсутствие доступа к первичной медико-санитарной помощи) имеют долгосрочные негативные последствия в части снижения доходов [2] [3] [4]
3. Начало депрессии, биполярного расстройства и шизофрении связано с сокращением доходов на 34%, 38% и 74% [5]
II. Приводит ли экономическое неравенство к ущербу здоровья? (слабая связь)
1. Экономическое неравенство имеет опосредованное влияние на ущерб здоровью, прежде всего, через депривацию и ограничение доступности к качественной медицинской помощи [6] [7] [8]
2. Один из механизмов снижения дифференциации в части доступа различных слоев населения к медицинской помощи - ОМС (косвенно эту гипотезу авторы обсуждают здесь - [9])
III. Приводит ли экономическое неравенство к росту «смертности от отчаяния»? (слабая связь)
1. Эксплицитной связи не наблюдается, но наблюдается влияние на смертность от отчаяния (суицид, смертность от наркотических веществ и пр.) среди мужчин в результате потери работы [10]
Также обзор рассматривает оценки известных программ Food Stamp Program, Medicare и перечень законов, которые снизили смертность в США от опиоидов.
@evidencespace
OUP Academic
Health and inequality
Abstract. Poorer people tend to have worse health and shorter lives than richer ones, which raises the question of whether the relationship is causal. Does
👍7👨💻4🔥3❤1
#wylse
В продолжение темы выше. NBER публикует работу профессорски экономики Калифорнийского университета в Лос-Анджелесе Адрианы Льерас-Мани, в которой коллеги продолжаю исследовать доказательства (на массиве данных США) того, как бедность / уровень доходов населения влияют на общие показатели здоровья (поскольку доступ к статьям NBER иногда лимитирован - прикрепляем статью к посту). Исследователям работа может быть интересна, так как в ней подробно обсуждаются подходы к моделям оценки влияния дохода на здоровье, в частности: разбирается гипотеза того, что доход сам по себе является функцией здоровья (обратная причинно-следственная связь); рассматриваются много конфаундеров (см. подробнее в работе), которые дополнительно влияют на переменные дохода и здоровья. Фактически статья открывает большой спектр исследовательских вопросов, которые можно брать в работу, особенно актуальными в этом смысле являются исследования по сравнению стратегий гос. воздействия на здоровье населения.
Некоторые инсайты:
1. Здоровье улучшается с увеличением дохода, причем в большей степени среди бедных.
2. Бедность не обрекает людей на плохое здоровье: иными словами деньги или их отсутствие напрямую не влияют на здоровье.
3. Трансферты, субсидии и иные аналогичные программы прямого воздействия на доходы населения значительно влияют на материнское здоровье и здоровье детей.
4. Ранние образовательные программы обладают потенциалом для улучшения здоровья бедных слоев населения и снижения неравенства.
Кроме самого исследования интересны свежие референсы на другие смежные работы, которые освещают в т.ч. результаты различных РКИ по теме госполитики в области здравоохранения и роста уровня дохода.
@evidencespace
В продолжение темы выше. NBER публикует работу профессорски экономики Калифорнийского университета в Лос-Анджелесе Адрианы Льерас-Мани, в которой коллеги продолжаю исследовать доказательства (на массиве данных США) того, как бедность / уровень доходов населения влияют на общие показатели здоровья (поскольку доступ к статьям NBER иногда лимитирован - прикрепляем статью к посту). Исследователям работа может быть интересна, так как в ней подробно обсуждаются подходы к моделям оценки влияния дохода на здоровье, в частности: разбирается гипотеза того, что доход сам по себе является функцией здоровья (обратная причинно-следственная связь); рассматриваются много конфаундеров (см. подробнее в работе), которые дополнительно влияют на переменные дохода и здоровья. Фактически статья открывает большой спектр исследовательских вопросов, которые можно брать в работу, особенно актуальными в этом смысле являются исследования по сравнению стратегий гос. воздействия на здоровье населения.
Некоторые инсайты:
1. Здоровье улучшается с увеличением дохода, причем в большей степени среди бедных.
2. Бедность не обрекает людей на плохое здоровье: иными словами деньги или их отсутствие напрямую не влияют на здоровье.
3. Трансферты, субсидии и иные аналогичные программы прямого воздействия на доходы населения значительно влияют на материнское здоровье и здоровье детей.
4. Ранние образовательные программы обладают потенциалом для улучшения здоровья бедных слоев населения и снижения неравенства.
Кроме самого исследования интересны свежие референсы на другие смежные работы, которые освещают в т.ч. результаты различных РКИ по теме госполитики в области здравоохранения и роста уровня дохода.
@evidencespace
🔥8👨💻3❤2👍1
Forwarded from Наука и данные
Statistical rethinking
Книга Statistical rethinking пережила второе издание, готовится третье и дала повод для основы известного курса по анализу данных, в котором используется байесовский анализ данных. Также, книга породила ряд различных "переосмыслений", например:
▪️ Statistical rethinking with brms, ggplot2, and the tidyverse: Second edition (A Solomon Kurz)
▪️ Statistical Rethinking 2 with Stan and R (Vincent Arel-Bundock)
▪️ Statistical Rethinking 2 with Stan and the tidyverse (Vincent Arel-Bundock)
▪️ Statistical Rethinking: Solutions (2nd Edition)
В настоящий момент A. Solomon Kurz работает над еще одной книгой Statistical rethinking 2 with rstan and the tidyverse, код в этой книге в большей мере сосредоточен на воспроизведении моделей и первичном анализе данных с помощью связки rstan + tidyverse, а James H Wade сделал набросок Statistical Rethinking with Tidymodels.
Книга Statistical rethinking пережила второе издание, готовится третье и дала повод для основы известного курса по анализу данных, в котором используется байесовский анализ данных. Также, книга породила ряд различных "переосмыслений", например:
▪️ Statistical rethinking with brms, ggplot2, and the tidyverse: Second edition (A Solomon Kurz)
▪️ Statistical Rethinking 2 with Stan and R (Vincent Arel-Bundock)
▪️ Statistical Rethinking 2 with Stan and the tidyverse (Vincent Arel-Bundock)
▪️ Statistical Rethinking: Solutions (2nd Edition)
В настоящий момент A. Solomon Kurz работает над еще одной книгой Statistical rethinking 2 with rstan and the tidyverse, код в этой книге в большей мере сосредоточен на воспроизведении моделей и первичном анализе данных с помощью связки rstan + tidyverse, а James H Wade сделал набросок Statistical Rethinking with Tidymodels.
❤6👍5🔥1👨💻1
Имплементация разности разностей с многовременными периодами (Difference-in-Differences with Multiple Time Periods - csdid), - вариация DiD, разработанная Каллауэй и Сант-Анной, - подробно описанная в части инструментов Stata и рассказанная на их же воркшопе, о котором мы писали в древние времена, теперь доступна и в пакетах python 🐍.
Классический DiD - одна из самых популярных исследовательских конструкций, используемых для оценки причинно-следственных эффектов политических вмешательств. На отечественных данных DiD отлично разобран в работе Центра перспективных управленческих решений: От избрания к назначению. Оценка эффекта смены модели управления муниципалитетами в России. А вот csdid отличается от последнего тем, что оценивает ни один эффект на одном промежутке времени, а их совокупность (эффекты для группы, подвергшейся воздействию, в заданные моменты времени). На то, как работают оценки csdid можно посмотреть в таких работах, как:
1. Оценка влияния минимальной заработной платы на занятость подростков (собственно работа Каллауэй и Сант-Анны)
2. Влияние повышения минимальной заработной платы на курение: квазиэкспериментальное исследование в Южной Корее
3. Влияние обязательного оплачиваемого отпуска по болезни на занятость женщин и экономическую безопасность
4. Оценка влияния субсидий на уход за детьми на рождаемость
Just DiD it 🙂🙃
@evidencespace
Классический DiD - одна из самых популярных исследовательских конструкций, используемых для оценки причинно-следственных эффектов политических вмешательств. На отечественных данных DiD отлично разобран в работе Центра перспективных управленческих решений: От избрания к назначению. Оценка эффекта смены модели управления муниципалитетами в России. А вот csdid отличается от последнего тем, что оценивает ни один эффект на одном промежутке времени, а их совокупность (эффекты для группы, подвергшейся воздействию, в заданные моменты времени). На то, как работают оценки csdid можно посмотреть в таких работах, как:
1. Оценка влияния минимальной заработной платы на занятость подростков (собственно работа Каллауэй и Сант-Анны)
2. Влияние повышения минимальной заработной платы на курение: квазиэкспериментальное исследование в Южной Корее
3. Влияние обязательного оплачиваемого отпуска по болезни на занятость женщин и экономическую безопасность
4. Оценка влияния субсидий на уход за детьми на рождаемость
Just DiD it 🙂🙃
@evidencespace
❤7👍4👨💻1
Open AI анонсировала старт грантового конкурса по линии фондов AI for Economic Opportunity Fund, GitLab Foundation и Ballmer Group. Основной целью конкурса является развитие и продвижение больших языковых моделей (LLM - large language models) для создания экономических возможностей и стимулирования роста доходов. На первом этапе 14 проектов получат финансирование минимум от $3,5 млн, на втором - фонды предоставят 1-летние или 2-летние гранты от $500 тыс. до $1,5 млн для масштабирования 6 лучших проектов первого этапа. Прием заявок до 16 октября 2024 года.
@evidencespace
@evidencespace
GitLab Foundation
AI for Economic Opportunity — GitLab Foundation
The GitLab Foundation believes that innovative, ethical applications of AI, machine learning, and advanced data science have the promise to unlock significant opportunities to help people afford a better life. To encourage and enable this future, we are launching…
👍3🔥3
Китайская ByteDance (одна из совладельцев TikTok) зарелизила библиотеку CausalMatch python, позволяющую использовать такие методы балансировки и корректировки исходных данных (мэтчинга), как Coarsened Exact Matching (CEM) и Propensity Score Matching (PSM), и, судя по всему, планирует развивать репозиторий, как «исследовательский проект, направленный на интеграцию передовых методов машинного обучения и эконометрики для автоматизации процесса принятия решений». Имплементацию библиотеки CausalMatch можно посмотреть в разделе репозитория Usage Examples.
Методы балансировки или псевдорандомизации часто используются в ходе применения квазиэкспериментальных механик, с помощью которых мы пытаемся восстановить состояние контрольной группы до вмешательства (контрфактическое состояние), и позволяют нам, собственно, определить / выявить псевдо-контрольную группу в нашей выборке. Например, в работе Оценка политики слияний вузов в российской системе высшего образования PSM используется для того, чтобы выявить ВУЗы, которые не были подвергнуты слиянию, но по своим производственным характеристикам очень похожи на те ВУЗы, которые такому слиянию подвергнуты были. В дальнейшем, используя разрывную регрессию (о ней мы писали здесь) и сравнивая экспериментальную и псевдо-контрольную группы, мы можем наблюдать и оценивать наличие или отсутствие эффектов от проведения политики слияния ВУЗов. Вот некоторые выводы исследования #wylse:
1. Объединенные университеты демонстрируют больший прирост эффективности в течение рассматриваемого периода
2. Обнаруженный эффект может быть интерпретирован именно как влияние политики слияний на эффективность вузов
3. Однако этот эффект обнаруживается только около точки разрыва (это значит, что наиболее выражен он среди ВУЗов близких друг к другу по производственным характеристикам)
4. Ограничение: эффект работает в кратко- и среднесрочном периоде; является ли эффект долгосрочным?
@evidencespace
Методы балансировки или псевдорандомизации часто используются в ходе применения квазиэкспериментальных механик, с помощью которых мы пытаемся восстановить состояние контрольной группы до вмешательства (контрфактическое состояние), и позволяют нам, собственно, определить / выявить псевдо-контрольную группу в нашей выборке. Например, в работе Оценка политики слияний вузов в российской системе высшего образования PSM используется для того, чтобы выявить ВУЗы, которые не были подвергнуты слиянию, но по своим производственным характеристикам очень похожи на те ВУЗы, которые такому слиянию подвергнуты были. В дальнейшем, используя разрывную регрессию (о ней мы писали здесь) и сравнивая экспериментальную и псевдо-контрольную группы, мы можем наблюдать и оценивать наличие или отсутствие эффектов от проведения политики слияния ВУЗов. Вот некоторые выводы исследования #wylse:
1. Объединенные университеты демонстрируют больший прирост эффективности в течение рассматриваемого периода
2. Обнаруженный эффект может быть интерпретирован именно как влияние политики слияний на эффективность вузов
3. Однако этот эффект обнаруживается только около точки разрыва (это значит, что наиболее выражен он среди ВУЗов близких друг к другу по производственным характеристикам)
4. Ограничение: эффект работает в кратко- и среднесрочном периоде; является ли эффект долгосрочным?
@evidencespace
👍11❤6👨💻2