доказательный ⎵ пробел – Telegram
доказательный ⎵ пробел
1.26K subscribers
181 photos
1 video
10 files
285 links
Про causal inference, данные для исследований и принятие решений на основе данных.

Чат: @evidence_chat
Download Telegram
Привет! Больше года назад мы запустили собственный каталог данных. За это время вышло 35 датасетов — их скачали более 25 тысяч раз. Сейчас мы думаем над планами по развитию каталога.

Пожалуйста, пройдите небольшой опрос. Он займет у вас более 5 минут. По его итогам мы выберем, какие наборы данных добавлять в каталог в этом году.
👍7🔥5👨‍💻1
Уровень бедности в одной и той же стране может различаться более чем на 30 процентных пунктов. ВБ обновил базу данных по субнациональной бедности и неравенству (SPID), теперь набор данных включает 2045 регионов из 133 стран, в том числе и России.

@evidencespace
🔥10👍5👨‍💻2
📚 Свежий курс, посвященный методам причинно-следственного анализа (causal inference) в социальных науках от Факультета политических наук Калифорнийского университета. На лекциях поприсутствовать не удастся, но презентации и практикумы доступны.

Примеры прикладных кейсов

🔘 Эффект запрета курения в Калифорнии (Abadie et al., 2010), последствия Brexit (Born et al., 2019).
🔘 Влияние минимальной зарплаты на занятость (Card & Krueger, 1993), эффекты локдауна в период COVID-19 (Friedson et al., 2020)
🔘 Влияние образования на доходы (Acemoglu et al., 2001), роль СМИ в авторитарных режимах (Kern & Hainmueller, 2009)

@evidencespace
👨‍💻6🔥5
В феврале этого года ОЭСР обновила свои рекомендации по оценке программ и политик для стран участниц в части использования гайда, принятого Советом по оценке госполитики в 2022 году.

В приложении к рекомендациям - репозиторий всех документов, принятых странами ОЭСР по оценке - фактически существующий на сегодня ландшафт институтов в этой области. Рекомендации в принципе интересны с позиции институционализации и внедрения практик оценки на уровне государств. Так, например, появляются весьма достойные кейсы оценки в органах аудита Испании: оценка влияния мер по повышению устойчивости пенсионной системы; Швеции: оценка результативности международной помощи; и другие.

@evidencespace
🔥8👍2
Forwarded from Профессорский кот (Yulia Vymyatnina)
Экономисты все чаще используют в исследованиях спутниковые данные – создают прокси экономической активности, изучают распределение дохода, эффективность программ государственной поддержки в беднейших странах, воссоздают исторические ряды данных, которые не получить другими методами. Ниже – небольшая подборка ресурсов с информацией со спутников по ссылкам из статей (сюда же отношу и систему идентификации судов). На полноту не претендую, но возможно, кому-то будет полезно. Дополнения приветствуются!

World Meteorological Organization’s OSCAR database (список спутников, доступных данных и областей применения)

Landsat (городская застройка, пляжи, леса, залежи полезных ископаемых)

MODIS (загрязнение воздуха, отслеживание передвижения рыбы)

Ночная светимость (оценка дохода, развития, использование электричества)
Агрегирование данных по ночной светимости по регионам (ссылка 1, ссылка 2)

SRTM (относительная высота, доступность территорий)

EROS (данные о типе покрытия земной поверхности)

Open Street Map (вспомогательный источник информации на основе данных пользователей, дополняет спутниковые снимки)

Google Earth Engine (каталог спутниковых снимков и геопространственных данных)

Copernicus Open Access Hub (инициатива ЕС по предоставлению данных – со спутников и не только)

PortWatch (отслеживание природных катастроф и симуляции последствий для мировой торговли; включают данные AIS – Automatic Identification System)

#в_помощь_исследователю #подборка_данные
👍10🔥53
💬 Как делать причинные выводы, если ваши данные — это текст?

Жалобы, интервью, посты, открытые ответы в анкетах — всё это тексты, которые всё чаще становятся объектом анализа в социальных науках (Gentzkow et al., 2019)

📝 Тексты могут играть разные роли в моделях, оценивающих причинно-следственные связи (Feder et al., 2022):
🟤Воздействие (treatment): как формулировка влияет на поведение?
🟤Исход (outcome): как воздействие повлияло на текст? (результат интервенции — это тон, содержание или тема высказывания)
🟤Общая причина (confounder): текст влияет и на воздействие, и на исход

Недавно мы писали о подходе к оценке эффектов воздействия на качественных данных, а как оценить эффект воздействия, если переменная — это текст, а не число?

📍Извлечение переменных из текста и смещение выводов

Авторы работы (Egami et al., 2022) считают, что ключевая проблема идентификации, которая возникает, когда текст нужно агрегировать в интерпретируемую переменную (например, "наличие темы", "эмоциональный тон") — это фундаментальная проблема причинного вывода при наличии скрытых переменных (Fundamental Problem of Causal Inference with Latent Variables)

Если вы извлекли интерпретируемую переменную из текста на тех же данных, где оцениваете её эффект, то:
🟤возникает переобучение
🟤результат зависит от конкретной рандомизации
🟤нарушается условие условной независимости (ignorability)

Чтобы получить валидные оценки, авторы предлагают разделение выборки (sample splitting):
🟤На обучающей выборке (train) извлекать некоторую функцию кодирования текста g (например, topic model)
🟤На тестовой выборке (test) — применить g, оценить эффект (например, разность средних, регрессию)

📍Как реализовать оценку на практике?

В свежей работе (Modarressi et al., 2025) авторы реализуют идеи (Egami et al., 2022) в полноценном алгоритме, когда исход представлен в форме текста

Алгоритм оценки включает три шага:
🟤Тест на наличие эффекта (reverse prediction): можно ли по тексту определить, к тестовой группе или контрольной он относится?
🟤Выделение причинных тем (causal themes): LLM предлагает интерпретируемые шкалы различий между группами (например, «упоминание причинной идентификации»). Темы валидируются экспертами (человеческая разметка) на независимой подвыборке
🟤Оценка полноты (completeness): насколько хорошо эти темы объясняют разницу между группами (аналог коэффициента детерминации)

📍А что, так уже делают? А что? А где?
В недавней статье в Nature исследователи используют причинную модель на текстовых данных и показывают, что негативно окрашенные слова в заголовке новости на 2,3% увеличивали число кликов по ней (Robertson et al., 2023)

А какие посты чаще читаете вы? С положительными словами в заголовке или отрицательными?

#канал_обозревает
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥3🤩2
🔧 До сих пор мы практически не писали про одну из самых красивых и творческих областей причинного анализа — инструментальные переменные

🔧 Инструментальные переменные — очень изящный способ поймать эффект там, где провести настоящий эксперимент невозможно. При этом поиск инструментов для идентификации искомого эффекта часто требует сочетания большого везения, мастерства и находчивости исследователя

🖥 Наши коллеги из HSE R Meet Up, на площадке которых в ноябре мы рассказывали про эксперименты, на следующей неделе проводят митап, посвящённый инструментальным переменным (29 апреля, онлайн и очно в Москве)
Особенно мы рекомендуем посетить встречу тем, кто только начинает разбираться в инструментальных переменных

А для более опытных исследователей мы подготовили продвинутый ридинг-лист из свежих публикаций Кирилла Борусяка (UC Berkeley), Питера Халла (Brown University) и Ксавье Жаравеля (London School of Economics):
🟤Quasi-Experimental Shift-Share Research Designs (Review of Economic Studies, 2022) — авторы развивают эконометрический фреймворк для shift-share инструментальных переменных, где идентификация строится на квазислучайном распределении шоков. Они предлагают анализ на уровне шоков вместо стандартного анализа на уровне наблюдений для оценки причинных эффектов​
🟤A Practical Guide to Shift-Share Instruments (Journal of Economic Perspectives, 2025) — руководство для исследователей по применению shift-share инструментов: когда они работают, как их правильно строить и тестировать. Особое внимание уделено различию между идентификацией через шоки и через доли
🟤Design-Based Identification with Formula Instruments: A Review (Econometrics Journal, 2025) — статья обзорно описывает методы идентификации при использовании формульных инструментов, комбинирующих экзогенные шоки и фиксированные характеристики. Авторы показывают, как избежать смещения через контроль ожидаемых значений инструментов и рецентрирование
🟤Optimal Formula Instruments (препринт, апрель 2025) — авторы предлагают метод построения оптимальных инструментов, учитывающий гетерогенное воздействие шоков и устраняющий смещение через рецентрирование

#канал_зовёт
#канал_обозревает
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉84🔥2👍1
Forwarded from Эффект Матфея (katerina)
Andrew Gelman* и Megan Higgs в новой статье Interrogating the “cargo cult science” metaphor в Theory & Society (2025) предлагают пересмотреть, как мы говорим о «плохой науке».

Метафора "cargo cult science"давно популярна в академии – мол, учёные строят «взлётные полосы» из p-value и ритуальных гипотез, но самолеты (настоящее знание) не прилетают. Физик Ричард Фейнман ввел термин в 1974 году, сравнив некоторых исследователей с жителями тихоокеанских островов, строивших фиктивные аэродромы в надежде, что самолёты снова привезут товары. Метафора карго-культа обращена к критике исследований, которые следуют внешней форме науки, но без ее духа.

Основная проблема метафоры: термин часто переносит фокус с анализа научных практик на критику личности (например, честности учёных). Они предлагают говорить не о "карго-культе", а о ритуальных практиках – более точном термине, не предполагающем технологическую или культурную отсталость. Метафора отвлекает от анализа социальных и институциональных причин, из-за которых возникают «ритуальные» практики в исследовании. Речь идет о системных условиях, где ритуалы (p-value, шаблонные гипотезы, "наукообразность") заменяют рефлексию. Многие так называемые ритуальные практики возникают не из-за некомпетентности, а из-за давления среды и ограниченного доступа к хорошему обучению.
Деревянные наушники и имитация взлётно-посадочных полос не имеют прямой связи (ни в теории, ни на практике) с приземлением самолётов, доставляющих грузы. Тем не менее, они могут выполнять другие функции — например, способствовать установлению социальных связей или служить формой политического высказывания — так же, как и плохие статистические практики не способствуют реальным научным открытиям, но позволяют их приверженцам получать гранты, публиковаться и продвигаться по академической лестнице. Люди следуют этим практикам, не понимая их фундаментальных принципов или предпосылок, либо под влиянием социального давления, либо потому что верят, что «это работает», не имея при этом ясного представления, что именно означает «работает».

Вместо навешивания ярлыков авторы предлагают признание сложностей и постепенные улучшения в практике, начиная с понимания целей исследований и природы их ограничений.

*Andrew Gelman, профессор статистики и политологии в Колумбийском университете. Он широко известен как автор популярного блога Statistical Modeling, Causal Inference, and Social Science. Его работы часто направлены на критику формального, но поверхностного использования статистики в социальных и естественных науках.
5🔥3
Мастерская ТекстАн открыла набор на летнюю школу 2025, посвященную анализу текстовых даных.

Прием заявок до 25 мая по ссылке: https://nabor.letnyayashkola.org
🔥5
Привет!

Мы - мастерская анализа текстовых данных, также известная как ТекстАн, и мы рады сообщить, что в 2025 году мы проводимся с 2 по 17 июля в рамках Летней школы. Вне зависимости от того, были ли вы на ЛШ уже или нет, у вас могут быть вопросы по поводу того, что из себя представляет именно наша мастерская, поэтому вот ответы на самые, возможно, частотные вопросы.

Кто мы и откуда?
Люди, делающие эту мастерскую, в основном либо из НИУ ВШЭ в Москве, либо из Европейского университета в Питере. Мы уже проводили такую мастерскую и ранее, и в этом году программа будет схожей, но, конечно же, с некоторыми изменениями относительно прошлых лет. Сама Летняя школа существует уже намного больше и рассказывать про неё намного сложней, поэтому почитать про неё можно здесь.

Как проходит мастерская?
Главный вопрос даже не "как", а "где". В лесу. Онлайн-версии не планируется. Летняя школа проводится на турбазе в Тверской области: жить планируется в палатках, а учиться - в деревянных домиках. Интернет есть, но с перебоями. Душ по расписанию, еда из общего кана, проверки МЧС за счёт заведения.

Когда примерно будет проходить мастерская?
Программа будет проходить с 2 по 17 июля, где второго будет въезд, а семнадцатого - выезд. Программа рассчитана на две недели (дальше в лесу уже становится трудновато жить без чистой одежды)

Какая примерно программа?
В целом тематика будет вращаться вокруг автоматической обработки естественного языка: языковые модели, визуализация, анализ тональности и извлечение именованных сущностей, и, конечно же, старые добрые машобуч с нейросетями (без этого сложно понять, как работают наши инструменты). Более подробную программу мы покажем позже.

Сколько это стоит?
Должны предупредить - это не совсем бесплатно. Летняя школа живёт на добровольные пожертвования участников, и минимальная рекомендуемая сумма пожертвований - 800 рублей в день. Получается около 12000 за все две недели. Как по мне, стоит того.

Как проходит отбор?
Отбор у нас проходит в два этапа: текстовое задание и беседа-созвон. Первое - чтобы определить, насколько вы хорошо подкованы с точки зрения знаний, второе - чтобы определить, насколько вам подходят условия жизни в палатке, работы в команде, учёбы в лесу и ежей в шитояме.

Надо ли что-нибудь подготовить?
На нашу мастерскую мы берём со знанием Питона и интересом к компьютерной лингвистике (возможно, с базовыми знаниями оной). Обычно этого вполне хватает. Гуглить, кстати, во время решения задач мы не запрещаем, но ради бога, не списывайте.

Что по дедлайнам?
Отбор вот-вот начнётся (по планам должен на этой неделе). Отборочного задания пока нет, но заявки можно подавать и без этого. Как только задание будет выложено, мы обязательно дадим вам знать. Четких дат пока нет, но обычно отбор длится до конца мая, потом около недели мы проверяем задания и устанавливаем количество прошедших первый этап, а затем неделю проводим интервью и определяем финальный состав участников к началу-середине июня. К сожалению, поскольку проект волонтёрский, от форс-мажоров и задержек по срокам мы не застрахованы, но если что случится, будем обязательно предупреждать.

А по коммуникации?
У нас есть сайт, но основным способом коммуникации является Телеграм и в частности этот канал. Здесь удобнее всего быстро делиться новостями и получать фидбэк, чего не предусматривает тот же сайт. Обязательно подпишитесь, если хотите быть в курсе дел.

Что нового по сравнению с прошлым годом?
Вы просили, ждали и надеялись - и вот оно! Теперь у нас два трека - базовый и продвинутый. На базовом треке мы ждём тех, кто знает основы Питона, но ещё только готовится окунуться в мир NLP, а на продвинутом - тех, кто уже имеет какие-то знания и там, и там, и хочет продвинуться дальше.

Спасибо, что прочли до конца, и увидимся на ЛШ! (Надеюсь.)
5🔥5
Mathematica опубликовали отчет impact-отчет за 2024 год. Отчет содержит три блока лучших практик: данные, программы, эффекты, - среди которых:

1. Фонд равенства заработной платы для сотрудников сферы дошкольного образования, который с 2022 года увеличил предложение труда воспитателей примерно на 7%. Это увеличение привело к созданию почти 1500 дополнительных мест в детских садах в округе, где реализовывалась инициатива. Дополнительные выплаты и льготы фонда способствовали улучшению набора и удержания воспитателей. Пример альтернативного подхода к решению задач по росту заработных плат работников образования, которые в том числе декларировались в майских указах в России.

2. Оценка влияния профилактических программ, таких как программа домашних визитов социальных служб по укреплению родительских навыков (Nurturing Skills for Families), программы интеграции и развития рабочей силы (Workforce Innovation and Opportunity Act (WIOA) на снижение количества случаев по лишению родительских прав, изъятию детей из семей. Программы показали эффективность за счёт снижения затрат на изъятие детей и организацию опеки ($30 000–$50 000 на одного ребенка в год). Оценка стала возможно в результате инициатив по объединению данных различных федеральных ведомств.

3. Программа поддержки людей с психическими заболеваниями (Transitions to Community Living) и их инклюзии, которая обеспечила жилье и трудоустройство для более чем 5000 человек в штате, где реализуется инициатива, и сократила социальные расходы почти в 3 раза в отношении категории граждан с психическими заболеваниями, повысив их благосостояние и уровень социальной интеграции.

Подробнее о других кейсах - в отчете

________________
* Mathematica — исследовательская организация (Принстон, штат Нью-Джерси), которая специализируется на предоставлении данных, аналитики и решений на основе фактических данных для оптимизации программ и политики в области общественного благополучия. Интересный факт о Mathematica: в 1986 году сотрудники выкупили компанию у её корпоративного владельца, сделав Mathematica полностью принадлежащей сотрудникам (employee-owned company).

@evidencespace
👍93👨‍💻2
📊 Новый взгляд на разрывную регрессию: когда исход — это распределение, а не число

Разрывная регрессия (Regression Discontinuity Design, RDD) — часто использующийся, интуитивный и красивый инструмент в экономике. Это мощный квазиэкспериментальный метод, который помогает оценить эффект воздействия, если оно работает неслучайно, а по правилу, связанному с превышением порога какой-то величиной (cutoff-based treatment assignment) (Thistlethwaite, Campbell, 1960)
Например: округа с бедностью выше 20% получают грант — сравниваем тех, кто чуть выше и чуть ниже этого порога, и делаем выводы


🤔 В чем проблема?
🟤Обычный RDD работает со средними значениями зависимой переменной — средний балл, средний доход, цена
🟤А если для оценки эффекта важно не среднее, а вся картина? Как изменилась структура зарплат в фирме? Или распределение оценок в школе? Или доходы бедных и богатых в штате после выборов?

🆕 Решение — метод R3D
В конце апреля вышел препринт, в котором Давид Ван Дейк (University of Michigan) предложил новую версию RDD, которая работает с распределениями в качестве исхода (Van Dijcke, 2025). Он назвал её R3D — Regression Discontinuity Design with Distribution-Valued Outcomes (разрывная регрессия с разрывом для распределений)

📊 В чем отличие от обычного RDD?
🟤В обычном RDD оценивается локальный средний эффект воздействия (Local Average Treatment Effect, LATE) — это разница в средних значениях результата по обе стороны порога (про LATE мы уже немного писали ранее)
🟤В R3D оценивается локальный средний квантильный эффект воздействия (Local Average Quantile Treatment Effect, LAQTE) — это разница в квантилях распределений по обе стороны порога
🟤LATE показывает, как воздействие влияет на среднее, а LAQTE — где именно в распределении (у бедных, средних или богатых) проявляется эффект

💪 В чём сила R3D?
🟤Учитывает не только "что случилось в среднем", а где именно в распределении произошли изменения
🟤Не требует жёстких и нереалистичных допущений о гладкости распределений
🟤Поддерживает как "четкие" (sharp), так и "размытые" (fuzzy) дизайны воздействия

В статье автор показывает, как с помощью R3D можно измерить влияние победы Демократической партии на распределение доходов в американских штатах. Выясняется: доходы у верхней части населения снижаются, у нижней — нет изменений (см. график в посте). Классическая история: равенство растёт, эффективность — нет (Okun, 1975)

🖥 Открытый пакет R3D
Также Давид Ван Дейк разработал R-пакет R3D
🔗 Исследование: arXiv
🔗 Документация пакета: Github и Pkgdown

📖 Если же вы только начинаете свое знакомство с разрывной регрессией, то очень рекомендуем отличные гайды от Матиаса Каттанео (Princeton University) и соавторов: базовый (Cattaneo, Idrobo, Titiunik, 2020) и расширения (Cattaneo, Idrobo, Titiunik, 2024), а также целую страницу, посвященную RDD, с разными материалами и софтом для ваших исследований


😀 Благодаря работе Флориана Гунзилиуса (University of Michigan), аналогичное расширение метода, позволяющее оценивать не средний эффект воздействия, а изменение в распределении, несколько лет назад появилось и для синтетического контроля — Distributional Synthetic Controls (DiSCo) (Gunsilius, 2023)
🔗 Реализация метода от Давида Ван Дейка в виде пакета DiSCos доступна на R и Stata

#канал_обозревает
#канал_рекомендует
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
10
Forwarded from Tatyana Cherkashina
Какими будут обследования населения к 2030 году в исполнении Росстата?

До января 2027 г. будет «разработан и внесен в Правительство Российской Федерации проект федерального закона, предусматривающий использование административных данных в качестве источника сведений о населении при проведении федерального статистического наблюдения населения».

До декабря 2027 г. будут проведены пилотные федеральные статистические наблюдения населения в цифровом формате.

До декабря 2028 г. произойдёт «переход на цифровой формат проведения федеральных статистических наблюдений населения, включая формирование системы стимулирования участия населения в цифровых опросах». С декабря 2028 г. «Федеральные статистические наблюдения населения в населенных пунктах с обеспечением широкополосного доступа к информационно- телекоммуникационной сети "Интернет" проводятся преимущественно в цифровом формате».

К 2030 году
– более половины вопросов анкет при обследованиях населения будут предзаполнены с использованием административных данных;
– три четверти домашних хозяйств (Т.Ч.: надо полагать, из выборки) будут «проходить обследование с использованием личных кабинетов на цифровых платформах органов публичной власти»;
– главной функцией привлекаемых интервьюеров станет «не собственно сбор первичных статистических данных, а контроль полноты учета населения и качества обследования».

Также нас ожидает
«… публикация официальной статистической информации на уровне населенных пунктов, в том числе опорных;
расширение состава статистических показателей, собираемых и публикуемых на уровне населенных пунктов».

Стратегия развития системы государственной статистики и Росстата до 2030 года

План мероприятий по реализации Стратегии развития системы государственной статистики и Росстата до 2030 года
👍4
📊 Centre for Big Data in Economics запускает серию эконометрических семинаров!

🖥 Новый цикл регулярных встреч — для исследователей, студентов и всех, кто интересуется современными методами анализа данных в экономике:
🟤Приглашённые доклады — ведущие учёные из России и мира делятся своими последними исследованиями в области экономики, финансов, эконометрики и big data
🟤Студенческие доклады — платформа для молодых исследователей, чтобы представить свои проекты и получить ценные комментарии от экспертов

📖 Ближайший семинар посвящен методам причинного вывода!
🟤Когда: 3 июня, 12:00 МСК
🟤Тема: Современные методы оценки причинных эффектов: теоретические основы двойного машинного обучения, его отличие от линейной регрессии и применение к квантильному моделированию
🟤Спикер: Александр Ченцов (МФТИ, Центр больших данных в экономике НИУ ВШЭ)
🟤Язык: русский
🔗 Подключение и регистрация на будущие семинары

Аннотация:
Речь пойдёт о современных подходах к оценке причинных эффектов в наблюдаемых данных: от идентификации параметров до статистического вывода. Обсуждаются различия между классическими методами и новыми техниками с использованием устойчивых оценок в полупараметрических моделях. Особое внимание уделяется методу двойного машинного обучения и его применению в квантильной регрессии

✈️ Следите за событиями Центра больших данных в экономике в их новостном тг-канале @CEBASociety и канале Центра @cebalab

❗️А еще! Продлён дедлайн подачи работ на международную конференцию iCEBDA 2025!
🟤Конференция пройдёт 11–14 сентября в Стамбуле
🟤Новая дата подачи — до 15 июня 2025
🔥Ключевые спикеры: Хидо Имбенс (Stanford GSB), лауреат Нобелевской премии по экономике (2021); Томмазо Проиетти (Università di Roma "Tor Vergata")
🔗 Подробнее и регистрация, тг-чат конференции

#канал_зовёт
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🎉6👍4
Профессор ЦЕУ Габор Бекеш продолжает радовать нас открытыми курсами в области анализа данных (об одном из них мы писали ранее). Совсем недавно в свет вышел Курс «Анализ данных с использованием ИИ» (Doing Data Analysis with AI) , который предназначен для студентов с базовыми знаниями в области анализа данных, эконометрики и количественных методов. Курс учит применять ИИ для повышения продуктивности в анализе данных. Основное внимание уделяется использованию крупных языковых моделей (LLMs), таких как ChatGPT, Claude.ai и других. Есть много практических кейсов: например, здесь Бекеш подробно описывает как генерировать графики распределения доходов в привязке к уровню образования и гендеру, приводя примеры промтов и результатов выдачи ChatGPT и Claude.ai. Если еще не используете ИИ в дата-анализе и исследованиях, курс - хорош для погружения 🧠

@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥114👍2👎1
🧠 Машинное обучение в экономике: препятствия, мифы и светлое будущее

Машинное обучение постепенно входит в эмпирическую практику экономистов — от отбора переменных до оценки индивидуальных эффектов воздействия. В академической экономике это движение встречает заметное сопротивление. По мнению Беатрис Гитнер (University College Dublin), источники этого недоверия кроются в фундаментальных интеллектуальных барьерах:
🟤Ортодоксии — укоренившейся приверженности линейным моделям, ручной спецификации и классическим подходам, даже когда они не подходят к данным
🟤Пуризме — идеале «чистой» идентификации, где любое отклонение от RCT или строго структурных моделей считается снижением научной добродетели
🟤Недопонимании — представлении, что машинное обучение — это исключительно про прогноз и не применимо для каузального анализа

В этом посте, основанном на публикации в блоге Беатрис Гитнер, мы разберём наиболее популярные мифы об ML в экономике, предложим контраргументы и в финале расскажем о свежей важной обзорной работе в сфере ML и causal inference

↔️ Миф 1: ML — это только про прогноз, а не про причинно-следственный анализ
Современный причинный вывод активно использует ML как инструмент оценки вспомогательных (nuisance) функций (условных ожиданий, вероятностей назначения, и т.п.) в рамках строго идентифицированных моделей
🟤Double/Debiased Machine Learning (Chernozhukov et al., 2018): позволяет получить √n-состоятельные оценки с корректной инференцией
🟤Causal forests (Athey, Wager, 2019): оценивают гетерогенные эффекты при слабых предпосылках
🟤Meta-learners (Kunzel et al., 2019): формализуют оценку индивидуальных эффектов воздействия
Эти подходы позволяют совмещать гибкость ML с требованиями строгой причинной идентификации

↔️ Миф 2: ML — это «чёрный ящик»
Многие считают, что ML-модели сложно интерпретировать, а значит они бесполезны для научного исследования. Но интерпретируемость ≠ линейность. Современные инструменты позволяют:
🟤извлекать локальные и глобальные эффекты переменных (например, через SHAP или LIME) (Lundberg, Lee, 2017)
🟤оценивать гетерогенность эффектов (causal forest)
🟤формализовать вклад ковариат в treatment effect (meta-learners, feature importance в policy models)
Интерпретируемость в ML — это вопрос правильно выбранного инструмента и научной задачи

↔️ Миф 3: ML нарушает стандарты статистического вывода
Ранние версии ML действительно не обеспечивали достоверного статистического вывода (inference): стандартные ошибки, доверительные интервалы, p-значения были недоступны. Но в последние годы это изменилось. ML в каузальном анализе сопровождается:
🟤Neyman-ортогональностью (устойчивость к ошибкам оценки вспомогательных параметров) (Chernozhukov et al., 2018; Ahrens et al., 2025)
🟤Sample splitting / cross-fitting (устранение смещения от переобучения)
🟤Bootstrap-инференцией или post-selection methods для доверительных интервалов
Результат — ML-подходы, совместимые с классической инференцией и теорией оценивания

↔️ Миф 4: ML не позволяет делать обобщения и policy-выводы
ML предоставляет именно те инструменты, которых не хватает классической эконометрике, например:
🟤Causal forests и X-learners оценивают индивидуальные эффекты воздействия (CATE) (Athey, Wager, 2019; Kunzel et al., 2019)
🟤Policy learning позволяет вывести, кому и при каких условиях нужно рекомендовать интервенцию (Athey, Imbens, 2019)
То есть ML не мешает, а расширяет возможности вывода для политики

↔️ Что почитать?
Если вы хотите разобраться, как применять ML в причинной эконометрике, начните со свежего июньского обзора (Ahrens et al., 2025), среди авторов которого Виктор Черножуков и Кристиан Хансен

Если же вы хотите не только понять, но и научиться применять эти методы на практике, начните с сайта авторов обзора dmlguide.github.io, проектов Causal ML Book от Виктора Черножукова с соавторами и Dive into Causal Machine Learning от команды, которая перерабатывает учебные материалы ведущих ученых на разные языки программирования, а также учебных материалов Мадины Курмангалиевой

#канал_обозревает
#канал_рекомендует
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍5🔥2👎1
Натолкнулись на интересную статью Andersen et al. (2023) Disaggregated Economic Accounts (Дезагрегированные экономические счета), в которой представлена новая система дезагрегированных экономических счетов, разбивающая национальные счета Дании на двусторонние потоки между группами потребителей и производителями, а также правительством и внешним миром. Используя различные административные данные (например, транзакции Danske Bank), авторы раскрывают «треугольную» схему торговли («triangular trade» pattern): сельские потребители направляют расходы в городские регионы, городские потребители больше тратят за границей (12% против 8% у сельских), а экспортные доходы преимущественно поступают в сельские регионы из-за расположения в них экспортных производителей.

С помощью калиброванной модели общего равновесия авторы показывают, как структура этих счетов влияет на распространение экономических шоков. Некоторые выводы работы:

- трансферы, дольше циркулирующие в национальной экономике, обеспечивают более высокий мультипликатор благосостояния, особенно в сельских районах;
- снижение экспортных тарифов напрямую выгодно сельским регионам, но общие выгоды, включая косвенные эффекты, больше ощущаются городскими потребителями;
- в целом инструменты фискальной политики результативнее в сельских регионах, так как расходы сельских потребителей дольше циркулируют внутри страны, прежде чем «утекают» за границу.

Авторы утверждают, что такой подход к оценке экономических связей позволяет лучше понимать эффекты от внешних шоков, идентифицировать наиболее уязвимых экономических агентов, а также более точно таргетировать фискальную политику. Кроме этого, работа - хороший бенчмарк того, как можно и нужно транслировать академические результаты в массы: disaggregatedaccounts.com и bfi.uchicago.edu.

@evidencespace
6🔥5👍4
NBER опубликовало сегодня исследование Река Юхаса и коллектива авторов «Measuring Industrial Policy: A Text-Based Approach». О чем оно и почему интересно с точки зрения impact-оценки государственных политик?

Коллеги использовали базу данных Global Trade Alert (GTA) — самый большой в мире сборник описаний торговых и экономических мер, принятых государствами (47283 записи за 2010–2022 годы после очистки данных). В GTA собраны понятные описания на английском языке, которые составлены экспертами. Они включают только проверенные и значимые меры, влияющие на международную торговлю. Река Юхас и команда поставили перед собой задачу, используя базу GTA, разработать метод систематической идентификации и измерения мер промышленной политики среди стран Мира, а именно: классифицировать государственные меры, сформировать показатели активности промышленной политики, предельно точно идентифицировать целевой характер мер (не просто соотнести меру к тарифной политике или видам субсидий, а определить ее таргет).

Решали задачу методами ML в три этапа: ручная разметка для обучения (было размечено 2932 описания (примерно 6% от всей базы), тренировка модели (непосредственно само обучение), имплементация модели на всей выборке и кластеризация данных. В зависимости от года было выделено из GTA 44–63% мер, относящихся к промышленной политике. Точность модели на тестовой выборке достаточно высокая (F1-score 94.1%). Примеры классифицированных политик:

• Бразилия увеличила импортные тарифы на IT и телекоммуникационные товары, чтобы стимулировать инновации и укрепить национальный IT-сектор.
• Китай предоставил государственные займы для развития производства батарей для электромобилей.
• США приняли CHIPS and Science Act 2022 для развития полупроводниковой отрасли и исследований.

По стэку и методам. Использовалась модель BERT (Bidirectional Encoder Representations from Transformers), которая была дообучена для задачи трехклассовой классификации (определяли таргет (промышленная политика), не таргет и условную корзину, где модель не смогла классифицировать текстовые данные). Есть отдельный репо, но без кода - только данные. Но из текста статьи следует, что коллеги использовали инструменты на основе python, в частности Hugging Face (для доступа к предобученной модели BERT), Optuna (для оптимизации гиперпараметров модели), Prodigy (для разметки и аннотации данных).

Эффект мер на текущем этапе не оценивался, но вот некоторые выводы исследования:

1. С 2010-х годов наблюдается устойчивое увеличение разработки и применения мер промышленной политики, стимулирующих различные отрасли.
2. Промышленная политика чаще использует субсидии и меры, ориентированные на экспорт, вместо тарифных и фискальных мер.
3. Имплементация промышленной политики характерна для стран с высоким уровнем дохода, но не для развивающихся стран, что противоречит традиционным представлениям о промышленной политике как инструменте догоняющего развития.
4. Промышленная политика, особенно в странах с высоким доходом, чаще нацелена на сектора, где страна уже имеет конкурентные преимущества в рамках экспорта (отрасли как стартапы остаются за бортом).

Подход интересен тем, что он на практике показывает, как может выглядеть консолидация различных инициатив под вектором того или иного механизма воздействия. Для задач оценки государственной политики в России аналогичные методы могут быть использованы в части выявления на пантеоне текстовых данных документов стратегического планирования региональных мер, резонирующих с федеральной повесткой. При оценках различных политик, например, политики в области повышения благосостояния населения меры на федеральном уровне консолидируются в единые механизмы проще, чем меры регионального характера, которые в силу специфики отечественного госпланирования часто размыты и формально могут быть не связаны с федеральными, однако фактически могут влиять на достижение национальных целей. Методы ML, описанные в статье, могут решать такие задачи консолидации.

@evidencespace
8🔥7👍4
Libraries Scholarly API Cookbook - подборка туториалов Университета Алабамы по работе с API различных веб-сервисов, полезных для исследователей: arXiv, WB, Scopus, NASA, Wiley, OSM и другие.

@evidencespace
👍64👨‍💻2