доказательный ⎵ пробел – Telegram
доказательный ⎵ пробел
1.26K subscribers
181 photos
1 video
10 files
284 links
Про causal inference, данные для исследований и принятие решений на основе данных.

Чат: @evidence_chat
Download Telegram
Forwarded from ECONS
«Почему богатые так богаты?» – задались вопросом исследователи и изучили, какие факторы лежат в основе формирования богатства, на прозрачных норвежских данных. Выяснилось, что:

📊 У богатейших топ-0,1% две трети прироста богатства к 50-54 годам обеспечиваются более высокой нормой сбережений и более высоким процентом от их инвестирования; почти вся остальная доля обеспечена приростом полученного в наследство капитала.

📊 Но наследство получают не все: четверть представителей топ-0,1% в свои 20-30 лет были даже беднее, чем среднестатистический норвежец, тогда как получившие наследство - богаче в 20 раз. К 50 годам средний представитель топ-0,1% богаче своего среднестатистического соотечественника в 125 раз.

📊 Среди топ-0,1% у «новых денег» (не получавших наследство) в структуре прироста богатства относительно велика доля трудового дохода - 20%, у «старых денег» она около 3%.

📊 У «обычных» семей 90% активов – это жилая недвижимость, и 10% – финансовые активы. У богатейших – ровно наоборот.

📊 «Обычные» семьи порядка 80% финансовых активов инвестируют в безопасные бонды и депозиты и 20% – в рисковые акции и частный бизнес, богатейшие – ровно наоборот.

📊 Даже при инвестициях в один и тот же класс активов богатые получают доходность в 2-4 раза выше, чем среднее домохозяйство.

📊 Относящиеся к топ-0,1% по богатству направляют на сбережения в среднем 70% получаемых доходов, а, например, нижние 50% – около 10%.

🔴 Подробнее читайте в статье на сайте «Эконс»
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍2
В каталоге курсов Швейцарской высшей технической школы Цюриха (ETH Zürich - Eidgenössische Technische Hochschule Zürich) доступен репозиторий курса «Наука о данных для государственной политики: от эконометрики к искусственному интеллекту». В репозитории - стэк лекций и примеры кода. Кратко о курсе авторы пишут так:

Многие политические проблемы связаны с прогнозированием. Например, в рамках бюджетного администрирования может возникнуть запрос на прогноз количества заявок на выплаты пособий в следующем месяце, исходя из условий на рынке труда в этом месяце. Этот курс представляет собой практическое введение в методы «больших данных» для составления таких прогнозов. Методы включают в себя:

- получение больших наборов данных с помощью веб-скрэпинга или API-интерфейсов, включая данные социальных сетей;
- обработка наборов данных для упрощения вычислений;
- машинное обучение для прогнозирования результатов, включая способы выбора и настройки моделей, оценки их производительности с использованием имеющихся данных испытаний;
- интерпретация прогнозов моделей машинного обучения;
- визуализация данных, включая интерактивные веб-приложения.

@evidencespace
🔥95🤩2👨‍💻1
#wylse

Ещё один свежий пример использования DiD (difference-in-differences): «As newspapers close, local corruption thrives». Тед Мэтерли и Брэд Н Гринвуд собрали данные о закрытии 65 крупных ежедневных газет США в период с 2006 по 2019 год и сгруппировали 91 888 дел с обвинениями в коррупции по окружным судам США. Используя DiD и сравнивая районы, в которых произошло массовое закрытие ежедневных печатных изданий, с теми районами, в которых такого массового закрытия не было, исследователи выявили увеличение судебных дел по мотивам коррупции на 7,3%. Эти результаты согласуются с аналогичными результатами похожих исследований в Бразилии, где закрытие местных СМИ «воодушевило» местных чиновников на оппортунистическое поведение в угоду личных выгод. Тед и Брэд делают выводы о значимости профессиональных местных СМИ, которые служат «мягкой силой» в части контроля добросовестного исполнения полномочий на местах.

@evidencespace
👍9👨‍💻4🤔1
Всем продуктивного вечера 🫰

@evidencespace
😁13
Forwarded from Рюмочная ИПП
Паттерны установки камер наблюдения как зеркало представлений о безопасности

Городские камеры обычно воспринимаются как аватары Большого брата — распределенный дисциплинирующий взгляд, стремящийся охватить все возможное пространство. Но даже если допустить, что проекты уличного наблюдения и правда стремятся к паноптикону, то их реализация имеет технические ограничения: камеры не могут появиться везде в одну ночь, они занимают пространство постепенно и неравномерно.

Что если использовать это и посмотреть на камеры из неоинституциональной перспективы — определить паттерны расположения камер и попробовать восстановить логику их установки? Так мы можем получить представления о «проектах безопасности», в русле которых действуют власти.

Наши сотрудники Дмитрий Серебренников и Дмитрий Скугаревский сделали подход к этой задаче и проанализировали системы наблюдения в четырех европейских столицах — Москве, Париже, Брюсселе и Эдинбурге. Дизайн позаимствован из экологических исследований: камеры рассматриваются как вид, занимающий определенные ниши в городском пространстве. Для анализа было применено объяснимое машинное обучение (CatBoost + SHapley Additive ExPlanations или SHAP).

Исследование показывает, что московский «проект безопасности» имеет значимые отличия от парижского и брюссельского (в Эдинбурге камер оказалось недостаточно, чтобы выделить паттерны). Во всех трех городах камеры ожидаемо тяготеют к публичным пространствам: парковкам, магазинам, точкам торговли уличной едой, — но если в Париже и Брюсселе второй большой нишей камер являются транспортные хабы, то в Москве это территории вокруг двух типов символических объектов — детских пространств (детские площадки, сады, школы) и храмов.

Кроме того, отличается расположение камер относительно центра. В Париже и Брюсселе камеры убывают по мере удаления от центра, в Москве же, напротив, они сконцентрированы в центре и на окраинах. Дальнейшее прояснение специфики намеченных «проектов безопасности» требует уже отдельного исследования.

Статья коллег называется A tale of four cities: Exploring security through environmental characteristics of CCTV equipment placement, она вышла в Journal of Computational Social Science и находится в открытом доступе.
🔥11👍32
Питер Халл, профессор экономики Университета Брауна, научный сотрудник NBER пошарил слайды своих свежих лекций, разработанных совместно со своим ассистентом Джонатаном Ротом. Все самые насущные темы: регрессии всех видов, кластеризация и взвешивания, обработка данных, параллельные тренды, бутстрепы, вероятность и другие. Ценность не только в повторении материала, но и в новых кейсах, которыми Халл сопровождает свои лекции. Приумножаем знания, приумножая радость 😌

@evidencespace
🔥117👨‍💻3
💎 Друзья, мы упустили одно очень интересное событие. В августе этого года Бернард Блэк и наш уважаемый Скотт Каннингем организовали мощный (прежде всего, по составу лекторов) воркшоп для PhD студентов по причинному выводу в Юридической школе Притцкеровского университета (Чикаго): Workshop on Research Design for Causal Inference. Целевая аудитория: количественники-эмпирики (включая преподавателей, аспирантов и других исследователей) в области социальных наук, включая право, политологию, экономику, многие области бизнес-школ (финансы, бухгалтерский учет, менеджмент, маркетинг), медицину, социологию, образование, психологию.

Состав тем и лекторов:
🟡Дональд Рубин (Гарвардский университет): Введение в современные методы причинного вывода
🟡Бригам Франдсен (Университет Бригама Янга): Методы мэтчинга и балансировки в обсервационных исследованиях
🟡Ицин Сюй (Стэнфордский университет): Панельные данные и DiD
🟡Гонсало Васкес-Баре (Университет Калифорнии): Дизайн разрывной регрессии
🟡Эрик Френч (Кембридж): Методы инструментальных переменных
🟡Кристиан Хансен (Университет Чикаго): Машинное обучение для прогнозирования и причинного вывода
🟡Эндрю Гудман-Бэкон (Федеральный банк Миннеаполиса): Продвинутый DiD
🟡Питер Халл (писали о нем постом выше): Продвинутые методы инструментальных переменных

Жаль, что на такие воркшопы попасть очень сложно. НО! Комьюнити causal inference не без добрых энтузиастов, которых нам удалось найти вместе с репозиторием материалов воркшопа, и мы с большой радостью делимся этими материалами с зум-сессиями по некоторым дням воркшопа, всеми презентациями, задачами и кодом в stata, R и python: causal-inference-workshop-2024 🤫

@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
14👏7🔥3🤩3
Одним из препятствий на пути использования исследователями данных (помимо их отсутствия кончено) является наличие в данных персональной информации. Последние 15 лет на решение задачи нахождения баланса между максимальной гранулярностью данных и их конфиденциальностью направлены методы дифференциальной приватности (differential privacy).

Подробно о сути методов мы уже писали здесь, разбирая пример зашумления данных Бюро переписи населения США (пост для погружения в тему). Дифференциальная приватность - это компромисс и возможность для исследователей получить доступ к необходимым данным, поэтому чаще всего развитием методов differential privacy занимаются сами исследователи.

Мы искренне считаем, что развитие подходов к обеспечению открытого доступа к данным при сохранении их конфиденциальности позволит повысить ценность накопленных данных как в государственном, так и в частном секторе, используя их для принятия решений и исследований.

Именно поэтому продолжаем серию постов, и сегодня хотим опубликовать референсы на новый учебник Джо Нира (Университет Вермонта) и Чике Абуа: Programming Differential Privacy. Очень кропотливая и детальная работа: на примерах разбираются простые (удаление и зашумление) и более сложные (классификаторы машинного обучения) методы деидентификации данных. Эти материалы могут быть полезны сотрудникам статистических служб, ведомств, перед которыми стоят задачи по повышению открытости данных, а также для исследователей и научных сотрудников, которые часто становятся катализаторами инициатив предоставления данных в открытый доступ для научных сообществ. Если вам тема дифференциальной приватности интересна так же, как и нам, то рекомендуем посетить персональные сайты Джо Нира и Чике Абуа, где вы найдете дополнительный более основательный материал и практикумы по обеспечению конфиденциальности данных. Приятного чтения 📕. Ваш @evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍2
По красоте. Специально для визуалов и тех, кто не безразличен к презентации результатов своих исследовательских проектов. Рекомендуем репозитории двух замечательных датавизеров (даже лучше сказать - датавизионеров): Джозефа Барбиера (git) и Яна Хольца (git). Еще в старые добрые времена сайт Яна data-to-viz выручал, когда мы ломали голову, как лучше в графическом виде представить распределения ВРП регионов, зарплат госслужащих или изобразить доступность первичной медико-санитарной помощи. Его вклад в понятное представление данных бесценен, если еще не знакомы - ниже ссылки на все галереи, которые коллектит Ян:

🔗 R: http://r-graph-gallery.com
🔗 Python: http://python-graph-gallery.com
🔗 D3: http://d3-graph-gallery.com
🔗 React: http://react-graph-gallery.com
🔗 Еще больше графиков с кодом: https://www.dataviz-inspiration.com

На гитах и в галереях Джозефа и Яна вы найдете примеры построения прекрасных графиков и, уверены, сможете адаптировать и развить их решения на своих данных. Используйте, и да при будет с вами сила визуализации 👀

@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍2
Forwarded from Irina Kalabikhina (Irina Kalabikhina)
Опубликована наша статья о расчете эффекта обновленного регионального материнского капитала на рождаемость детей разных порядков на примере ЯНАО. Положительный эффект от материальной меры демографической политики есть. Осенью 2019 года объявлена впечатляющая обновленная программа регионального маткапитала в ЯНАО. И согласно проведенным расчетам, изменение суммарного коэффициента рождаемости (СКР) по всем рождениям составило 0,15. Демографы знают, что это много, это успех в странах с невысокой рождаемостью. Влияния на первые рождения нет. Рост СКР для вторых рождений составил 0,12, для третьих рождений — 0,08 статистического ребенка. Наблюдаемые изменения были связаны прежде всего с рождаемостью городского населения (не КМНС в сельской местности!). Модернизация программы материнского капитала в ЯНАО позволила затормозить на региональном уровне негативную динамику рождаемости, наблюдаемую в целом по стране. Денисова И.А., Калабихина И.Е., Кузнецова П.О. Оценка влияния региональной программы материнского капитала на рождаемость (на примере Ямало-Ненецкого автономного округа) // Государственное управление. Электронный вестник. 2024. No 105. С. 232–243. https://spajournal.ru/index.php/spa/issue/view/48/49
🔥10👍5👏1
🔤 Курс по кодингу на python для госсулжащих от Эйдана Фельдмана, профессора Высшей школы государственной службы Роберта Вагнера (Нью-Йорк). Как пишет Эйдан, курс продолжает начинания его коллег (здесь) и является очень базовым - основы основ python. Отлично подойдет тем, кто только начинает свой путь в дата-анализе или хочет мигрировать с других инструментов на python. Внутри много отсылок на сайд лекции и статьи, задачи на кейсах Нью-Йорка. В целом - хороший пример пропаганды дата-анализа внутри ведомств. Также рекомендуем очень известный курс Артура Террелла Программирование для Экономистов.

@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Introduction to GIS Programming (Python) 🐍

Dr. Qiusheng Wu, создатель нескольких широко используемых пакетов Python с открытым исходным кодом, включая geemap, leafmap и segment-geospatial, уважаемый автор различных открытых материалов, сделал записи курса по обучению применения языка Python в геопространственной области. Подобные курсы мы уже видели, но тут студенты познакомятся практически со всеми инструментами GeoPython, научатся визуализировать векторные и растровые данные, а также изучат 3D-картографирование с MapLibre и получат представление о SAMGeo и HyperCoast, двух специализированных геопространственных библиотеках.

Материалы курса также сопровождаются YouTube-роликами.
2👍1
«Вы работаете в ESG и хотите обогатить вашу работу доказательствами? Запишитесь на бесплатный онлайн-курс Evaluating Social Programs от J-PAL, который начнется 17 сентября, и узнайте, как рандомизированные оценки можно использовать для измерения воздействия» - так J-PAL зазывает на свой открытый курс. Мы заинролились - интересно ) Вы тоже можете - здесь.

@evidencespace
8👍3👏2
Forwarded from Профессорский кот (Yulia Vymyatnina)
Спасибо всем, кто поделился вчера своими ссылками! Я не успела их все посмотреть и систематизировать, поэтому начну с того, что поделюсь известными мне ресурсами, а потом буду дополнять пост (или сделаю серию).

Первый ресурс – коллекция материалов, собранных командой под руководством Томаса Сарджента (Нобелевская премия 2011 – за работу в области макроэкономики). Во вкладке Projects несколько курсов лекций (от вводного по Python до нескольких курсов по Quantitative Economics with Python, библиотека для Python (и библиотека для Julia – еще один язык, которым пользуются экономисты), книги.

Второй ресурс – проект команды Артура Террелла (начал как физик, потом стал экономистом, но при этом написал популярную книжку про ядерный синтез, работал в Банке Англии, поучаствовал в дизайне 50-фунтовой купюры, на которой изображен Тьюринг). Тут акцент на работу в Python с разными типами данных и проведение разных типов анализа, которыми пользуются экономисты.

Третий ресурс – книга Флориана Гайсса по использованию Python (а также R и Julia) для вводного курса по эконометрике (на базе учебника Вулдриджа). Если пролистать страницу до конца, можно найти ссылку на бесплатные копии в pdf. Коды ко всем главам даны. (Возможно, потребуется vpn)

#python_for_economists #в_помощь_исследователю
8👍6🔥2
🔹 Точно будет хорошо.

Аспирантский семинар «Методология социальных исследований»


Курс посвящен практике исследовательской работы в социальных науках. В рамках курса мы поговорим о методах получения эмпирического материала, постановке исследовательского вопроса и выборе подходящего метода, работе с литературой и подготовке исследовательского продукта, будь то презентация на конференции, статья или policy paper. Курс ориентирован на тех, кто хочет заниматься именно эмпирическими исследованиями в политической науке и смежных областях. В рамках курса мы будем говорить о том, как получать и презентовать такие результаты, которые будут публиковаться на самых престижных площадках, но не будем забывать и о том, что иногда нужно защищать диссертации.

Преподаватель курса — Кирилл Титаев
👍8🔥63
Разбирали закрома, вспомнили про эту хорошую книгу ВБ, написанную Шахидур Хандкером (руководителем Команды сельского развития ВБ*). Книга хоть и не новая, но уж больно хорошо в ней описаны кейсы применения количественных методов на практике. Тут вам и старая-добрая PROGRESA, и программа переселения Китая, и аргентинская Trabajar по поддержке безработных. Есть примеры расчетов на Stata. Можно использовать как надежный источник к началу дизайнов ваших оценок и исследований.

* The Rural Development Team - это группа Всемирного банка, которая работает с различными организациями над созданием и поддержкой устойчивых сельских сообществ.

@evidencespace
10👍2
Чуть не упустили. Тут Совет по делам женщин в статистике и науке о данных [1], Португальское статистическое общество (SPE) и Американская статистическая ассоциация (ASA) запустили проект «Международный день женщин в статистике и науке о данных». 8 октября состоится третья открытая бесплатная онлайн-конференция, приуроченная к этому дню. Программа насыщенная. Регистрация здесь.

[1] The Caucus for Women in Statistics and Data Science - международное профессиональное статистическое сообщество, созданное в 1971 году для образования, трудоустройства и продвижения женщин в статистике.

@evidencespace
12🤔2👍1🔥1