доказательный ⎵ пробел – Telegram
доказательный ⎵ пробел
1.25K subscribers
181 photos
1 video
10 files
284 links
Про causal inference, данные для исследований и принятие решений на основе данных.

Чат: @evidence_chat
Download Telegram
Всем продуктивного вечера 🫰

@evidencespace
😁13
Forwarded from Рюмочная ИПП
Паттерны установки камер наблюдения как зеркало представлений о безопасности

Городские камеры обычно воспринимаются как аватары Большого брата — распределенный дисциплинирующий взгляд, стремящийся охватить все возможное пространство. Но даже если допустить, что проекты уличного наблюдения и правда стремятся к паноптикону, то их реализация имеет технические ограничения: камеры не могут появиться везде в одну ночь, они занимают пространство постепенно и неравномерно.

Что если использовать это и посмотреть на камеры из неоинституциональной перспективы — определить паттерны расположения камер и попробовать восстановить логику их установки? Так мы можем получить представления о «проектах безопасности», в русле которых действуют власти.

Наши сотрудники Дмитрий Серебренников и Дмитрий Скугаревский сделали подход к этой задаче и проанализировали системы наблюдения в четырех европейских столицах — Москве, Париже, Брюсселе и Эдинбурге. Дизайн позаимствован из экологических исследований: камеры рассматриваются как вид, занимающий определенные ниши в городском пространстве. Для анализа было применено объяснимое машинное обучение (CatBoost + SHapley Additive ExPlanations или SHAP).

Исследование показывает, что московский «проект безопасности» имеет значимые отличия от парижского и брюссельского (в Эдинбурге камер оказалось недостаточно, чтобы выделить паттерны). Во всех трех городах камеры ожидаемо тяготеют к публичным пространствам: парковкам, магазинам, точкам торговли уличной едой, — но если в Париже и Брюсселе второй большой нишей камер являются транспортные хабы, то в Москве это территории вокруг двух типов символических объектов — детских пространств (детские площадки, сады, школы) и храмов.

Кроме того, отличается расположение камер относительно центра. В Париже и Брюсселе камеры убывают по мере удаления от центра, в Москве же, напротив, они сконцентрированы в центре и на окраинах. Дальнейшее прояснение специфики намеченных «проектов безопасности» требует уже отдельного исследования.

Статья коллег называется A tale of four cities: Exploring security through environmental characteristics of CCTV equipment placement, она вышла в Journal of Computational Social Science и находится в открытом доступе.
🔥11👍32
Питер Халл, профессор экономики Университета Брауна, научный сотрудник NBER пошарил слайды своих свежих лекций, разработанных совместно со своим ассистентом Джонатаном Ротом. Все самые насущные темы: регрессии всех видов, кластеризация и взвешивания, обработка данных, параллельные тренды, бутстрепы, вероятность и другие. Ценность не только в повторении материала, но и в новых кейсах, которыми Халл сопровождает свои лекции. Приумножаем знания, приумножая радость 😌

@evidencespace
🔥117👨‍💻3
💎 Друзья, мы упустили одно очень интересное событие. В августе этого года Бернард Блэк и наш уважаемый Скотт Каннингем организовали мощный (прежде всего, по составу лекторов) воркшоп для PhD студентов по причинному выводу в Юридической школе Притцкеровского университета (Чикаго): Workshop on Research Design for Causal Inference. Целевая аудитория: количественники-эмпирики (включая преподавателей, аспирантов и других исследователей) в области социальных наук, включая право, политологию, экономику, многие области бизнес-школ (финансы, бухгалтерский учет, менеджмент, маркетинг), медицину, социологию, образование, психологию.

Состав тем и лекторов:
🟡Дональд Рубин (Гарвардский университет): Введение в современные методы причинного вывода
🟡Бригам Франдсен (Университет Бригама Янга): Методы мэтчинга и балансировки в обсервационных исследованиях
🟡Ицин Сюй (Стэнфордский университет): Панельные данные и DiD
🟡Гонсало Васкес-Баре (Университет Калифорнии): Дизайн разрывной регрессии
🟡Эрик Френч (Кембридж): Методы инструментальных переменных
🟡Кристиан Хансен (Университет Чикаго): Машинное обучение для прогнозирования и причинного вывода
🟡Эндрю Гудман-Бэкон (Федеральный банк Миннеаполиса): Продвинутый DiD
🟡Питер Халл (писали о нем постом выше): Продвинутые методы инструментальных переменных

Жаль, что на такие воркшопы попасть очень сложно. НО! Комьюнити causal inference не без добрых энтузиастов, которых нам удалось найти вместе с репозиторием материалов воркшопа, и мы с большой радостью делимся этими материалами с зум-сессиями по некоторым дням воркшопа, всеми презентациями, задачами и кодом в stata, R и python: causal-inference-workshop-2024 🤫

@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
14👏7🔥3🤩3
Одним из препятствий на пути использования исследователями данных (помимо их отсутствия кончено) является наличие в данных персональной информации. Последние 15 лет на решение задачи нахождения баланса между максимальной гранулярностью данных и их конфиденциальностью направлены методы дифференциальной приватности (differential privacy).

Подробно о сути методов мы уже писали здесь, разбирая пример зашумления данных Бюро переписи населения США (пост для погружения в тему). Дифференциальная приватность - это компромисс и возможность для исследователей получить доступ к необходимым данным, поэтому чаще всего развитием методов differential privacy занимаются сами исследователи.

Мы искренне считаем, что развитие подходов к обеспечению открытого доступа к данным при сохранении их конфиденциальности позволит повысить ценность накопленных данных как в государственном, так и в частном секторе, используя их для принятия решений и исследований.

Именно поэтому продолжаем серию постов, и сегодня хотим опубликовать референсы на новый учебник Джо Нира (Университет Вермонта) и Чике Абуа: Programming Differential Privacy. Очень кропотливая и детальная работа: на примерах разбираются простые (удаление и зашумление) и более сложные (классификаторы машинного обучения) методы деидентификации данных. Эти материалы могут быть полезны сотрудникам статистических служб, ведомств, перед которыми стоят задачи по повышению открытости данных, а также для исследователей и научных сотрудников, которые часто становятся катализаторами инициатив предоставления данных в открытый доступ для научных сообществ. Если вам тема дифференциальной приватности интересна так же, как и нам, то рекомендуем посетить персональные сайты Джо Нира и Чике Абуа, где вы найдете дополнительный более основательный материал и практикумы по обеспечению конфиденциальности данных. Приятного чтения 📕. Ваш @evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍2
По красоте. Специально для визуалов и тех, кто не безразличен к презентации результатов своих исследовательских проектов. Рекомендуем репозитории двух замечательных датавизеров (даже лучше сказать - датавизионеров): Джозефа Барбиера (git) и Яна Хольца (git). Еще в старые добрые времена сайт Яна data-to-viz выручал, когда мы ломали голову, как лучше в графическом виде представить распределения ВРП регионов, зарплат госслужащих или изобразить доступность первичной медико-санитарной помощи. Его вклад в понятное представление данных бесценен, если еще не знакомы - ниже ссылки на все галереи, которые коллектит Ян:

🔗 R: http://r-graph-gallery.com
🔗 Python: http://python-graph-gallery.com
🔗 D3: http://d3-graph-gallery.com
🔗 React: http://react-graph-gallery.com
🔗 Еще больше графиков с кодом: https://www.dataviz-inspiration.com

На гитах и в галереях Джозефа и Яна вы найдете примеры построения прекрасных графиков и, уверены, сможете адаптировать и развить их решения на своих данных. Используйте, и да при будет с вами сила визуализации 👀

@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍2
Forwarded from Irina Kalabikhina (Irina Kalabikhina)
Опубликована наша статья о расчете эффекта обновленного регионального материнского капитала на рождаемость детей разных порядков на примере ЯНАО. Положительный эффект от материальной меры демографической политики есть. Осенью 2019 года объявлена впечатляющая обновленная программа регионального маткапитала в ЯНАО. И согласно проведенным расчетам, изменение суммарного коэффициента рождаемости (СКР) по всем рождениям составило 0,15. Демографы знают, что это много, это успех в странах с невысокой рождаемостью. Влияния на первые рождения нет. Рост СКР для вторых рождений составил 0,12, для третьих рождений — 0,08 статистического ребенка. Наблюдаемые изменения были связаны прежде всего с рождаемостью городского населения (не КМНС в сельской местности!). Модернизация программы материнского капитала в ЯНАО позволила затормозить на региональном уровне негативную динамику рождаемости, наблюдаемую в целом по стране. Денисова И.А., Калабихина И.Е., Кузнецова П.О. Оценка влияния региональной программы материнского капитала на рождаемость (на примере Ямало-Ненецкого автономного округа) // Государственное управление. Электронный вестник. 2024. No 105. С. 232–243. https://spajournal.ru/index.php/spa/issue/view/48/49
🔥10👍5👏1
🔤 Курс по кодингу на python для госсулжащих от Эйдана Фельдмана, профессора Высшей школы государственной службы Роберта Вагнера (Нью-Йорк). Как пишет Эйдан, курс продолжает начинания его коллег (здесь) и является очень базовым - основы основ python. Отлично подойдет тем, кто только начинает свой путь в дата-анализе или хочет мигрировать с других инструментов на python. Внутри много отсылок на сайд лекции и статьи, задачи на кейсах Нью-Йорка. В целом - хороший пример пропаганды дата-анализа внутри ведомств. Также рекомендуем очень известный курс Артура Террелла Программирование для Экономистов.

@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Introduction to GIS Programming (Python) 🐍

Dr. Qiusheng Wu, создатель нескольких широко используемых пакетов Python с открытым исходным кодом, включая geemap, leafmap и segment-geospatial, уважаемый автор различных открытых материалов, сделал записи курса по обучению применения языка Python в геопространственной области. Подобные курсы мы уже видели, но тут студенты познакомятся практически со всеми инструментами GeoPython, научатся визуализировать векторные и растровые данные, а также изучат 3D-картографирование с MapLibre и получат представление о SAMGeo и HyperCoast, двух специализированных геопространственных библиотеках.

Материалы курса также сопровождаются YouTube-роликами.
2👍1
«Вы работаете в ESG и хотите обогатить вашу работу доказательствами? Запишитесь на бесплатный онлайн-курс Evaluating Social Programs от J-PAL, который начнется 17 сентября, и узнайте, как рандомизированные оценки можно использовать для измерения воздействия» - так J-PAL зазывает на свой открытый курс. Мы заинролились - интересно ) Вы тоже можете - здесь.

@evidencespace
8👍3👏2
Forwarded from Профессорский кот (Yulia Vymyatnina)
Спасибо всем, кто поделился вчера своими ссылками! Я не успела их все посмотреть и систематизировать, поэтому начну с того, что поделюсь известными мне ресурсами, а потом буду дополнять пост (или сделаю серию).

Первый ресурс – коллекция материалов, собранных командой под руководством Томаса Сарджента (Нобелевская премия 2011 – за работу в области макроэкономики). Во вкладке Projects несколько курсов лекций (от вводного по Python до нескольких курсов по Quantitative Economics with Python, библиотека для Python (и библиотека для Julia – еще один язык, которым пользуются экономисты), книги.

Второй ресурс – проект команды Артура Террелла (начал как физик, потом стал экономистом, но при этом написал популярную книжку про ядерный синтез, работал в Банке Англии, поучаствовал в дизайне 50-фунтовой купюры, на которой изображен Тьюринг). Тут акцент на работу в Python с разными типами данных и проведение разных типов анализа, которыми пользуются экономисты.

Третий ресурс – книга Флориана Гайсса по использованию Python (а также R и Julia) для вводного курса по эконометрике (на базе учебника Вулдриджа). Если пролистать страницу до конца, можно найти ссылку на бесплатные копии в pdf. Коды ко всем главам даны. (Возможно, потребуется vpn)

#python_for_economists #в_помощь_исследователю
8👍6🔥2
🔹 Точно будет хорошо.

Аспирантский семинар «Методология социальных исследований»


Курс посвящен практике исследовательской работы в социальных науках. В рамках курса мы поговорим о методах получения эмпирического материала, постановке исследовательского вопроса и выборе подходящего метода, работе с литературой и подготовке исследовательского продукта, будь то презентация на конференции, статья или policy paper. Курс ориентирован на тех, кто хочет заниматься именно эмпирическими исследованиями в политической науке и смежных областях. В рамках курса мы будем говорить о том, как получать и презентовать такие результаты, которые будут публиковаться на самых престижных площадках, но не будем забывать и о том, что иногда нужно защищать диссертации.

Преподаватель курса — Кирилл Титаев
👍8🔥63
Разбирали закрома, вспомнили про эту хорошую книгу ВБ, написанную Шахидур Хандкером (руководителем Команды сельского развития ВБ*). Книга хоть и не новая, но уж больно хорошо в ней описаны кейсы применения количественных методов на практике. Тут вам и старая-добрая PROGRESA, и программа переселения Китая, и аргентинская Trabajar по поддержке безработных. Есть примеры расчетов на Stata. Можно использовать как надежный источник к началу дизайнов ваших оценок и исследований.

* The Rural Development Team - это группа Всемирного банка, которая работает с различными организациями над созданием и поддержкой устойчивых сельских сообществ.

@evidencespace
10👍2
Чуть не упустили. Тут Совет по делам женщин в статистике и науке о данных [1], Португальское статистическое общество (SPE) и Американская статистическая ассоциация (ASA) запустили проект «Международный день женщин в статистике и науке о данных». 8 октября состоится третья открытая бесплатная онлайн-конференция, приуроченная к этому дню. Программа насыщенная. Регистрация здесь.

[1] The Caucus for Women in Statistics and Data Science - международное профессиональное статистическое сообщество, созданное в 1971 году для образования, трудоустройства и продвижения женщин в статистике.

@evidencespace
12🤔2👍1🔥1
Forwarded from АСОПП
Оценка появилась в 1960-е как инструмент контроля результативности небольших грантовых проектов в сфере образования. Но с тех пор сфера ее применения значительно расширилась. Доклады, представленные на сессии «Подходы к оценке: от личного проекта до оценки системы», которая состоится 16 октября в 14:30 – 16:00 мск, наглядный тому пример.

Ирина Решта, Ассоциация ИнА-Центр, расскажет о своем авторском методе – метафорической аналитике. Метод основан на сочетании нарративной психологии, сказкотерапии и различных известных и авторских видов анализа и генерации идей, применяемых при социальном проектировании, в бизнесе и в психологии. Метод рекомендуется для поиска новых взглядов на решаемую проблему, для обнаружения рисков, для актуализации ресурсов и для поиска возможных дополнительных аспектов решения. Изначально Ирина разрабатывала этот метод для анализа личных проектов, но потом поняла, что он применим и для оценки социальных проектов, и для проработки отдельных элементов социальных проектов.

Наталья Гладких и Владимир Вайнер, Фонд развития медиа проектов и социальных программ «Глэдвэй», представят опыт разработки и применения многомерных моделей в оценке. В 2019-2020 году Фонд «Глэдвэй» в партнерстве с Институтом социально-экономического проектирования НИУ ВШЭ попытался найти такой подход к оценке проектов НКО, который позволил бы сделать оценку понятной и доступной для любой организации вне зависимости от масштаба деятельности, типа решаемой проблемы и т.п. В результате была разработана методика построения уникального оценочного профиля, включающего 13 базовых критериев, объединенных в три кластера. Оценка каждого критерия по шкале от 1 до 10 баллов позволяет сформировать профиль, указывающий на важные для оценки критерии, включающий их уникальное сочетание для конкретного проекта.

Антонина Попова, ГАУ ИДПО работников социальной сферы г. Москвы, представит методологию оценки системы профилактики социального сиротства и семейного неблагополучия на уровне региона РФ, которая была апробирована в трех регионах. В докладе будет представлен дизайн и методология оценки, описаны этапы работы, методы сбора и обработки данных, процедуры интеграции количественных и качественных данных, ограничения исследования, задействованные ресурсы.

Конференция АСОПП «Развитие оценки в социальной сфере в России: достижения и точки роста» состоится 15-16 октября. Участие в конференции бесплатное. Для участия требуется регистрация.

Познакомиться с программой и зарегистрироваться можно на сайте конференции: https://evalconf.ru/2024
2
Анализ российских данных на внутрирегиональном уровне осложняется изменениями границ муниципальных образований, изменениями их типов, названий и кодов ОКТМО.

С 2018 по 2024 гг. изменилась муниципальная структура более 40 регионов:
◽️ есть регионы, где все муниципалитеты меняли свои типы - Магаданская и Курганская области, Ставропольский край, ЯНАО, Удмуртия и др.;
◽️есть регионы, где было большое количество изменений границ - Московская область, Пермский край и др. - около 3% муниципалитетов России в 17 регионах.

Масштаб изменений сильно осложняет сбор панельных данных по муниципалитетам. При этом процесс преобразований не прекращается. Но удобных открытых машиночитаемых данных о таких преобразованиях нет.

Поэтому мы собрали базу данных об изменениях муниципалитетов и их границ, теперь можно:
🔸прочитать в статье на habr о проблемах данных на муниципальном уровне и как мы собрали и объединили данные из Росстата и OpenStreetMap;
🔸скачать с сайта СберИндекса версионный справочник муниципальных образований и пространственный слой с границами муниципалитетов с 2018 г.
 
Эта информация может помочь:
◽️ геоаналитикам, заинтересованным в данных о границах муниципальных образований
◽️исследователям, которые работают с муниципальными данными
◽️при проектировании БДПМО 2.0. Росстата
👍75🔥5