доказательный ⎵ пробел – Telegram
доказательный ⎵ пробел
1.26K subscribers
181 photos
1 video
10 files
285 links
Про causal inference, данные для исследований и принятие решений на основе данных.

Чат: @evidence_chat
Download Telegram
Forwarded from Ах, этот Минфин (Olya Parkhimovich)
ФНС России опубликовала API для получения сведений из Государственного адресного реестра и статистику по 16 тысячам муниципалитетов

Очень приятно, что появляются новые открытые данные, и на этот раз порадовала ФНС России, которая значительно обновила портал Федеральной информационной адресной системы.

На портале расширили функциональные возможности, обновили дизайн, модернизировали поиск (теперь можно искать по частям адреса, индексам и различным классификаторам), и, самое главное, добавили API.

На данный момент ФНС России предоставляет всем желающим возможность получить данные (а именно 36 Гб) в том виде, в котором им удобно:

- дампы (bulk data) - возможность скачать архив целиком. Тот вид предоставления данных, которого мы очень ждем от Минфина России и Комитета информатизации Санкт-Петербурга. При скачивании дампов доступна версионность до сентября 2022. Конечно, хотелось бы скачивать и более разные версии.
- API для разработчиков с документацией в Swagger
- СМЭВ.

Помимо этого разработчикам доступно руководство пользователя API-сервисов (с примерами) и возможность напрямую отправить запросы в техподдержку. Хотела написать, что доступны и условия использования открытых сервисов, но ссылка на них выдает ошибку 404 (думаю, быстро это пофиксят).

На сайте доступна и статистика о количестве адресных объектов: количество муниципальных образований, населенных пунктов, элементов планировочной структуры, улично-дорожной сети, земельных участков, зданий (строений), помещений в пределах здания и помещений в пределах помещений. В веб-интерфейсе указаны текущие значения (но, не указана дата, на которую они выгружены) и динамика за неделю.

Удивительно, но эти данные доступны и в формате открытых данных с детализацией до муниципального образования. Для 16 тысяч муниципалитетов доступны данные по количеству земельных участков, зданий, помещений, машино-мест и пр.

Вот бы и по ЕГРЮЛу так!

fias.nalog.ru

#фнсроссии #открытыеданные #фиас #api #открытость
👍12
marginaleffects

Вышла новая книга по библиотеке marginaleffects 📦 для оценки предельных эффектов и прогнозирования, которая содержит 25 глав, полных руководств, тематических исследований и технических примечаний. Библиотека позволяет работать с более 80 классами статистических моделей.
🎉8🔥3
Канал, канал, учебник

Предыдущий пост — тизер.

👉 Евгений Матёров, который работает в Сибирской пожарно-спасательной академии, запустил свой телеграм-канал про анализ данных и язык R. С Евгением я познакомился пару лет назад, когда, работая с данными по лесным пожарам, случайно наткнулся на его блог. Обычно блоги такого уровня встречаются в академическом твиттере. Правда, в биографии Евгения есть работа в Max-Planck-Institut, University of Massachusetts и Freie Universität Berlin. Если вы используете в своей работе R, то на канал стоит подписаться — Евгений следит за актуальными новостями, пишет про новые библиотеки и мероприятия.

👉 Еще один «региональный» исследовательский канал, за которым слежу, — канал Татьяны Черкашиной из Новосибирска. В нём много про обследования, переписи и архивные данные. Этими источниками пользуются многие исследователи, но про них, как правило, не пишут в сообществах по открытым данным.

📖 И, наконец, учебник. Вчера Академия Яндекса и Европейский университет в Санкт-Петербурге опубликовали хендбук «Прикладной анализ данных в социальных науках». Это учебник совсем для начинающих. Если не знаете, с какой стороны подступиться к статистике и анализу данных, то открывайте его. Авторы бережно и постепенно рассказывают про основные концепции. А параллельно учат писать код на питоне.

👉 Подписаться на доказательный ⎵ пробел: @evidencespace
🔥10👍5
Счетная палата проводит конкурс для молодых исследователей по применению доказательного подхода в оценке. Не то, чтобы у этого подхода есть сейчас перспективы, но учиться хорошим методам всегда вовремя. Еще у Счетки есть классная страничка про доказательный подход с хорошими спикерами.

В конкурсе будет две номинации:
▫️«анализ реализации» – проекты, направленные на выявление проблем в процессах реализации программ, разработку механизмов повышения их эффективности;
▫️«оценка влияния» – проекты, направленные на оценку достижения результатов программ.

Участвовать можно с индивидуальным проектом или командой до 3 человек. Заявку можно подать до 18 августа включительно.

📌 Подробнее о конкурсе и условиях участия можно узнать на странице конкурса.

@evidencespace
👍81
💸 Kozlov, Vladimir and Kofanov, Dmitrii and Zakharov, Nikita, The Effect of COVID-19 Cash Transfers on Health and Well-being of Adolescents: Quasi-Experimental Evidence from Russia (March 31, 2023). SSRN Working paper.

Оцениваемая политика: две выплаты по 10 000 рублей всем семьям с детьми от 3 до 16 лет в 2020 году.

Что доказали: подростки из семей, которые соответствовали критериям получения пособия, продемонстрировали значительно более высокие оценки своего материального положения, удовлетворенности жизнью и здоровьем, чем подростки из семей, которые в эти критерии немного не уложились (дети оказались старше). Этот эффект сохранился и в 2021 году.

Данные: «Российский мониторинг экономического положения и здоровья населения НИУ ВШЭ». Авторам помог график проведения опроса — с октября по декабрь 2020 года, тогда как сами выплаты пришлись на лето и начало осени. А еще в РМЭЗ респонденты заполняют взрослый опросник с 14 лет, так что результаты отражают именно оценку подростками своего благополучия.

Методы: наличие заданных границ по возрасту (от 3 до 16 лет) позволило сопоставить две группы подростков — тех, кто оказался немного старше и не мог претендовать на пособие (на 1-12 месяцев), с теми, кто попал в эти границы (в том же интервале 1-12 месяцев). Такой разрывный дизайн авторы дополнили сопоставлением с 2019 годом (разность разностей).

Алексей Ракша справедливо замечает, что даже такая небольшая денежная надбавка существенно повышает самооценки благополучия. Если бы размер выборки был больше (310 подростков), было бы интересно посмотреть на гетерогенные эффекты (посмотреть на разные семьи в смысле занятости родителей, уровня дохода и т.п.).

@evidencespace
6👍3
Новая версия библиотеки {see} (являющейся частью {easystats}) от небезызвестного в широких кругах Даниэля Людеке и его коллег - прекрасна! Куча простых и хорошо настроенных по умолчанию графиков для визуализации широкого круга базовых (и бесовских, ой, то есть байесовских) и не очень статистических моделей, которые (графики) к тому же легко кастомизируются через классические инструменты {ggolot2}, можно построить парой строк кода, а то и одной. Мечта ленивого новичка или знающего цену своему времени профессионала.

https://easystats.github.io/see/articles/index.html

#rstats #easystats #see #datavis #visualization #R
👍11
Судьба реформы: русское крестьянство в правительственной политике до и после отмены крепостного права

Идеи важны. При проведении реформ политические акторы апеллируют не только к экономическим интересам. С каких позиций вы смотрите на реальность и с чем/кем вы себя соотносите тоже играет роль. Вот, например, Дани Родрик с соавторами пишут про это относительно современных политиков.

Игорь Христофоров из Принстона с похожих позиций разбирает крестьянскую реформу позапрошлого века. Он описывает идеологический контекст, в котором происходила разработка преобразований. Кого читала аристократия, какими видела роль частной собственности и идеальную модель государства, как воспринимала крестьянство.

Сложившийся институциональный ландшафт в российской деревне определял пространство возможностей для изменений. Это отдельная глава.

Третья оптика — инфраструктурная. Можно долго говорить о реформе, но если нет нормальных кадастра и системы стат. учета, то реализовать преобразования будет сложно.

@evidencespace
🔥6👍2
Было ли у вас такое, что через пару месяцев после завершения проекта вы не можете найти нужный код или данные. Часть файлов оказывается в загрузках, часть — теряется. Воспроизвести результаты невозможно. Стандартные рецепты (модульная организация кода, документирование, использование систем контроля версий) тоже не всегда помогают.

Хочется задать структуру еще на берегу. Одно из решений — применение одного и того же шаблона для структуры папок и файлов.

Можно, например, использовать Cookiecutter. Это библиотека, которая позволяет настроить под себя стандартный шаблон, а потом при запуске нового проекта сразу его разворачивать. Есть уже готовый отличный шаблон для Data Science проектов, а вот пример шаблона для исследовательского проекта.

В базовом случае для работы хватит пары команд:

pip install cookiecutter

cookiecutter <ссылка на репозиторий с шаблоном>

Добавьте к этому правила именования файлов, и работа со старыми проектами существенно упростится.

@evidencespace
👍7🔥5🤩2
130 статей, которые должен прочитать каждый, кто применяет количественные методы. Попробуйте прочитать хотя бы 10, подборка🔥

@evidencespace
🔥111😁1
This media is not supported in your browser
VIEW IN TELEGRAM
8
Typst 🖊️

Typst - это новый онлайн-редактор для набора текста на основе Markdown-разметки с открытым исходным кодом и использованием скриптовых команд. Typst предлагает совместную работу в облаке, возможность вставлять LaTeX-формулы, но делать это несколько проще, чем в LaTeX. Интерес представляет наличие шаблонов (пока их пять, но, думаю, что со временем будет больше).

На первый взгляд Typst похож на упрощенную версию Overleaf + Google Docs. Также, можно установить CLI.

В Quarto v1.4 уже включили поддержку Typst.
👍4👎3
Еще одна фишка Typst — совместное редактирование, будет удобно, если появится больше шаблонов.
👍1