Forwarded from Если быть точным
Хотите знать, что происходит в России на уровне районов? У нас есть для этого уникальный датасет! Сегодня мы его обновили – и сделали гораздо удобнее
Полгода назад мы опубликовали датасет с муниципальной статистикой. За это время его скачали несколько тысяч раз — это самый популярный набор в каталоге. Сегодня вышла новая версия. Вот что изменилось:
🔸 Внесли данные за 2023 и 2024 годы, которые появились в базе Росстата в конце лета этого года. Теперь в датасете около 300 млн записей.
🔸 Добавили 36 новых показателей — например, долю детей в детских садах и число индивидуальных предпринимателей в районе. Посмотреть все показатели и скачать таблицы с данными можно тут.
🔸 Поправили ошибки прошлой версии. Например, исправили года и формы собственности — эти несостыковки были в исходных данных Росстата. А еще проверили 79% записей на аномальные значения и отметили их в отдельном столбце.
🔸 Главное — добавили стабильные идентификаторы районов, которые учитывают изменения в муниципальной структуре с 2010 года. В 40% районов страны изменились границы муниципалитетов, их типы, названия и коды ОКТМО. Это усложняет сбор длинных рядов со значениями показателя в определенном районе. Теперь исследователи могут не тратить свое время на такую работу и сразу переходить к анализу данных.
Если у вас есть пожелания по форматам данных или новым наборам — напишите в бот @tochno_bot. Ваши замечания мы учтем в новых обновлениях.
⚫️ Чтобы у нас получилось собирать больше датасетов — поддержите нас. Это можно сделать через Boosty или Patreon.
Полгода назад мы опубликовали датасет с муниципальной статистикой. За это время его скачали несколько тысяч раз — это самый популярный набор в каталоге. Сегодня вышла новая версия. Вот что изменилось:
Если у вас есть пожелания по форматам данных или новым наборам — напишите в бот @tochno_bot. Ваши замечания мы учтем в новых обновлениях.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👏3🎉3❤2
Forwarded from Small Data Science for Russian Adventurers
#книга
Emil Hvitfeldt "Feature Engineering A-Z"
Открытая книга по предобработке данных и генерации признаков. Пока ещё до конца не дописана, но по деформации признаков, категориальным признакам, пропускам и текстовым признакам информация есть. Примеры кода на R и Python.
https://feaz-book.com/
Emil Hvitfeldt "Feature Engineering A-Z"
Открытая книга по предобработке данных и генерации признаков. Пока ещё до конца не дописана, но по деформации признаков, категориальным признакам, пропускам и текстовым признакам информация есть. Примеры кода на R и Python.
https://feaz-book.com/
🔥10❤5
Хорошие новости: J-PAL продолжают запускать бесплатные курсы для специалистов в области оценки и #ebpm (об одном из них рассказывали ранее, надеемся, вы (как и мы) смогли принять участие и получили пользу от прошлого курса). Считаем это достойной практикой. В этот раз тема курса напрямую связана с прикладной областью J-PAL: борьба с бедностью - «The Challenges of Global Poverty». Среди тем: poverty traps (ловушки бедности) и эксперименты, влияние на доходы населения таких факторов как: здравоохранение, образование, питание, предпринимательство. Отдельный блок выделен институтам и политике.
Среди менторов курса Абхиджит Банерджи и Эстер Дюфло - лауреаты Нобелевской премии по экономике 2019 года (присуждена «за экспериментальный подход в борьбе с бедностью»). Курс стартует 21 января и продлится до 30 апреля 2025 года. Это уникальная возможность для всех, кто интересуется вопросами снижения уровня бедности и роста доходов.
➡️ Регистрируйтесь вместе с нами.
@evidencespace
Среди менторов курса Абхиджит Банерджи и Эстер Дюфло - лауреаты Нобелевской премии по экономике 2019 года (присуждена «за экспериментальный подход в борьбе с бедностью»). Курс стартует 21 января и продлится до 30 апреля 2025 года. Это уникальная возможность для всех, кто интересуется вопросами снижения уровня бедности и роста доходов.
@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤2👍1
Отличная обзорная лекция по причинно-следственному выводу от Лиззи Сильвер (дата-аналитика WSP) в рамках недавно прошедшей конференции PyCon AU 2024. В лекции Лиззи кратко рассказывает о причинно-следственных связях, а после проводит обзор нескольких программных пакетов python для построение таких связей:
➤ py-tetrad
➤ causal-learn
➤ tigramite
➤ causalnex
➤ cdt (causal discovery toolbox)
Пакеты частично перекрываются, но имеют разные акценты: каждый реализует по крайней мере один алгоритм, не охватываемый другими пакетами, что делает их полезными в разных ситуациях. Репозиторий лекции здесь.
@evidencespace
➤ py-tetrad
➤ causal-learn
➤ tigramite
➤ causalnex
➤ cdt (causal discovery toolbox)
Пакеты частично перекрываются, но имеют разные акценты: каждый реализует по крайней мере один алгоритм, не охватываемый другими пакетами, что делает их полезными в разных ситуациях. Репозиторий лекции здесь.
@evidencespace
🔥13❤2👨💻2
Forwarded from Канал влияния
Причинно-следственный анализ стал одним из самых мощных инструментов современной науки. Сегодня он лежит в основе доказательной политики и помогает отвечать на вопросы о том, что действительно работает. Но откуда он появился? Давайте разберемся!
Идея причинности уходит корнями в философию
Эти идеи не были математически формализованы, но задали направление для будущих поколений исследователей
С развитием статистики в начале XX века причинно-следственный анализ стал более строгим и количественным
Эти идеи стали основой для строгого анализа данных в науке, включая исследования в сельском хозяйстве и медицине
В 1970-х годах Принстонский отдел трудовых отношений стал центром инноваций в эмпирической экономике
Принстонская школа сделала акцент на прозрачности и достоверности эмпирических исследований, критикуя недостатки существующих методов
В 1980–1990-х годах развитие причинно-следственного анализа вышло на новый уровень благодаря междисциплинарному подходу
Теорема LATE стала важной вехой, предоставив строгую теоретическую базу для анализа сложных данных и сделав инструментальные переменные доступными для широкой аудитории
Сегодня причинно-следственный анализ — мощный инструмент для принятия решений
Источник: подготовлено на основе материалов Скотта Канингема [1, 2, 3]
#канал_обозревает
#канал_рекомендует
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13👍6🎉4👏2
Forwarded from Анализируй, выбирай, решай | Официальный Telegram-канал Международного центра анализа и выбора решений НИУ ВШЭ (МЦАВР)
Рубрика "Мероприятия"
18 декабря в 16:30 по Москве состоится очередное заседание Общемосковского научного семинара "Математические методы анализа решений в экономике, бизнесе и политике". На семинаре выступят младший научный сотрудник Института проблем правоприменения при Европейском университете в Санкт-Петербурге Сергей Владимирович Бондарьков и ассоциированный профессор Института проблем правоприменения при Европейском университете в Санкт-Петербурге Дмитрий Анатольевич Скугаревский
Название доклада: Нефинансовая информация улучшает предсказание банкротств: применение закона Бенфорда и данных о литигации
Аннотация: Модели предсказания банкротства традиционно опираются на бухгалтерские отчеты компаний. Однако известно, что фирмы могут манипулировать отчетами — и одним из стимулов к этому может быть как раз плохое состояние дел. Мы относимся к этой проблеме, добавляя в модель новые предикторы: соответствие первых цифр значений в бухгалтерских отчетах закону Бенфорда и число не связанных с банкротством судебных разбирательств, в которые вовлечена фирма. Отклонения от закона Бенфорда могут указывать на манипуляции с данными, в то время как участие в судах может сигнализировать, что компания испытывает сложности с выполнением обязательств. Наше моделирование на панели из 2 миллионов российских компаний в 2012–2018 годах показывает, что судебные переменные имеют предсказательную способность, сопоставимую с традиционными финансовыми коэффициентами как для крупных компаний, так и для малых и средних предприятий (МСП). Меры соответствия закону Бенфорда, против ожиданий, не добавляют почти ничего к качеству модели. Чтобы приблизить практическую ценность предлагаемых улучшений, мы оцениваем ожидаемую максимальную прибыль (ОМП) кредиторов от использования модели, в которой к традиционным финансовым коэффициентам добавлены судебные переменные. В случае с кредитованием компаний, не относящихся к малому и среднему бизнесу (МСП), ОМП в 2018 году составила бы 845 миллионов долларов. В случае с МСП — лишь 14 миллионов, что ставит под сомнение целесообразность инвестиций в улучшение моделей банкротства для этого сегмента.
Семинар состоится в онлайн формате на платформе Zoom 18 декабря (среда) в 16:30 по Москве.
Ссылка для подключения: https://us02web.zoom.us/j/86862557441?pwd=bXFTV1VsTksvcVRzd01QdFZwTDFwQT09
Идентификатор конференции: 868 6255 7441
Код доступа: 275177
Приглашаем всех желающих!
18 декабря в 16:30 по Москве состоится очередное заседание Общемосковского научного семинара "Математические методы анализа решений в экономике, бизнесе и политике". На семинаре выступят младший научный сотрудник Института проблем правоприменения при Европейском университете в Санкт-Петербурге Сергей Владимирович Бондарьков и ассоциированный профессор Института проблем правоприменения при Европейском университете в Санкт-Петербурге Дмитрий Анатольевич Скугаревский
Название доклада: Нефинансовая информация улучшает предсказание банкротств: применение закона Бенфорда и данных о литигации
Аннотация: Модели предсказания банкротства традиционно опираются на бухгалтерские отчеты компаний. Однако известно, что фирмы могут манипулировать отчетами — и одним из стимулов к этому может быть как раз плохое состояние дел. Мы относимся к этой проблеме, добавляя в модель новые предикторы: соответствие первых цифр значений в бухгалтерских отчетах закону Бенфорда и число не связанных с банкротством судебных разбирательств, в которые вовлечена фирма. Отклонения от закона Бенфорда могут указывать на манипуляции с данными, в то время как участие в судах может сигнализировать, что компания испытывает сложности с выполнением обязательств. Наше моделирование на панели из 2 миллионов российских компаний в 2012–2018 годах показывает, что судебные переменные имеют предсказательную способность, сопоставимую с традиционными финансовыми коэффициентами как для крупных компаний, так и для малых и средних предприятий (МСП). Меры соответствия закону Бенфорда, против ожиданий, не добавляют почти ничего к качеству модели. Чтобы приблизить практическую ценность предлагаемых улучшений, мы оцениваем ожидаемую максимальную прибыль (ОМП) кредиторов от использования модели, в которой к традиционным финансовым коэффициентам добавлены судебные переменные. В случае с кредитованием компаний, не относящихся к малому и среднему бизнесу (МСП), ОМП в 2018 году составила бы 845 миллионов долларов. В случае с МСП — лишь 14 миллионов, что ставит под сомнение целесообразность инвестиций в улучшение моделей банкротства для этого сегмента.
Семинар состоится в онлайн формате на платформе Zoom 18 декабря (среда) в 16:30 по Москве.
Ссылка для подключения: https://us02web.zoom.us/j/86862557441?pwd=bXFTV1VsTksvcVRzd01QdFZwTDFwQT09
Идентификатор конференции: 868 6255 7441
Код доступа: 275177
Приглашаем всех желающих!
www.hse.ru
Общемосковский научный семинар "Математические методы анализа решений в экономике, бизнесе и политике"
🔥7
Forwarded from Канал влияния
🔥 Как понять причинность и изменить будущее науки? Judea Pearl на Cutter Lectures 🔥
6 декабря в рамках 176-й Cutter Lecture в Гарвардской школе общественного здравоохранения выступил Джудеа Перл — лауреат премии Алана Тьюринга и один из основоположников современной науки о причинно-следственных связях. Его лекция "The Science of Cause and Effect" была посвящена ключевым вопросам, связанным с разработкой моделей, способных интерпретировать сложные причинно-следственные связи, а также применению этих подходов в медицине и искусственном интеллекте
📝 О чем шла речь?
🟡 Понимание причинности. Перл обсудил рамочную концепцию, которая позволяет ответить на три типа вопросов: взаимосвязь (association), воздействие (intervention) и контрфакты (counterfactuals). Эти уровни анализа — основа так называемой иерархии или лестницы причинности (Pearl's Causal Ladder), которая формирует новое понимание данных и выводов
🟡 Графовые модели. Перл рассказал о своей работе с причинными графами, которые стали мощным инструментом для эпидемиологии и других наук. Эти графы помогают наглядно представлять сложные взаимосвязи между переменными и находить способы тестировать гипотезы
🟡 Персонализированное принятие решений. Особое внимание было уделено применению причинного анализа в медицине, где он помогает прогнозировать, как конкретный пациент отреагирует на лечение, исходя из его уникальных характеристик, а не только средних статистических данных
👨🏫 Кто такой Джудеа Перл?
Джудеа Перл — профессор Университета Калифорнии в Лос-Анджелесе (UCLA) и директор Cognitive Systems Laboratory. Он автор ключевых книг, таких как "Causality" и "The Book of Why", которые заложили основы причинного анализа с использованием графов. Его исследования охватывают искусственный интеллект, философию науки и когнитивные системы. Перл является членом Национальной академии наук США и лауреатом престижных наград, включая премию Лондонской школы экономики и BBVA Frontiers of Knowledge Award
📊 О Cutter Lectures
Cutter Lectures проводятся с 1912 года и являются старейшей серией лекций в области эпидемиологии и профилактической медицины. Они посвящены глобальным вызовам в сфере общественного здоровья и собирают ведущих учёных и исследователей со всего мира. Лекции организуются Гарвардской школой общественного здравоохранения в память о докторе Джоне Кларенсе Каттере
#канал_рекомендует
@causal_channel
6 декабря в рамках 176-й Cutter Lecture в Гарвардской школе общественного здравоохранения выступил Джудеа Перл — лауреат премии Алана Тьюринга и один из основоположников современной науки о причинно-следственных связях. Его лекция "The Science of Cause and Effect" была посвящена ключевым вопросам, связанным с разработкой моделей, способных интерпретировать сложные причинно-следственные связи, а также применению этих подходов в медицине и искусственном интеллекте
Джудеа Перл — профессор Университета Калифорнии в Лос-Анджелесе (UCLA) и директор Cognitive Systems Laboratory. Он автор ключевых книг, таких как "Causality" и "The Book of Why", которые заложили основы причинного анализа с использованием графов. Его исследования охватывают искусственный интеллект, философию науки и когнитивные системы. Перл является членом Национальной академии наук США и лауреатом престижных наград, включая премию Лондонской школы экономики и BBVA Frontiers of Knowledge Award
Cutter Lectures проводятся с 1912 года и являются старейшей серией лекций в области эпидемиологии и профилактической медицины. Они посвящены глобальным вызовам в сфере общественного здоровья и собирают ведущих учёных и исследователей со всего мира. Лекции организуются Гарвардской школой общественного здравоохранения в память о докторе Джоне Кларенсе Каттере
#канал_рекомендует
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11
Forwarded from Канал влияния
Дисклеймер: мы не читали все книги от начала до конца, но считаем, что достаточно с ними знакомы, чтобы учесть их специфику при составлении схемы
#канал_рекомендует
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8🔥7
Forwarded from Канал влияния
Мы постепенно возвращаемся с каникул и собираемся вновь начать радовать вас постами!
А пока все отдыхали, 2 января Джейми Робинс и Мигель Эрнан опубликовали новую версию своей книги, посвящённой методам каузального анализа -- «Causal Inference: What If». Книга будет полезна всем, кто занимается изучением причинно-следственных связей: эпидемиологам, статистикам, психологам, экономистам, социологам, политологам и специалистам в области Data Science.
📥 Скачать актуальную версию книги бесплатно
Кроме того, вы можете пройти бесплатный онлайн-курс Мигеля Эрнана «Causal Diagrams: Draw Your Assumptions Before Your Conclusions», который доступен на платформе edX. В курсе вы научитесь использовать причинно-следственные диаграммы для улучшения проектирования исследований и анализа данных.
Что вы узнаете на курсе:
#канал_рекомендует
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤2🔥1
Forwarded from Наука и данные
Program Evaluation for Public Service 👨🎓
Andrew Heiss (Andrew Young School of Policy Studies, Georgia State University), известный нам, например, по материалам курса Data Visualization (актуализированная версия), изучающего принципы графического дизайна на основе R и ggplot2, поделился материалами курса Program Evaluation for Public Service. В этом курсе дается введение в область причинно-следственных связей (causal inference) с использованием R и tidyverse в применении к оценке эффективности социальных программ.
Для того, чтобы войти в курс дела, можно посмотреть подборку С чего начать свой путь в causal inference? и Оценка причинно-следственных связей от наших уважаемых коллег из МГУ им. М.В. Ломоносова, а также Causal Inference in R у нас на канале.
Andrew Heiss (Andrew Young School of Policy Studies, Georgia State University), известный нам, например, по материалам курса Data Visualization (актуализированная версия), изучающего принципы графического дизайна на основе R и ggplot2, поделился материалами курса Program Evaluation for Public Service. В этом курсе дается введение в область причинно-следственных связей (causal inference) с использованием R и tidyverse в применении к оценке эффективности социальных программ.
Для того, чтобы войти в курс дела, можно посмотреть подборку С чего начать свой путь в causal inference? и Оценка причинно-следственных связей от наших уважаемых коллег из МГУ им. М.В. Ломоносова, а также Causal Inference in R у нас на канале.
❤5🔥3👍1
Forwarded from Рюмочная ИПП
Российская база бухгалтерской отчетности
Представляем вам Российскую базу бухгалтерской отчетности (РББО, RFSD) — первую открытую альтернативу СПАРК-Интерфакс, Ruslana, Контур.Фокус и СБИС. До сих пор исследователям приходилось покупать доступ к данным, формировать выгрузку и импортировать данные в статистический пакет. Теперь отчетности всех компаний можно загрузить тремя строками на Python:
Наша база собрана из официальных источников — ЕГРЮЛ ФНС, архивных данных Росстата и отчетностей, полученных через Государственный информационный ресурс бухгалтерских отчетностей (ГИР БО). Сейчас РББО охватывает 2011–2023 годы и содержит 56,6 млн наблюдений. Мы планируем ежегодно обновлять базу по мере поступления новых данных в ГИР БО. Ближайшее обновление — в июле 2025 года.
Важное отличие РББО от коммерческих продуктов состоит в том, что она включает не только все годовые неконсолидированные отчетности российских организаций, но и сведения об организациях, не подавших отчетность несмотря на такую обязанность.
Процесс сбора и валидации данных документирован в препринте: https://arxiv.org/abs/2501.05841.
В репозитории на GitHub мы приводим примеры использования РББО в экономических исследованиях:
🌍 Для макроэкономистов — оценка процентных расходов российских компаний
🏭 Для отраслевых рынков — оценка производственной функции предприятий обрабатывающей промышленности
🗺 Для экономических географов — новый способ оценить пространственное распределение ВВП России с помощью данных фирм
Скачать РББО можно здесь:
🤗 Hugging Face: https://huggingface.co/datasets/irlspbru/RFSD
💤 Zenodo: https://doi.org/10.5281/zenodo.14622209
На GitHub также перечислены открытые проблемы и пути улучшения РББО. Будем рады вашему участию и помощи.
Представляем вам Российскую базу бухгалтерской отчетности (РББО, RFSD) — первую открытую альтернативу СПАРК-Интерфакс, Ruslana, Контур.Фокус и СБИС. До сих пор исследователям приходилось покупать доступ к данным, формировать выгрузку и импортировать данные в статистический пакет. Теперь отчетности всех компаний можно загрузить тремя строками на Python:
from datasets import load_dataset
import polars as pl
# Эта строка загрузит всю РББО (6,6 ГБ+) и поместит ее в 🤗-кэш-директорию
RFSD = load_dataset('irlspbru/RFSD')
Наша база собрана из официальных источников — ЕГРЮЛ ФНС, архивных данных Росстата и отчетностей, полученных через Государственный информационный ресурс бухгалтерских отчетностей (ГИР БО). Сейчас РББО охватывает 2011–2023 годы и содержит 56,6 млн наблюдений. Мы планируем ежегодно обновлять базу по мере поступления новых данных в ГИР БО. Ближайшее обновление — в июле 2025 года.
Важное отличие РББО от коммерческих продуктов состоит в том, что она включает не только все годовые неконсолидированные отчетности российских организаций, но и сведения об организациях, не подавших отчетность несмотря на такую обязанность.
Процесс сбора и валидации данных документирован в препринте: https://arxiv.org/abs/2501.05841.
В репозитории на GitHub мы приводим примеры использования РББО в экономических исследованиях:
🌍 Для макроэкономистов — оценка процентных расходов российских компаний
🏭 Для отраслевых рынков — оценка производственной функции предприятий обрабатывающей промышленности
🗺 Для экономических географов — новый способ оценить пространственное распределение ВВП России с помощью данных фирм
Скачать РББО можно здесь:
🤗 Hugging Face: https://huggingface.co/datasets/irlspbru/RFSD
💤 Zenodo: https://doi.org/10.5281/zenodo.14622209
На GitHub также перечислены открытые проблемы и пути улучшения РББО. Будем рады вашему участию и помощи.
arXiv.org
Russian Financial Statements Database: A firm-level collection of...
The Russian Financial Statements Database (RFSD) is an open, harmonized collection of annual unconsolidated financial statements of the universe of Russian firms in 2011-2023. It is the first open...
❤17🔥4
Forwarded from Канал влияния
🎯 Почему взаимосвязи не равны причинности? Разбираем "лестницу причинности" Джудеа Перла 🔍
Вы наверняка слышали об иерархии доказательств (hierarchy of evidence), однако это не единственная попытка систематизировать оценки. Менее известной, но оттого не менее важной является иерархия причинности Джудеа Перла (Pearl, 2009), на которую мы уже ссылались в одном из постов
Когда мы смотрим на данные, возникает главный вопрос: что за ними стоит? Простых наблюдений недостаточно, чтобы находить причины и предсказывать последствия
1️⃣ уровень: взаимосвязь (association)
"X связан с Y?"
🔴 Понимаем, какие переменные связаны (корреляция)
🔴 Не отвечает на вопросы, связанные с причинными изменениями
🔴 Источник данных -- наблюдаемые данные
🔴 Этот уровень -- основа, но он недостаточен для принятия решений
2️⃣ уровень: воздействие (intervention)
"Что произойдёт, если я сделаю X?"
🔴 Изучаем, как одно изменение влияет на другое (причина)
🔴 Не позволяет ответить на ретроспективные и контрфактические вопросы
🔴 Источник данных -- рандомизированные эксперименты или причинные байесовские сети
3️⃣ уровень: контрфакты (counterfactuals)
"Что бы произошло, если бы X было другим?"
🔴 Можем рассматривать гипотетические сценарии и делать выводы о том, что было бы, если бы условия изменились
🔴 Требует наличия функциональных моделей или структурных уравнений
🔴 Это самый сложный, но и самый мощный уровень
⛳ Почему это важно? Без понимания причинности вы рискуете 🥲
🔴 Делать выводы на основе ложных причинно-следственных связей (корреляций)
🔴 Реагировать на краткосрочные эффекты, не видя общей картины (интервенция)
🔴 Не понимать, что именно привело к успеху или провалу (контрфакты)
⛳ Направленность и связность иерархии ✨
🔴 Взаимосвязи помогают увидеть паттерны в данных
🔴 Интервенции позволяют менять реальность и измерять эффект
🔴 Контрфакты дают понимание, почему всё произошло и что можно было бы улучшить
❗️ Информация с уровня контрфактов (counterfactuals) может быть использована для ответа на вопросы взаимосвязи (association) и воздействия (intervention)
❗️ Однако вопросы воздействия (intervention) невозможно решить только на основе информации о взаимосвязях (association), а контрфакты (counterfactuals) нельзя полностью вывести из данных о воздействии (intervention)
Иерархия причинности помогает структурировать вопросы и выбрать подходящие инструменты анализа -- от простых наблюдений до сложных моделей для контрфактических сценариев
📖 Коротко с концепцией можно ознакомиться в ноутбуке от PyMC Labs* или записке UCLA, но мы, конечно, рекомендуем обратиться к первоисточнику (Pearl, 2009; Pearl, Mackenzie, 2018) или лекции Джудеа Перла
Автор мема Kareem Carr
*Ребята делают много хорошего про байесовость. Если вы хотите впервые познакомиться с байесовостью, то можно начать с лекции выпускника ЭФ МГУ Максима Кочурова, разработчика PyMC тут
#канал_обозревает
@causal_channel
Вы наверняка слышали об иерархии доказательств (hierarchy of evidence), однако это не единственная попытка систематизировать оценки. Менее известной, но оттого не менее важной является иерархия причинности Джудеа Перла (Pearl, 2009), на которую мы уже ссылались в одном из постов
Когда мы смотрим на данные, возникает главный вопрос: что за ними стоит? Простых наблюдений недостаточно, чтобы находить причины и предсказывать последствия
"X связан с Y?"
Вы заметили, что люди, гуляющие по торговому центру в дождливую погоду, чаще заходят в кафе
"Что произойдёт, если я сделаю X?"
Вы решили предложить скидку на горячий шоколад и хотите узнать, увеличит ли это продажи
"Что бы произошло, если бы X было другим?"
Произошёл бы сбой на производстве, если бы мы установили другой тип оборудования?
Иерархия причинности помогает структурировать вопросы и выбрать подходящие инструменты анализа -- от простых наблюдений до сложных моделей для контрфактических сценариев
Автор мема Kareem Carr
*Ребята делают много хорошего про байесовость. Если вы хотите впервые познакомиться с байесовостью, то можно начать с лекции выпускника ЭФ МГУ Максима Кочурова, разработчика PyMC тут
#канал_обозревает
@causal_channel
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥3👍1
Новый бесплатный курс от MIT (о других совместных с J-PAL курсах рассказывали здесь и здесь): «Анализ данных для социологов».
@evidencespace
Курс дает возможность узнать о методах использования данных для ответов на вопросы, представляющие культурный, социальный, экономический и политический интерес. На протяжении всего курса у вас будет возможность работать с реальными данными и применять изученные статистические методы с помощью статистического пакета R. Курс длится около 11 недель.
@evidencespace
🔥6❤1
Наша подписчица прошла курс Evaluating Social Programs от J-PAL, о котором мы рассказывали раньше. Вот её отзыв
J-PAL (The Abdul Latif Jameel Poverty Action Lab) — крупнейшая мировая лаборатория исследований бедности и оценки эффективности социальных программ. В курсе Evaluating Social Programs излагаются основные теоретические посылки, на которых строится работа лаборатории (модель оценки воздействия, статистика, планирование эксперимента) и приводятся примеры проектов. Наша подписчица Юлия Апухтина (@conspect_labs) делится своим впечатлением от курса.
◽️Где проводится курс
🟡 На платформе MITx. Курс синхронный — каждый запуск имеет срок начала и конца. Это примерно 10 недель. Нужно прослушать 30 часов видеолекций, постоянно перемежаемых заданиями и вопросами, и прорешать несколько кейсов. Чтобы получить сертификат (стоит 99 долларов, бывают скидки) нужно набрать 65% баллов в ассесментах, если баллов не хватает — сдать дополнительный экзамен (доступ к нему появляется после оплаты сертификата). Уровень заданий далеко не низкий, рекомендую очень тщательно вчитываться в тексты кейсов и вообще не торопиться с ответами.
◽️Как устроен курс
🟡 Курс сформирован из лекций, записанных в большей части на живых лекциях для сотрудников НКО из разных стран (каких, неизвестно, но акценты в студии были в основном африканские). Лекции в зале записаны в 2010-2020 годах с профессорами (и в разное время директорами) MIT/J-PAL — Benjamin Olken и Rachel Glennerster. С этими спикерами есть и другие лекции на Yuotube. Оба очень живые, я рекомендую посмотреть все, что найдется. Коммуникационно это «Harvard style», когда лектор каждые две-три минуты требует от аудитории вопросов или реакции. Причем обращается с аудиторией невероятно нежно — любой вопрос получает похвалу и одобрение спикера.
◽️Какие в нем части
🟡 Содержательно курс состоит из теории воздействия (как их планировать), статистики и практических примеров «из жизни», в которых важны не только сами истории, но и большое количество оговорок и деталей:
🟡 Но это анекдоты, а реально самое ценное — сплав, какой-то что ли гибкости в подходах к эксперименту с очень жесткой статистической базой и, соответственно, очень трезвым подходом к результатам. Этот подход настоятельно рекомендуется использовать при общении с фаундерами и заказчиками на самых ранних этапах планирования программ и экспериментов.
J-PAL (The Abdul Latif Jameel Poverty Action Lab) — крупнейшая мировая лаборатория исследований бедности и оценки эффективности социальных программ. В курсе Evaluating Social Programs излагаются основные теоретические посылки, на которых строится работа лаборатории (модель оценки воздействия, статистика, планирование эксперимента) и приводятся примеры проектов. Наша подписчица Юлия Апухтина (@conspect_labs) делится своим впечатлением от курса.
◽️Где проводится курс
◽️Как устроен курс
◽️Какие в нем части
«Вице-губернатор будет просить вас включить в программу его родную деревню - не надо ему отказывать! Потом просто в оценку эту деревню не включите, и все»
Please open Telegram to view this post
VIEW IN TELEGRAM
mitxonline.mit.edu
Evaluating Social Programs
❤4🔥4👍3
«Ну, тут интуитивно понятно влияние размера вашей выборки на мощность» — говорит лектор. Мне кажется, что такая «интуиция» свойственна не всем людям. Несмотря на предыдущий блок статистики, для понимания многих рассуждений все-таки нужна не вводная, а довольно крепкая статистическая база.
Мне не хватило лекции про то, на чем, собственно, они замеряют эффекты — как будто предполагается, что это всегда параметрический анализ, но почему, не говорится.
Не знаю, насколько все это полезно для профессионалов в доказательной политике и социальных науках, но было очень интересно.
Подписывайтесь на канал Юлии: @conspect_labs
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍5
Большой образовательный проект CORE-Econ (Curriculum Open-access Resources in Economics), который объединяет экономистов из разных стран и публикует много материалов по экономической теории, разместил курс лекций по экономике с разбором кейсов на данных «Doing Economics: empirical projects». Работа с данными разобрана на примере excel, google sheets, R и python (очень разносторонний набор инструментов).
Среди тем кейсов:
🔘 Оценка влияния налога на сахар в США с использованием DiD
🔘 Анализ управленческих практик в коммерческих компаниях стран мира
🔘 Оценка рисков банковских систем
🔘 Оценка влияния государственной политики на неравенство доходов
В библиотеке CORE также много интересного материала по анализу и оценке прошедших кризисов, исследованиям различных форм неравенства и подборок бесплатных обучающих курсов.
@evidencespace
Среди тем кейсов:
🔘 Оценка влияния налога на сахар в США с использованием DiD
🔘 Анализ управленческих практик в коммерческих компаниях стран мира
🔘 Оценка рисков банковских систем
🔘 Оценка влияния государственной политики на неравенство доходов
В библиотеке CORE также много интересного материала по анализу и оценке прошедших кризисов, исследованиям различных форм неравенства и подборок бесплатных обучающих курсов.
@evidencespace
🔥18❤2
@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👨💻2
Forwarded from Совет молодых учёных ЭФ МГУ (СМУч)
5-7 июня 2025 года — третья конференция «New Advances in the Political Economy of Development in Eurasia», Алматы, Казахстан.
Рабочий язык - английский.
Тематика:
--Социальный капитал, доверие и культурные нормы
--Человеческий капитал и экономическое развитие
--Медиа и общественне мнение
--Конликты и их решение
--Коллективные дейсвтия и общественные блага
--Политические элиты и управление
--Сравнительная политика
--Проблема колеи
--Экономическая политика и общественное благосостояние
Ключевые докладчики: Дженнифер Ганди (Йельский Университет) и Рубен Ениколопов (Университет Поммеу Фабра)
Заявки до 28 февраля 2025 года: полные тексты статей или аннотации до 250 слов и резюме.
Результаты отбора заявок — 31 марта 2025 года.
Полные тексты статей от приглашённых атворов заявок — до16 мая 2025 года.
Подробности:
https://sites.google.com/view/polecon/call-for-papers
Рабочий язык - английский.
Тематика:
--Социальный капитал, доверие и культурные нормы
--Человеческий капитал и экономическое развитие
--Медиа и общественне мнение
--Конликты и их решение
--Коллективные дейсвтия и общественные блага
--Политические элиты и управление
--Сравнительная политика
--Проблема колеи
--Экономическая политика и общественное благосостояние
Ключевые докладчики: Дженнифер Ганди (Йельский Университет) и Рубен Ениколопов (Университет Поммеу Фабра)
Заявки до 28 февраля 2025 года: полные тексты статей или аннотации до 250 слов и резюме.
Результаты отбора заявок — 31 марта 2025 года.
Полные тексты статей от приглашённых атворов заявок — до16 мая 2025 года.
Подробности:
https://sites.google.com/view/polecon/call-for-papers
Google
PolEcon Conference
Almaty Management University is honored to host the 3rd Conference «New Advances in the Political Economy of Development in Eurasia», from June 5th to June 7th, 2025. The event brings together many international scholars from leading universities of Eurasian…
Forwarded from Профессорский кот (Yulia Vymyatnina)
Недавно рассказывала о собранной коллегами базе бухгалтерской отчетности российских компаний. В четверг в рамках нашего Городского экономического семинара пройдет ее презентация.
13 февраля в 18:00 Дмитрий Скугаревский (ЕУСПб) представит доклад "Российская база бухгалтерской отчетности: коллекция финансовой отчетности всех российских компаний".
Аннотация: Представляем вам Российскую базу бухгалтерской отчетности (РББО, RFSD) — первую открытую альтернативу СПАРК-Интерфакс, Ruslana, Контур.Фокус и СБИС. До сих пор исследователям приходилось покупать доступ к данным, формировать выгрузку и импортировать данные в статистический пакет. База собрана из официальных источников — ЕГРЮЛ ФНС, архивных данных Росстата и отчетностей, полученных через Государственный информационный ресурс бухгалтерских отчетностей (ГИР БО). Сейчас РББО охватывает 2011–2023 годы и содержит 56,6 млн наблюдений. В докладе мы рассмотрим процесс создания РББО и ее применения в исследованиях: оценка процентных расходов российских компаний, оценка производственной функции предприятий обрабатывающей промышленности, а также новый способ оценить пространственное распределение ВВП России. РББО свободно доступна по адресу http://github.com/irlcode/RFSD
Мы приглашаем посетить семинар очно - заседание пройдет в Гагаринском зале ЕУСПб (адрес: Гагаринская, 6, вход с улицы Гагаринская). Но есть также возможность подключиться к семинару онлайн. В любом случае зарегистрируйтесь, пожалуйста, тут
13 февраля в 18:00 Дмитрий Скугаревский (ЕУСПб) представит доклад "Российская база бухгалтерской отчетности: коллекция финансовой отчетности всех российских компаний".
Аннотация: Представляем вам Российскую базу бухгалтерской отчетности (РББО, RFSD) — первую открытую альтернативу СПАРК-Интерфакс, Ruslana, Контур.Фокус и СБИС. До сих пор исследователям приходилось покупать доступ к данным, формировать выгрузку и импортировать данные в статистический пакет. База собрана из официальных источников — ЕГРЮЛ ФНС, архивных данных Росстата и отчетностей, полученных через Государственный информационный ресурс бухгалтерских отчетностей (ГИР БО). Сейчас РББО охватывает 2011–2023 годы и содержит 56,6 млн наблюдений. В докладе мы рассмотрим процесс создания РББО и ее применения в исследованиях: оценка процентных расходов российских компаний, оценка производственной функции предприятий обрабатывающей промышленности, а также новый способ оценить пространственное распределение ВВП России. РББО свободно доступна по адресу http://github.com/irlcode/RFSD
Мы приглашаем посетить семинар очно - заседание пройдет в Гагаринском зале ЕУСПб (адрес: Гагаринская, 6, вход с улицы Гагаринская). Но есть также возможность подключиться к семинару онлайн. В любом случае зарегистрируйтесь, пожалуйста, тут
GitHub
GitHub - irlcode/RFSD: The Russian Financial Statements Database (RFSD) is an open, harmonized collection of annual unconsolidated…
The Russian Financial Statements Database (RFSD) is an open, harmonized collection of annual unconsolidated financial statements of the universe of Russian firms in 2011-2024. It is the first open ...
👍10❤4🎉3