Forwarded from Путеводитель по доказательной политике
Анализ российских данных на внутрирегиональном уровне осложняется изменениями границ муниципальных образований, изменениями их типов, названий и кодов ОКТМО.
С 2018 по 2024 гг. изменилась муниципальная структура более 40 регионов:
◽️ есть регионы, где все муниципалитеты меняли свои типы - Магаданская и Курганская области, Ставропольский край, ЯНАО, Удмуртия и др.;
◽️есть регионы, где было большое количество изменений границ - Московская область, Пермский край и др. - около 3% муниципалитетов России в 17 регионах.
Масштаб изменений сильно осложняет сбор панельных данных по муниципалитетам. При этом процесс преобразований не прекращается. Но удобных открытых машиночитаемых данных о таких преобразованиях нет.
Поэтому мы собрали базу данных об изменениях муниципалитетов и их границ, теперь можно:
🔸прочитать в статье на habr о проблемах данных на муниципальном уровне и как мы собрали и объединили данные из Росстата и OpenStreetMap;
🔸скачать с сайта СберИндекса версионный справочник муниципальных образований и пространственный слой с границами муниципалитетов с 2018 г.
Эта информация может помочь:
◽️ геоаналитикам, заинтересованным в данных о границах муниципальных образований
◽️исследователям, которые работают с муниципальными данными
◽️при проектировании БДПМО 2.0. Росстата
С 2018 по 2024 гг. изменилась муниципальная структура более 40 регионов:
◽️ есть регионы, где все муниципалитеты меняли свои типы - Магаданская и Курганская области, Ставропольский край, ЯНАО, Удмуртия и др.;
◽️есть регионы, где было большое количество изменений границ - Московская область, Пермский край и др. - около 3% муниципалитетов России в 17 регионах.
Масштаб изменений сильно осложняет сбор панельных данных по муниципалитетам. При этом процесс преобразований не прекращается. Но удобных открытых машиночитаемых данных о таких преобразованиях нет.
Поэтому мы собрали базу данных об изменениях муниципалитетов и их границ, теперь можно:
🔸прочитать в статье на habr о проблемах данных на муниципальном уровне и как мы собрали и объединили данные из Росстата и OpenStreetMap;
🔸скачать с сайта СберИндекса версионный справочник муниципальных образований и пространственный слой с границами муниципалитетов с 2018 г.
Эта информация может помочь:
◽️ геоаналитикам, заинтересованным в данных о границах муниципальных образований
◽️исследователям, которые работают с муниципальными данными
◽️при проектировании БДПМО 2.0. Росстата
👍7❤5🔥5
Forwarded from Рюмочная ИПП
Зимняя школа ИПП в Санкт-Петербурге
27 января — 2 февраля мы проведем нашу традиционную зимнюю школу.
Участники под руководством кураторов пройдут путь от выработки идеи проекта до черновика статьи. Довести текст до публикации — при должном упорстве со стороны авторов — мы тоже поможем. Примеры публикаций, выросших из школьных проектов прошлых лет: 1, 2, 3.
В программе — лекции сотрудников ИПП, работа с данными, текстом и, наконец, презентация результатов. Дни будут насыщенными, совмещать школу с учебой или работой не получится, требуется очное присутствие.
Чтобы попасть на школу, нужно пройти конкурс: до 1 декабря мы будем принимать заявки с ответами на предложенные вопросы, а 15 декабря сообщим кандидатам, прошли ли они отбор.
Участие в школе бесплатное. Мы также оплачиваем проживание и обеды. Транспорт до места проведения (Санкт-Петербург) оплачивают участники.
Мы приглашаем всех, но будем отдавать предпочтение студентам старших курсов бакалавриата и тем, кто еще не защищал кандидатскую.
Подробности
27 января — 2 февраля мы проведем нашу традиционную зимнюю школу.
Участники под руководством кураторов пройдут путь от выработки идеи проекта до черновика статьи. Довести текст до публикации — при должном упорстве со стороны авторов — мы тоже поможем. Примеры публикаций, выросших из школьных проектов прошлых лет: 1, 2, 3.
В программе — лекции сотрудников ИПП, работа с данными, текстом и, наконец, презентация результатов. Дни будут насыщенными, совмещать школу с учебой или работой не получится, требуется очное присутствие.
Чтобы попасть на школу, нужно пройти конкурс: до 1 декабря мы будем принимать заявки с ответами на предложенные вопросы, а 15 декабря сообщим кандидатам, прошли ли они отбор.
Участие в школе бесплатное. Мы также оплачиваем проживание и обеды. Транспорт до места проведения (Санкт-Петербург) оплачивают участники.
Мы приглашаем всех, но будем отдавать предпочтение студентам старших курсов бакалавриата и тем, кто еще не защищал кандидатскую.
Подробности
❤7👨💻2
Forwarded from Совет молодых учёных ЭФ МГУ (СМУч)
Нобелевские лауреаты 2024: Дарон Аджемоглу, Джеймс Робинсон, Саймон Джонсон за изучение формирования институтов и их роли в процветании. Ура!
👍17❤7👎3🤔1
#wylse
Одна из недавно вышедших статей исследователей Университета Висконсина успела наделать много шума. Профессор Панле Джиа Барвик с командой выпустили в свет работу, исследующую влияние использования людьми приложений на их результаты по академической успеваемости и совокупному денежному доходу: «Digital Distractions with Peer Influence: The Impact of Mobile App Usage on Academic and Labor Market Outcomes» (текст прилагаем).
Исследование проходит на выборке китайских граждан. Используются два основных набора данных, связанных через национальные идентификаторы личностей (аналог нашего ЕСИА): административные данные групп первокурсников университетов за 2018–2020 годы и подробные данные об использовании телефонов от крупных поставщиков телекоммуникационных услуг в тех же локациях за 2018–2021 годы. Как утверждают авторы, эти данные позволяют изучить влияние сверстников на использование приложений студентами, а также оценить влияние использования приложений на академические результаты и результаты на рынке труда. Также Панле и команда используют корпоративные геокодированные данные о местоположении из систем GPS мобильных телефонов и данные полевых исследований. @evidencespace со своей стороны, конечно, поднял бы вопрос о том, насколько деперсонифицированными являются эти данные, а также насколько этично в таком случае использовать их для исследовательского анализа. Но вот основные результаты проведенного исследования:
1. Использование мобильных приложений заразительно: увеличение использования приложений соседями по комнате на одно стандартное отклонение увеличивает использование студентом приложения в среднем на 4,4%.
2. Увеличение использования человеком приложений на одно стандартное отклонение снижает его средний балл на 36,2% от среднего стандартного отклонения внутри когорты. Но, самое главное, снижает уровень его заработной платы на 2,3%!
3. Использование приложений соседями по комнате оказывает как прямое, так и косвенное (через поведенческие побочные эффекты) негативное влияние на средний балл и заработную плату.
4. Распространение политики ограничения игр несовершеннолетних в Китае на студентов колледжей может повысить их заработную плату на 0,7%.
5. Частое использование приложений вытесняет время, проведенное в учебных аудиториях, а также увеличивает пропуски лекций и опоздания на них.
@evidencespace
Одна из недавно вышедших статей исследователей Университета Висконсина успела наделать много шума. Профессор Панле Джиа Барвик с командой выпустили в свет работу, исследующую влияние использования людьми приложений на их результаты по академической успеваемости и совокупному денежному доходу: «Digital Distractions with Peer Influence: The Impact of Mobile App Usage on Academic and Labor Market Outcomes» (текст прилагаем).
Исследование проходит на выборке китайских граждан. Используются два основных набора данных, связанных через национальные идентификаторы личностей (аналог нашего ЕСИА): административные данные групп первокурсников университетов за 2018–2020 годы и подробные данные об использовании телефонов от крупных поставщиков телекоммуникационных услуг в тех же локациях за 2018–2021 годы. Как утверждают авторы, эти данные позволяют изучить влияние сверстников на использование приложений студентами, а также оценить влияние использования приложений на академические результаты и результаты на рынке труда. Также Панле и команда используют корпоративные геокодированные данные о местоположении из систем GPS мобильных телефонов и данные полевых исследований. @evidencespace со своей стороны, конечно, поднял бы вопрос о том, насколько деперсонифицированными являются эти данные, а также насколько этично в таком случае использовать их для исследовательского анализа. Но вот основные результаты проведенного исследования:
1. Использование мобильных приложений заразительно: увеличение использования приложений соседями по комнате на одно стандартное отклонение увеличивает использование студентом приложения в среднем на 4,4%.
2. Увеличение использования человеком приложений на одно стандартное отклонение снижает его средний балл на 36,2% от среднего стандартного отклонения внутри когорты. Но, самое главное, снижает уровень его заработной платы на 2,3%!
3. Использование приложений соседями по комнате оказывает как прямое, так и косвенное (через поведенческие побочные эффекты) негативное влияние на средний балл и заработную плату.
4. Распространение политики ограничения игр несовершеннолетних в Китае на студентов колледжей может повысить их заработную плату на 0,7%.
5. Частое использование приложений вытесняет время, проведенное в учебных аудиториях, а также увеличивает пропуски лекций и опоздания на них.
@evidencespace
😱6👍2😁2👎1
Скотт сожалеет, что нобелевская по экономике не ушла Виктору Черножукову, автору DoubleML, и попутно зовет всех на свои воркшопы, которые (теперь уже к нашему сожалению) почти бесплатны (1$) только для жителей Индии. Но напоминает, что у его проекта есть страница на гитхабе, где доступны тьюториалы и презентации воркшопов от всей банды Mixtape. Собственно, мы тоже напоминаем об этом репо, который с момента нашего последнего упоминания о нем обогатился новыми лабами и материалами.
@evidencespace
@evidencespace
❤7👍5👨💻3
Исследователь-аналитик (количественные исследования)
В проект по оценке результативности / эффективности мер государственной политики (policy evaluation) требуется аналитик с опытом проведения количественных исследований.
Что предстоит делать?
• Участвовать в разработке гипотез и дизайна исследования по оценке влияния мер и мероприятий на достижение запланированных эффектов
• Собирать и обрабатывать данные из открытых источников, оценивать их надежность для проверки гипотез
• Проводить количественные исследования (causal inference)
• Готовить доклады и аналитические материалы с результатами исследований
• Участвовать в разработке рекомендаций по итогам проведенного анализа
Мы бы хотели видеть в нашей команде количественного аналитика:
• С навыками работы с данными в R или Python (сбор и обработка, статистические библиотеки)
• С опытом проведения исследований в области causal inference
• С уровнем английского языка, позволяющего читать и анализировать научные статьи и доклады
Что мы можем предложить?
• Работу с аналитическими проектами, построенными на высоких (академических) требованиях к исследованиям при их последующем влиянии на принятие государственных решений
• Профессиональное развитие в области оценки программ и проектов на основе доказательных подходов
Возможность участвовать в разработке предложений в части реализации государственной политики
• Возможность работать с большим объемом уникальных данных
• Возможность совместить научные интересы с практикой
• Возможность коммуникации с органами исполнительной власти, ключевыми представителями экспертного сообщества, научных и стратегических центров
• Конкурентную оплату труда (обсуждается по итогу отбора) и возможность работать как удаленно, так и в комфортабельном офисе в центре Москвы
◾️◾️◾️
Резюме и отклики на вакансию можно присылать на почту:
e-policy@ya.ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11🔥4🤩2
Forwarded from Conspect
Один из самых, на мой взгляд, драматичных процессов в российском образовании - это сильное изменение образовательных траекторий, выражающееся в отказе от высшего образования. Оно происходит в виде снижения доли перехода из 9 класса в 10 класс - дети (вместе с родителями, конечно) выбирают СПО вместо старшей школы. Пять лет назад, в 2019 году, в 10 класс шли 54% городских школьников и 40% сельских, сейчас - 48% и 36%, то есть почти уже каждый третий.
Среди российского чиновничества и многих экспертов это движение считается очень хорошим - мол, все равно высшее образования это профанация, а тут сразу за станок. С одной стороны, чем плохо? С другой стороны - выпускники СПО сейчас намного реже, чем выпускники школ, поступают в вузы.
Среди первокурсников 2023 года, например, их только 13% (это с учетом заочного обучения - на очном еще меньше).
9 из 10 выпускников полной школы поступают в вузы - и только 2 из 10 выпускников СПО, считая тех, кто делает это через несколько лет после окончания колледжа.
На словах - в намерениях семьи - колледж может считаться способом "обойти ЕГЭ" и поступить в вуз через внутренние экзамены, но на деле молодые люди просто отказываются учиться дальше. Работа есть, зарплата есть - вуз подождет.
И хорошо, если колледж закончен. В СПО намного ниже, чем в вузах, "доходимость" - до конца СПО доползают примерно 80%, а по некоторым специальностям намного меньше.
Тренд на отказ от полной школы продолжается несколько лет. Сильнее всего он заметен в центральных регионах России. И особенно сильно - в сельских школах. В селах Владимирской области только 20% девятиклассников продолжают учебу в школе. За пять лет, с 2019 по 2023 год, здесь 8 человек из ста изменили свою образовательную траекторию в пользу СПО. То есть там, где было 30 человек в 10 классе, осталось 20, и так далее.
Из-за этого доля сельских школьников среди всех выпускников 11-х классов в России снижается и составляет уже меньше 20% при доле сельского населения 25%.
При этом изменения в регионах разные. В северных и многих окраинных они очень небольшие, а конверсия в 10 класс на удивление высокая - 60-70%. Думаю, что в отдаленных регионах она связана с недостатком СПО и их плохой транспортной доступностью, а не с желанием поступать в вуз.
В урбанизированных, с образованным населением и достаточно живыми экономиками регионах Среднего Поволжья переход в СПО намного более массовый - этому способствуют и доступность колледжей, и более привлекательный рынок труда.
Интересно, что минимальные изменения происходят в Москве. Несмотря на то что московские колледжи рекламируются изо всех сил и объективно выглядят намного лучше провинциальных, а поступление в 10 класс в московские школы, судя по жалобам родителей, становится сложнее год от года, изменения здесь не такие большие, чем в других развитых регионах России.
В общем, с одной стороны тренд, конечно, есть, и заметный. С другой - у него есть, на мой взгляд, два разных фактора. Один характерен для больших промышленных регионов, в которых, действительно, отказ от старшей школы поддерживается относительно неплохой структурой рынка профобразования и труда.
Второй - для регионов ЦФО и СЗФО, где на семьи влияют очевидные экономические дефициты. И надо ли там радоваться отказу от школы, большой вопрос, особенно если речь о сельской школе. Ведь в селе, где нет старшей школы, нет и хороших предметников, нет ролевой модели для младших подростков, так что возможности и желание детей получить больше образования будут убывать все быстрее и быстрее.
Данные сводов Минпроса, раскладка плиточной карты - Ивана Дианова.
Среди российского чиновничества и многих экспертов это движение считается очень хорошим - мол, все равно высшее образования это профанация, а тут сразу за станок. С одной стороны, чем плохо? С другой стороны - выпускники СПО сейчас намного реже, чем выпускники школ, поступают в вузы.
Среди первокурсников 2023 года, например, их только 13% (это с учетом заочного обучения - на очном еще меньше).
9 из 10 выпускников полной школы поступают в вузы - и только 2 из 10 выпускников СПО, считая тех, кто делает это через несколько лет после окончания колледжа.
На словах - в намерениях семьи - колледж может считаться способом "обойти ЕГЭ" и поступить в вуз через внутренние экзамены, но на деле молодые люди просто отказываются учиться дальше. Работа есть, зарплата есть - вуз подождет.
И хорошо, если колледж закончен. В СПО намного ниже, чем в вузах, "доходимость" - до конца СПО доползают примерно 80%, а по некоторым специальностям намного меньше.
Тренд на отказ от полной школы продолжается несколько лет. Сильнее всего он заметен в центральных регионах России. И особенно сильно - в сельских школах. В селах Владимирской области только 20% девятиклассников продолжают учебу в школе. За пять лет, с 2019 по 2023 год, здесь 8 человек из ста изменили свою образовательную траекторию в пользу СПО. То есть там, где было 30 человек в 10 классе, осталось 20, и так далее.
Из-за этого доля сельских школьников среди всех выпускников 11-х классов в России снижается и составляет уже меньше 20% при доле сельского населения 25%.
При этом изменения в регионах разные. В северных и многих окраинных они очень небольшие, а конверсия в 10 класс на удивление высокая - 60-70%. Думаю, что в отдаленных регионах она связана с недостатком СПО и их плохой транспортной доступностью, а не с желанием поступать в вуз.
В урбанизированных, с образованным населением и достаточно живыми экономиками регионах Среднего Поволжья переход в СПО намного более массовый - этому способствуют и доступность колледжей, и более привлекательный рынок труда.
Интересно, что минимальные изменения происходят в Москве. Несмотря на то что московские колледжи рекламируются изо всех сил и объективно выглядят намного лучше провинциальных, а поступление в 10 класс в московские школы, судя по жалобам родителей, становится сложнее год от года, изменения здесь не такие большие, чем в других развитых регионах России.
В общем, с одной стороны тренд, конечно, есть, и заметный. С другой - у него есть, на мой взгляд, два разных фактора. Один характерен для больших промышленных регионов, в которых, действительно, отказ от старшей школы поддерживается относительно неплохой структурой рынка профобразования и труда.
Второй - для регионов ЦФО и СЗФО, где на семьи влияют очевидные экономические дефициты. И надо ли там радоваться отказу от школы, большой вопрос, особенно если речь о сельской школе. Ведь в селе, где нет старшей школы, нет и хороших предметников, нет ролевой модели для младших подростков, так что возможности и желание детей получить больше образования будут убывать все быстрее и быстрее.
Данные сводов Минпроса, раскладка плиточной карты - Ивана Дианова.
🔥12❤3😢3
👉 Новые данные: База показателей рождаемости россиянок
База содержит показатели рождаемости в России для календарного периода с 1946 по 2022 годов и для реальных когорт женщин, родившихся в 1932–1988 годов. Показатели рассчитаны на основе данных, полученных от Росстата. Данные представлены в формате *.xlsx.
Показатели рождаемости для календарного периода с 1946 по 2022 гг.:
• Возрастные коэффициенты рождаемости по однолетним группам возраста и порядку рождения
• СКР по порядку рождения
• Cредний возраст матери при рождении ребенка и средний возраст матери при рождении ребенка по порядку рождения
Показатели рождаемости для поколений женщин с 1932 года рождения:
• Возрастные коэффициенты рождаемости по однолетним группам возраста для женских когорт 1932-1988 г.р. для всех рождений и по очередности рождений
накопленные коэффициенты рождаемости к возрасту x по однолетним группам возраста для женских когорт 1932-1988 г.р. для всех рождений и по очередности рождений
• Накопленные коэффициенты рождаемости к возрастам 40, 45 и 50 лет для женских когорт 1932-1984 г.р. для всех рождений и по очередности рождений
• Средний возраст матери при рождении ребенка к возрастам 40, 45 и 50 лет для женских когорт 1932-1983 г.р. для всех рождений и по очередности рождений
• Таблицы рождаемости для женских когорт 1932-1988 г.р.
• Вероятности рождения ребенка следующей очередности к возрастам 40, 45 и 50 лет для женских когорт 1932-1984 г.р.
распределение женщин по итоговому числу детей к возрастам 40, 45 и 50 лет для женских когорт 1932-1984 г.р.
@evidencespace
База содержит показатели рождаемости в России для календарного периода с 1946 по 2022 годов и для реальных когорт женщин, родившихся в 1932–1988 годов. Показатели рассчитаны на основе данных, полученных от Росстата. Данные представлены в формате *.xlsx.
Показатели рождаемости для календарного периода с 1946 по 2022 гг.:
• Возрастные коэффициенты рождаемости по однолетним группам возраста и порядку рождения
• СКР по порядку рождения
• Cредний возраст матери при рождении ребенка и средний возраст матери при рождении ребенка по порядку рождения
Показатели рождаемости для поколений женщин с 1932 года рождения:
• Возрастные коэффициенты рождаемости по однолетним группам возраста для женских когорт 1932-1988 г.р. для всех рождений и по очередности рождений
накопленные коэффициенты рождаемости к возрасту x по однолетним группам возраста для женских когорт 1932-1988 г.р. для всех рождений и по очередности рождений
• Накопленные коэффициенты рождаемости к возрастам 40, 45 и 50 лет для женских когорт 1932-1984 г.р. для всех рождений и по очередности рождений
• Средний возраст матери при рождении ребенка к возрастам 40, 45 и 50 лет для женских когорт 1932-1983 г.р. для всех рождений и по очередности рождений
• Таблицы рождаемости для женских когорт 1932-1988 г.р.
• Вероятности рождения ребенка следующей очередности к возрастам 40, 45 и 50 лет для женских когорт 1932-1984 г.р.
распределение женщин по итоговому числу детей к возрастам 40, 45 и 50 лет для женских когорт 1932-1984 г.р.
@evidencespace
demogr.hse.ru
База показателей рождаемости россиянок
👍9❤6🔥3👎1
Forwarded from Рюмочная ИПП
Корпус текстов российского законодательства для исследователей
Мы обновили наш открытый корпус текстов российского законодательства RusLawOD (github, huggingface). Теперь он содержит более 280 тысяч документов — с начала современной российской государственности (1991 год) по декабрь 2023 года. Корпус включает как сами тексты, собранные из правительственного источника, так и их морфосинтаксическую разметку, которая позволяет изучать их лингвистические параметры (разметка сделана при помощи средств, опубликованных коллегами из ВШЭ). Подробности — в препринте.
Результаты наших исследований читаемости правовых актов изложены в аналитической записке и в статье в журнале «Право». Иллюстрация к этому посту — это тизер новой статьи, которая готовится к публикации в журнале «Правоведение».
***
В феврале основной автор наших работ по читаемости, Денис Савельев, будет рассказывать о методах обработки правовых текстов в программе ДПО Эмпирические методы в правовых исследованиях — присоединяйтесь!
Мы обновили наш открытый корпус текстов российского законодательства RusLawOD (github, huggingface). Теперь он содержит более 280 тысяч документов — с начала современной российской государственности (1991 год) по декабрь 2023 года. Корпус включает как сами тексты, собранные из правительственного источника, так и их морфосинтаксическую разметку, которая позволяет изучать их лингвистические параметры (разметка сделана при помощи средств, опубликованных коллегами из ВШЭ). Подробности — в препринте.
Результаты наших исследований читаемости правовых актов изложены в аналитической записке и в статье в журнале «Право». Иллюстрация к этому посту — это тизер новой статьи, которая готовится к публикации в журнале «Правоведение».
***
В феврале основной автор наших работ по читаемости, Денис Савельев, будет рассказывать о методах обработки правовых текстов в программе ДПО Эмпирические методы в правовых исследованиях — присоединяйтесь!
🔥11❤3👍2
Forwarded from ЦенСИБ (ex-ЛССИ)
#методы #сausal #inference #учебники #публикации
Ведущий научный сотрудник ЛССИ Борис Соколов недавно выложил в публичный доступ черновую версию своего обзора основных целевых величин (эстимандов), использующихся в статистическом каузальном анализе: АТЕ, АТТ, АТС и прочиетыквенные LATE с CATE. Хотя это ещё не полноценная статья, прошедшая рецензирование, данный текст может оказаться полезным как студентам, так и "взрослым" исследователям или прикладным аналитикам, применяющим соответствующие методы на практике - благо на русском языке литературы по теме откровенно мало.
P.S. Если вы найдёте в рукописи ошибки, неточности, упущения и т.д., или у вас будут иные идеи насчёт того, как её улучшить, можно написать напрямую автору на электронную почту - он открыт к обратной связи и конструктивной критике.
Ведущий научный сотрудник ЛССИ Борис Соколов недавно выложил в публичный доступ черновую версию своего обзора основных целевых величин (эстимандов), использующихся в статистическом каузальном анализе: АТЕ, АТТ, АТС и прочие
P.S. Если вы найдёте в рукописи ошибки, неточности, упущения и т.д., или у вас будут иные идеи насчёт того, как её улучшить, можно написать напрямую автору на электронную почту - он открыт к обратной связи и конструктивной критике.
👍9🔥6🎉6
Forwarded from Если быть точным
Хотите знать, что происходит в России на уровне районов? У нас есть для этого уникальный датасет! Сегодня мы его обновили – и сделали гораздо удобнее
Полгода назад мы опубликовали датасет с муниципальной статистикой. За это время его скачали несколько тысяч раз — это самый популярный набор в каталоге. Сегодня вышла новая версия. Вот что изменилось:
🔸 Внесли данные за 2023 и 2024 годы, которые появились в базе Росстата в конце лета этого года. Теперь в датасете около 300 млн записей.
🔸 Добавили 36 новых показателей — например, долю детей в детских садах и число индивидуальных предпринимателей в районе. Посмотреть все показатели и скачать таблицы с данными можно тут.
🔸 Поправили ошибки прошлой версии. Например, исправили года и формы собственности — эти несостыковки были в исходных данных Росстата. А еще проверили 79% записей на аномальные значения и отметили их в отдельном столбце.
🔸 Главное — добавили стабильные идентификаторы районов, которые учитывают изменения в муниципальной структуре с 2010 года. В 40% районов страны изменились границы муниципалитетов, их типы, названия и коды ОКТМО. Это усложняет сбор длинных рядов со значениями показателя в определенном районе. Теперь исследователи могут не тратить свое время на такую работу и сразу переходить к анализу данных.
Если у вас есть пожелания по форматам данных или новым наборам — напишите в бот @tochno_bot. Ваши замечания мы учтем в новых обновлениях.
⚫️ Чтобы у нас получилось собирать больше датасетов — поддержите нас. Это можно сделать через Boosty или Patreon.
Полгода назад мы опубликовали датасет с муниципальной статистикой. За это время его скачали несколько тысяч раз — это самый популярный набор в каталоге. Сегодня вышла новая версия. Вот что изменилось:
Если у вас есть пожелания по форматам данных или новым наборам — напишите в бот @tochno_bot. Ваши замечания мы учтем в новых обновлениях.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👏3🎉3❤2
Forwarded from Small Data Science for Russian Adventurers
#книга
Emil Hvitfeldt "Feature Engineering A-Z"
Открытая книга по предобработке данных и генерации признаков. Пока ещё до конца не дописана, но по деформации признаков, категориальным признакам, пропускам и текстовым признакам информация есть. Примеры кода на R и Python.
https://feaz-book.com/
Emil Hvitfeldt "Feature Engineering A-Z"
Открытая книга по предобработке данных и генерации признаков. Пока ещё до конца не дописана, но по деформации признаков, категориальным признакам, пропускам и текстовым признакам информация есть. Примеры кода на R и Python.
https://feaz-book.com/
🔥10❤5
Хорошие новости: J-PAL продолжают запускать бесплатные курсы для специалистов в области оценки и #ebpm (об одном из них рассказывали ранее, надеемся, вы (как и мы) смогли принять участие и получили пользу от прошлого курса). Считаем это достойной практикой. В этот раз тема курса напрямую связана с прикладной областью J-PAL: борьба с бедностью - «The Challenges of Global Poverty». Среди тем: poverty traps (ловушки бедности) и эксперименты, влияние на доходы населения таких факторов как: здравоохранение, образование, питание, предпринимательство. Отдельный блок выделен институтам и политике.
Среди менторов курса Абхиджит Банерджи и Эстер Дюфло - лауреаты Нобелевской премии по экономике 2019 года (присуждена «за экспериментальный подход в борьбе с бедностью»). Курс стартует 21 января и продлится до 30 апреля 2025 года. Это уникальная возможность для всех, кто интересуется вопросами снижения уровня бедности и роста доходов.
➡️ Регистрируйтесь вместе с нами.
@evidencespace
Среди менторов курса Абхиджит Банерджи и Эстер Дюфло - лауреаты Нобелевской премии по экономике 2019 года (присуждена «за экспериментальный подход в борьбе с бедностью»). Курс стартует 21 января и продлится до 30 апреля 2025 года. Это уникальная возможность для всех, кто интересуется вопросами снижения уровня бедности и роста доходов.
@evidencespace
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤2👍1
Отличная обзорная лекция по причинно-следственному выводу от Лиззи Сильвер (дата-аналитика WSP) в рамках недавно прошедшей конференции PyCon AU 2024. В лекции Лиззи кратко рассказывает о причинно-следственных связях, а после проводит обзор нескольких программных пакетов python для построение таких связей:
➤ py-tetrad
➤ causal-learn
➤ tigramite
➤ causalnex
➤ cdt (causal discovery toolbox)
Пакеты частично перекрываются, но имеют разные акценты: каждый реализует по крайней мере один алгоритм, не охватываемый другими пакетами, что делает их полезными в разных ситуациях. Репозиторий лекции здесь.
@evidencespace
➤ py-tetrad
➤ causal-learn
➤ tigramite
➤ causalnex
➤ cdt (causal discovery toolbox)
Пакеты частично перекрываются, но имеют разные акценты: каждый реализует по крайней мере один алгоритм, не охватываемый другими пакетами, что делает их полезными в разных ситуациях. Репозиторий лекции здесь.
@evidencespace
🔥13❤2👨💻2