RUElectionData – Telegram
RUElectionData
1.61K subscribers
48 photos
672 files
42 links
Open data on Russian elections
Download Telegram
осталось два участка....
Один упорный участок из города Обухів Киевской области все никак не сдается. Между тем в таблицу, похоже, вносятся какие-то изменения (потом посмотрим, какие)
все участки загрузили, а изменения все падают и падают.
Оказывается, еще вчера был подписан протокол с итогами. Все, выгрузок больше не будет. Эти однажды приведу к более компактному виду и уберу из канала. Если кому надо 4 гигабайта сырых выгрузок — сообщите.
Убрал отдельные сообщения с выгрузками. Вот все данные канала по этим выборам одним архивом в формате TSV (UTF-8, CRLF):
В этом архиве исключены пять первых выгрузок (до 20:35) с ошибочными данными для кандидатов-однофамильцев, убран мусор в номерах участков и унифицированы заголовки столбцов в соответствии с последней выгрузкой.
collect.log
59.3 KB
Лог сборки (UTF-8, CRLF) со всеми изменениями (кроме исключения ошибочных данных).
История изменений каждого участка на основе этих данных, в формате JSON text sequence (UTF-8, CRLF):
То же самое в формате TSV (UTF-8, CRLF) — все данные, относящиеся к заданному участку (одной и той же паре «ТВО №», «№ ВД»), идут подряд:
aggregate.log
27.7 KB
Лог агрегации (UTF-8, CRLF) с отметками о странностях в выгрузках (судя по всему, некоторые выгрузки заставали сайт в процессе обновления).
Скрипты сборки и агрегации (простые), включая конвертацию в форматы CSV и JSON lines, которые я для простоты выкладывать не стал: https://gist.github.com/388d74776714f7b9e590a8b39094bf93
Наконец, последняя сырая выгрузка из канала (соответствующая файлу 20190406T1151Z.tsv в архиве) на случай, если кому-то нужно сверить обработку со старым форматом:
Shameless plug: сегодня файлы в канал выгружает https://github.com/alexshpilkin/hattifnatt — синхронизация каталога с телеграм-каналом.