Перепись 2021. Национальный состав РФ по населенным пунктам (база данных)
sevabashirov — 03.08.2024(КДПВ, оригинал по ссылке)
"Прорывом года" в стихийно сложившемся кружке картографо-демографов Рунета теперь уже однозначно стал профессиональный лингвист, картосоставитель и просто адекватный человек, что в наше время уже само по себе ценно, Юрий Коряков aka jirzik. Вслед за картой языков России (предтечей соответствующего атласа, разрабатываемого при его участии) он выложил на своем сайте то, о необходимости чего так давно твердили
Сразу для тех, кто скажет, что база данных Росстата - это не база, а кринж: во-первых, да, я в курсе, спасибо. Помимо проблем самой переписи, по качеству которой уже кто только не проехался, Росстат совершенно не заинтересован делать эти данные доступными и удобными для широкого круга пользователей, и это нужно помножить на регионалов, которые совместными усилиями в перечне учетных единиц (МО и НП) формируют такой адок, на который противопоказано смотреть слабонервным. А во-вторых, повторюсь: у официальных данных, какими бы неполными и искаженными они ни были, есть одно неоспоримое преимущество: они есть, и альтернативных не предвидится. Хоть что-то - все равно лучше, чем ноль, поэтому "shut up and calculate" ©.
Некто Алексей (знал бы @никнейм, дал бы ссылку) в комментариях в ТГ собрал все выгрузки в один файл, над которым уже я взялся танцевать с бубном и приводить в пригодный для работы вид. Кстати, параллельно с этим acer120 и Станислав @stalad Адамайтис уже начали формировать кое-какие карты в разрезе поселений на этой основе. В итоге нашаманил следующее - берите, пользуйтесь. Сорри за мелкий шрифт, сами понимаете, почему.
Сводная таблица по всем населенным пунктам и муниципальным образованиям (просмотр не доступен из-за размера, только скачивание):
https://drive.google.com/uc?export=download&id=1MANtin1ZWFUqqecm63dBVUBaGOop4CmN - скачать (14,4 МБ)
Таблицы по АТЕ-2 - административным единицам 2-го уровня (муниципальные районы и округа, городские округа) с суммированием по субъектам: исходные данные, % от всего населения, % от указавших (194 этноса и субэтноса + "другие" + "нет нац-ти"):
https://docs.google.com/spreadsheets/d/1fsGckQ71syOsoojGKrOxr2Mha3oe5ShV - просмотр онлайн
https://drive.google.com/uc?export=download&id=1fsGckQ71syOsoojGKrOxr2Mha3oe5ShV - скачать (6,2 МБ)
Для порядка - опубликованные в прошлом году таблицы по субъектам с процентами, разбивкой город/село и моделью пересчета (подробности в постах по ссылкам 4.1, 4.2, 4.3, с ними полезно ознакомиться и для работы с новыми таблицами):
https://docs.google.com/spreadsheets/d/1ySRD5_gshS1fKoG84fqLJwDeVy3A0vfg - просмотр онлайн
https://drive.google.com/uc?export=download&id=1ySRD5_gshS1fKoG84fqLJwDeVy3A0vfg - скачать (3,0 МБ)
Ну и тогда уж самые первые таблицы - население по АТЕ-2 и по населенным пунктам более 3000 чел., а также исходник с муниципальными образованиями (без национального состава, с разбивкой м/ж, подробности в посте по ссылке, также рекомендуется к прочтению):
https://docs.google.com/spreadsheets/d/1gO1XlZ1Km9c_seu0qN31a1WjM5TEMDJq - просмотр онлайн
https://drive.google.com/uc?export=download&id=1gO1XlZ1Km9c_seu0qN31a1WjM5TEMDJq - скачать (1,8 МБ)
___
Главное, на что должен обратить внимание - в 12 тысячах строчек (из 172 тысяч - это все НП+МО всех уровней) свежевыгруженные микроданные расходятся с уже имеющимися и не менее официальными. Внезапно. А именно - сумма по всем 146 "легитимным" национальностям, а также по колонкам "другое" (чуть менее чем полностью состоящее из ответов типа "гражданин РФ") и "нет нац. принадлежности" больше, чем официально объявленное количество заполнивших графу национальности. И зачастую даже больше, чем вообще всё официальное население. Примеры:
1) Деревня Сызганка, Пермский край: население - 328, указали - 314, не указали - 14. Русские - 286, марийцы - 129, коми-пермяки, татары, нет нац-ти - по 1, итого - 418.
2) Аул Хачемзий, Адыгея: население - 655, указали - 650, не указали - 5. Адыгейцы - 459, черкесы - 284, русские - 15, украинцы - 1, итого - 759.
3) Село Пришиб, Башкортостан: население - 921, указали - 920, не указали - 1. Русские - 452, башкиры - 280, татары - 196, немцы - 83, украинцы - 16, армяне - 7, казахи - 3, грузины, киргизы, узбеки - по 1, итого - 1040.
4) Село Молька, Иркутская область: население - 659, указали - 650, не указали - 9. Русские - 502, буряты - 206, азербайджанцы - 3, грузины, нет нац-ти - по 2, армяне, белорусы, узбеки, ханты - по 1, итого 719.
И таких тысячи. Какого хрена - вопрос к Росстату, в некоторых случаях можно подумать на двойной учет национальностей (один и тот же человек попадает в несколько граф), в других сложно такое представить. При этом цифры бьются друг с другом по иерархии уровней АТД, и каким образом ранее опубликованные официальные данные (где сумма точно совпадает с объявленной) получились из вот этих (где в целом по РФ вышло на 112 тыс. человек больше) - неизвестно. Самое плохое, что это искажает процентовки этносов на микро-уровне, и как "очистить" данные от дублей, чтобы хотя бы выйти на официальную же цифру суммарного населения - непонятно.
UPD: jirzik пояснил, что таки да, один человек мог указать две этнические принадлежности, и если в публикациях прошлых лет (по субъектам) вторые ответы этих людей проигнорированы (и сумма сходится), в нынешних всё слито в общий котёл, так что в этих населенных пунктах сумма долей всех этносов действительно превышает 100%.
Тем не менее, на районном уровне эти искажения хоть и сохраняются в абсолютном значении, но в процентах уже чаще всего не настолько чудовищны, поэтому с таблицей по АТЕ-2 можно работать: в ней на одной вкладке я посчитал все проценты от суммарного официального населения (в т.ч. 11% не указавших), UPD: а на другой - от указавших (но "другие", которые "граждане РФ" + "россияне" + "дагестанцы" + россыпь всяческих ямайцев, а также самоназванные "безнационалы" идут наравне с "корректными ответами"). Сумма процентов в указанных случаях больше 100%.
Если кто-то хочет застолбить за собой производство конкретных карт по этим данным (кстати, там есть колонка кодов ОКТМО, которая может помочь при автоматизированном составлении), и при этом готов об этом сразу сказать публично (а все-таки многие любят выпускать карты "без предупреждения"), можно это сделать в комментах, обезопасив других от двойной работы.
acer120, ad_aga, an_nu_ta, andaarus, artyomdudin, asa_nisi_masa_1, basel67, beatris_pai, beldmit, byg, demos2022, denalt, drowbreaker, geonike, gooodvins, hrecj, ivbum, jaredfisher, jirzik, kaptbl, kireev, kneiphof, kv_fenix, leobashmak, luol_carmelo, marshosaurus, masagget, mockingbird19, mustardpotatoes, n_avdeev, nikola_rus, nikolamsu, nozhi_vilochnik, oleg_lisowski, pachem, pollotenchegg, reissig, saugardas, shanggyangg, statistic_rus, tdm11, temur25, timbes5, tolsek, urbansavager, wanderv, yuliana1993, yurachkivsky_dn, zeit22, zoltagora