Губернаторы России ч.2 (начало): фамилии.
wanderv — 06.12.2020 На идею данного поста меня натолкнуло обсуждение в комментариях первой части с kilativ. Идея такая: можно же с помощью онлайновых сервисов узнать, насколько распространена та или иная фамилия, а также посмотреть её примерное распределение по регионам России. Я это проделал и искомые аномалии таки были найдены :).Методика исследования. Я брал фамилию губернатора и запускал поиск во Вконтакте (с учётом мужского и женского рода). Поиск сразу показывает, сколько всего людей с такой фамилией. На основе этого числа я определял частоту этой фамилии в русскоязычном мире. Затем я брал онлайновай сервис https://forebears.io - один из крупнейших подобных сайтов, позволяющий посмотреть на карте сколько людей с данной фамилией в каждой стране, а для России есть и распределение по регионам. Отсюда я брал четыре числа: кол-во вообще, кол-во в России, кол-во в топовом регионе России и кол-во в регионе рождения данного губернатора. Заодно брал и топовый регион данной фамилии. Сервис позволяет вводить фамилию кириллицей, но автоматически преобразовывает в латиницу, поэтому пришлось перебирать не только в случае отличий в роде фамилии, но и е/ё, и/й в i/y и некоторые другие варианты. Все варианты суммировались и записывались в таблицу.
Так выглядит часть одной из таблиц.
2.1 Редкость фамилий.
Первое, что я рассчитал - это то, сколько людей есть с той или иной фамилией по данным Вконтакте. Типизация следующая: если число людей с такой фамилией исчисляется десятками, то это очень редкая фамилия, если сотнями, то просто редкая, тысячами - обычная, десятками тысяч - частая, сотнями тысяч - распространённая. Десятки/сотни/тысячи и т.д. имеются в виду если их 3 и больше. Таким образом, очень редкие от 0 до 299, редкие от 300 до 2999 и т.д.
Результаты получились довольно любопытные. Логично предположить, что в списке губернаторов самые распространённые фамилии должны встречаться чаще всего. И правда, у нас есть три Никитина и два Николаева, хотя самые популярные русские фамилии Иванов, Петров, Смирнов, Кузнецов и др как-то вот не смогли пробраться на такие посты. Однако же губернаторов с рапространёнными фамилиями оказалось всего 10:
Васильев из Кировской области - 897 тыс. в ВК.
Воробьёв из Московской области - 303 тыс. в ВК (на грани прошёл).
Миронов из Ярославской области - 600 тыс.
Морозов из Ульяновской области - 663 тыс.
Никитины из Нижегородской, Новгородской и Тамбовской областей - 423 тыс.
Николаевы из Чувашии и Якутии - 520 тыс.
Орлов из Амурской области - 540 тыс.
Давайте посмотрим на противоположный конец спектра. И вот здесь мы видим ту самую аномалию, которую, накконец, удалось поймать. Ведь по банальной теории вероятности, люди с очень редкими фамилиями, если уж и попадутся, то, ну один, дву, ну, три. На самом же деле губернаторов с очень редкими фамилиями даже больше, чем губернаторов с фамилиями, распространёнными по всей стране! Их 11.
Жвачкин из Томской области - 250 человек.
Здунов из Мордовии - 176.
Калиматов из Ингушетии - 276.
Куйвашев из Свердловской области - 57.
Кумпилов из Адыгеи - 69 человек.
Парфенчиков из Карелии - 85.
Паслер из Оренбургской области - 45.
Развожаев из Севастополя - 108.
Текслер из Челябинской области - всего 18 (!).
Уйба из Коми - 53 человека.
Шапша из Калужской области - на всю Россию 13 человек!!
В принципе я ожидал вот этих Паслеров и Текслеров в категории очень редких, но не ожидал, что Текслеров найдётся всего 18 штук. Но бесспорный лидер рейтинга, конечно, Шапша! Их, Шапш, Вконтакт смог наскрести всего лишь 13 человек. В принципе, можно понять фамилии отдельных этнических меньшинств (хотя насчёт Уйбы у нас будет отдельный разговор). Также, понятна редкость Развожаева, видимо, ошибочный вариант Развозжаева, пошедший в жизнь. но также удивила редкость фамилий Жвачкина, Парфенчикова и Куйвашева. Поначалу казалось, что этих то должно быть много, ан нет.
Губернаторов с редкими фамилиями оказалось 20 штук. Из них отмечу Бездудного из Ненецкого АО и Бречалова из Удмуртии, которые находятся у нижней границы с 314 и 395 соответственно. В эту категорию также попало большинство остальных представителей национальных меньшинств. Губернаторов с обычными фамилиями средней распространённости 25 штук (Собянин в их числе), а с частыми фамилиями 19 (Кадыров, кстати, среди них). Итого выходит, что губернаторы с редкими и очень редкими фамилиями составляют 31 из 85 или 36,5%. Более трети! При этом губернаторов с частыми и распространёнными фамилиями даже меньше - 29 из 85 или 34,1%. Согласитесь, это странно.
Частые/редкие фамилии.
Легенда:
Красные - очень редкие.
Розовые - редкие.
Белые - обычные.
Зелёные - частые.
Синие - самые распространённые.
Интересно, что на карте даже виднеется некоторое географическое разделение. Редкие и очень редкие кучкуются на севере, на Урале и в Восточной Сибири.
2.2 Российские и нероссийские фамилии.
Благодаря сервису https://forebears.io также стало хорошо видно, являются ли фамилии, свойственными для России или для других стран. Критерий я установил простой: если более 50% людей с такими фамилиями живут в России, значит, фамилия российская. Нероссийские я также разделил на те, где Россия всё же в лидерах по количеству, хоть и не дотягивает до 50%, и те, которые свойственны другим странам. Местами обнаружились забавные сюрпризы :).
Фамилии, которые встречаются в другой стране, чаще, чем в России:
Бездудный из Ненецкого АО - на Украине Бездудных чуть больше.
Гольдштейн из Еврейской АО - тут ожидаемо Россия в хвосте, на первом месте США, на втором Израиль.
Дрозденко из Ленинградской области - понятно, Украина.
Кадыров из Чечни - в Узбекистане Кадыровых более, чем в полтора раза больше, чем в России!
Калиматов из Ингушетии - в Казахстане больше.
Меликов из Дагестана - в Таджикистане Меликовых раза так в ТРИ больше, чем в России, и Узбекистан дышит в затылок России.
Моор из Тюменской области - Германия №1, США №2.
Паслер из Оренбургской области - Германия, конечно.
Руденя из Тверской области - в Белоруссии их раз так в 5 больше.
Старовойт из Курской области - Украина далеко впереди (раза в 2) по Старовойтам.
Текслер из Челябинской области - первая тройка выглядит удивительно: США / Израиль / Австрия. А российских Текслеров сервис не знает вообще.
Томенко из Алтайского края - предсказуемо на Украине в разы больше.
Уйба из Коми - фамилия Уйба скорее российская, однако губернатор заявляет, что фамилия его родителей Уйбо - а вот это уже фамилия из Эстонии.
Усс из Красноярского края - Польша и Белоруссия впереди.
Шапша из Калужской области - попадается на Украине куда чаще, особенно учитывая, что в России по данным сервиса есть только 1.
Фамилии с размытыми корнями (менее 50% в России, но Россия всё же лидирует в списке стран):
Алиханов из Калиниградской области - на втором месте Казахстан, несильно отставая.
Копин из Чукотского АО - видимо пал жертвой схожести фамилии со словами из других языков, есть понемногу в пачке стран, на 2 месте, сильно отставая, Украина.
Цыбульский из Архангельской области - на 2 месте Украина.
Итого фамилий, несвойственных для России, набирается 18 из 85 или 21,2% - чаще, чем каждый пятый. Первую часть исследования я сделал ранее и поэтому при определении новиопов не учитывал данную информацию. Очевидно, что список новиопов придётся расширить...
Нероссийские фамилии.
Красные - нероссийские фамилии.
Розовые - размытые между странами фамилии.
Так как материал получается большой, то продолжение этой части будет отдельным постом...
|
</> |