О возможных масштабах фальсификации при подведении итогов выборов
zhu_s — 11.12.2011 ЦИК опубликовал предварительные итоги выборов 4 декабря, что дает возможность подвергнуть их какой-нибудь статобработке на предмет выявления «артефактов». В интернете блуждают два типа графиков, доказывающих наличие «вбросов» и краж уже поданных голосов в пользу «Единой России». Первый – наличие почти линейной зависимости числа голосов поданных за ЕР от явки избирателей на участок (тут и тут), второй – графики плотности распределении участковых избирательных комиссий (УИК) по проценту голосов поданных там за ту или иную партию.Для всех партий, кроме ЕР, они имеют ярко выраженные пики (процент поданных на разных участках голосов концентрируется вокруг определенного значения, близкого к среднему для данной партии), тогда как для ЕР это процент размазан в широком диапазоне, а сама плотность распределения – плоская и сильно ассиметричная, с «хвостом» в ту или иную строну (например, тут, а также во множестве иных мест). Асимметрия плотности «влево», как мы увидим ниже, говорит о большом числе голосов, набранных на избирательных участках с «аномально» сильной поддержкой данной партии, вправо – о том, что на ряде участков партия сталкивается с «аномально» сильной конкуренцией. Первое позволяет заподозрить «вбросы», второе – напротив, «кражу» голосов, хотя и то другое, как мы тоже увидим ниже, не обязательно, а может определяться неравномерным распределением сторонников данной партии по территории).
Так вот, борцы за народное счастье, равно как и за чье-то право порулить, поворовать, пожульничать, меня запинают (если вдруг зачем-то сюда забредут). Но первый вид графиков, о которых речь шла выше (рост числа приверженцев ЕР по мере роста процента явки), меня совершенно не убеждает. Это - эффект «молчаливого большинства». Люди, которые собираются голосовать протестно, за оппозиционную партию, явятся на выборы в полном составе, те же, которые в целом ничего не имеют против существующей власти, или, по крайней мере, не видят ей приемлемой альтернативы, с большой вероятностью, предпочтут провести этот день более содержательно. Так что нет ничего удивительного, что процент голосов поданных за партию власти, описывается почти линейной функцией от числа явившихся (вспомним слоган кампании Ельцина 1996 – «голосуй, или проиграешь», скалькированный с choose or loose Клинтона в 1992 – явный призыв к «молчаливым безбилетникам», уверенным, что все решат как надо и без них).
Что же касается графиков плотности распределения поданных голосов, который у Яблока «острый», а у ЕР – размазанный, то это явное задуривание головы тому, кто никогда с такими графиками по жизни не общался. Ведь если за вас на каждом участке проголосует 1 человек, то вы получите график с острым пиком – 100% в одной точке. Если же вы получаете большой процент голосов, то ясно, что при том же относительном разбросе доля участков, приходящихся на каждый конкретный процент поданных голосов, будет маленькая, а кривая распределения «размазанная». Ладно, чувствую, что совсем запутал, перехожу к цифрам.
Мне кажется, довольно-таки наглядно показывают различия в «технологии» сбора голосов кривые, показывающие рост доли собранных партией голосов в зависимости от количества участков с определенным уровнем поддержки. Проще – на графике ниже видим, например, на участках, где за ЕР голосовало не более 40% голосов, партия набрала примерно 15% из общего количества своих (примерно) 50% голосов, следующие примерно 10% - на участках, где за нее голосовало от 50 до 60%, и т.д. Иными словами – кривые на рисунках ниже – это кумулятивные кривые к соответствующим плотностям распределения.
Форма такой кривой может рассказать о результатах голосования побольше, чем плотность, форма графика которой, как я уже написал выше, существенно зависит от абсолютного числа проголосовавших за партию (с его ростом плотность «сплющивается», а здесь этот эффект исключен). В идеале – когда все участки идентичны, мы имели бы некие наклонные симметричные кривые вокруг вертикального центра, в пределе (когда дисперсия избирателей стремится к нулю) стремящиеся к вертикали. Существенные отклонения от «идеальной» формы свидетельствуют, с одной стороны, о различии предпочтений избирателей по регионам страны (в пределах одного региона они должным быть меньше), а так же о наличии «аномальных» ИК, что дает повод заподозрить подтасовки. Ну все, смотрим фактуру.
Россия (распределение 64,626 тыс. поданных голосов, 59.2% от внесенных в списки избирателей в 135 ИК 1-ого уровня, т.е. следующего поле ЦИК).
10% голосов (т.е. пятая часть), набраны в регионах с более чем 70% проголосовавших за ЕР. Это явный вклад «любителей партии власти» из Башкортостана, Татарстана, Мордовии, Тывы, Ямала и Чукотки, ну и разумеется с Кавказа. По форме кривой загибающейся вправо и говорящей о том, что партия набирает слишком много голосов за счет участков с вильной поддержкой, назовем это S-эффектом. «Партийная копилка», очевидно, пополнилась за счет голосов за КПРФ и ЛДПР, имеющих «левую» асимметрию плотности распределения, говорящую об аномально большом числе регионов со слабой поддержкой этих партий, пусть это будет назваться J-эффект из-за наличия «загогулины» внизу соответствующих кривых.
Еще одна партия, демонстрирующая ярко выраженный S-эффект – сбор значительной части голосов за счет сильной поддержки в ограниченном числе регионов – это Яблоко. Для нее, ту же роль, что оленеводы Чукотки и жители Кавказских гор для ЕдРа, играют жители столиц. В Москве партия набрала проходной балл, а в Питере с двузначной долей собранных голосов даже обошла жириновцев. Но в регионах этот реликт перестроечной эпохи уже никто не помнит. Посему общий результат – честные, но провальные 3.4%
Москва (распределение 4,327 тыс. поданных голосов, 60.2% от внесенных в списки избирателей в 125 ИК 2-ого уровня, созданных в городе).
А вот тут J-эффект (наличие участков, выделяющихся аномально низким уровнем поддержки) показала единственная из партий - ЕР. В чем дело? Видимо, возможны два предположения. Либо внизу, на уровне поддержки ЕР от 25 до 40 показаны «честные» результаты, а более высокие связаны с приписками. Но на это не очень похоже. Тогда кривая скорее имела бы S-образный вид, близкий к вертикальному на «честном» участке, и загибающийся на «поддельном». Кроме того, с наблюдателями в Москве дело обстояло явно лучше, чем на просторах Чукотки и Ямала, и фальсификация скорее концентрировалась бы в небольшом количестве участков с аномально сильной поддержкой, т.е. с мощным «загибом» вверху, как на российском графике.
А так, наоборот - большая часть кривой почти вертикальна на уровне поддержки около 50% с небольшим «загибом» в самом верху. Здесь, по-видимому, как раз сказалась сильная поддержка Яблока на отдельных участках (у него снова S-кривая), имевшая для заведомо непроходной партии смысл протестного голосования «против всех», которая и отобрала голоса на соответствующих участках у ЕР. Правда, частично это компенсировалось более слабой поддержкой другой «протестной» партии – ЛДПР.
В итоге, несмотря на отсутствие кавказского единогласия в Москве, средний уровень поддержки ЕР здесь лишь чуть ниже среднероссийского, а медиана, не учитывающая электоральный экстрим окраин – даже выше. Для остальных партий кривые распределения здесь близки к «идеальным» (т.е. вертикальным) и с очень никой вариацией вокруг них.
Подведем итоги. Возможно, в качестве первого приближения к «истинным» результатам голосования можно было бы ориентироваться на медианное число голосов, поданных за партию (т.е. такой уровень поддержки, что на половине ИК он был ниже, а на другой половине выше). Это позволят отсечь S и J-эффекты, возможно, не всегда связанные с фальсификацией, как в случае Яблока, и все же вводящие в средние показатели (как в средний доход) некую необъективность.
ЕР теряет в этом случае примерно 5 пунктов по сравнению со средним уровне поддержки (и 6 – против средневзвешенного, т.е. официального результата выборов), а распределение мест в Думе при этом было бы такое: ЕР-220, КПРФ-99, СР-69, ЛДПР-62, что, вообще говоря, потребовало бы формирования коалиционного правительства с одной из партий. Конечно, про то, что все 3 «оппозиционные» партии – чисто демагогические, а республика у нас – президентская, я помню. Но надо же с чего-то начинать, чтобы не повторить ошибки 1916 года.
Приложение 1. Несколько статистических характеристик распределения числа голосов, поданных за партии, относящихся к приведенным под графиками плотностями этого распределения
Приложение 2. Доверительные эллипсы, указывающие на наличие ИК с «нетипичным» низким или, наоборот, высоким уровнем поддержки для КПРФ и ЕР.
Линии по осям означают то же самое, что и на основных графиках. Знаки на боксплотах по осям графиков: точка – среднее; черта – медиана; темный прямоугольник – 95% дов. интервал для медианы; светлый – вторая и третья квартили распределения, т.е. участок, охватывающий половину выборки с центром в медиане.
Россия (примеры J и S-эффектов)
Москва (такие эффекты отсутствуют)
Как видим, для России в целом явные аномалии проявляются в наличии у ЕР избирательных округов, где за нее подают 83 и более процентов голосов. Такие избирательные комиссии (их всего 7 – Тыва, Карачаево-Черкесия, Ингушетия, 2ИК в Дагестане, Мордовия и Чеченская р-ка, в последней за ЕР проголосовало аж 99.48% принявших участие в выборах) дали ЕP 4.77 проц. пункта из общего числа 50.11% от признанных действительными бюллетеней. Соответственно, у КПРФ (равно как и у двух других прошедших в Думу партий, видны нетипично низкие результаты в соответствующих ИК. Ничего похожего в Москве не наблюдается, практически все ИК (2-го уровня) укладываются в 95% доверительный эллипс.