Математический рентген. Как увидеть на графике не только вброшенные, но и украденные голоса - «Политика» » Информационное агентство.
Все новости мира
на одном сайте

Математический рентген. Как увидеть на графике не только вброшенные, но и украденные голоса - «Политика»

Математический рентген. Как увидеть на графике не только вброшенные, но и украденные голоса - «Политика»
Политика
00:03, 16 январь 2021
2 175
0

В это воскресенье, 13 сентября, наступит «единый день голосования» — в России пройдут выборы глав 20 субъектов и депутатов законодательных органов в 11 субъектах. Ряд инициатив (такие как «Умное голосование» и «Городские проекты») поддерживают независимых кандидатов, однако организовать настоящее наблюдение будет сложно, поэтому при оценке фальсификаций снова придется полагаться на математиков. Основным способом оценки «вбросов» в России считается метод Сергея Шпилькина, которому, к примеру, удалось обнаружить 24–26 млн «аномальных» голосов на референдуме по «обнулению» Путина. Но вбросы не единственный вид фальсификации. Комиссии также нередко перекладывают бюллетени из одной пачки в другую, особенно когда нет наблюдателей, а проценты нужно подогнать под нужный результат — и математический метод Шпилькина этот вид фальсификации не видит. Пытаясь восполнить пробел, мы выяснили, что способ выявить «переложенные» бюллетени всё же существует: в этом нам помог сравнительный анализ российских и французских электоральных графиков. Согласно нашим расчётам, на последнем рефрендуме таким образом могло быть «украдено» порядка 2 миллионов голосов — почти каждый девятый протестный бюллетень.


Содержание
  • Результаты по разнарядке и парадокс Шпилькина

  • Как анализировать графики явки: «рентген» и «центрифуга»

  • 2 миллиона украденных голосов

Результаты по разнарядке и парадокс Шпилькина

Инфографика в тексте подготовлена Юлией Алыковой

После путинского референдума, прошедшего 1 июля, «Новая газета» опубликовала статью аналитика Сергея Шпилькина с оценкой истинных результатов волеизъявления граждан. Масштаб фальсификаций и настоящие значения явки и распределения голосов Шпилькин оценил по графику, на который он нанёс тысячи УИКов — каждому соответствуют три точки: красная (процент голосов «за» на данном УИКе), синяя (процент голосов «против») и розовая (процент недействительных бюллетеней). Проценту голосов соответствует координата Y, координата Х показывает явку.

Поскольку процент испорченных бюллетеней ожидаемо оказался незначительным, сумма голосов «за» и «против» почти везде оказалась близка к 100% и они, соответственно, дали на графике две симметричные «кометы» с отчётливым «ядром» слева и длинными «хвостами» справа. Именно по «ядрам» Шпилькин и заключил, что истинные показатели для всей России — явка около 42% и примерно 65% голосов «за».

Логика такой оценки понятна: главный способ фальсификации — это, как известно из опыта наблюдателей, так называемый «вброс»: к настоящим бюллетеням, которыми проголосовали избиратели, добавляется некоторое количество фиктивных — бумажных или виртуальных (в последнем случае «вброс» отражается только в протоколах, никак не влияя на содержимое урн). Соответственно, каждый «вброшенный» бюллетень поднимает одновременно и явку, и процент голосов за провластного кандидата (или за нужное властям решение). Отсюда и длинный скошенный вверх «хвост» на графике: чем больше вброшено, тем дальше красная точка сдвигается вправо по оси Х и вверх по оси Y. Из этого следует правдоподобное умозаключение, что «ядро» красной «кометы» образуют те участки, где вбросов не было (предполагая, что их достаточно много). По Шпилькину: «круглое размытое пятно на 42% явки и 65% за — это как раз те участки, где считали честно». Цифры соответствуют приблизительному «центру тяжести» красного ядра.

Однако такая оценка истинных значений явки и процентов вызывает определённые вопросы, если принять во внимание некоторые факторы, не учтённые в анализе Шпилькина.

Ещё за пару недель до рефрендума аналитики писали о предзаданности его результатов. Центризбиркому, по их словам, было дано определённое «техзадание», чтобы более чем 50% граждан РФ, имеющих право голосовать, проголосовало за поправки. Для этого нужно добиться явки около 67% и около 75% голосов «за». Именно такое задание якобы было дано на президентских выборах 2018 года; правда это или нет, но после многочисленных вбросов официальный счетчик остановился на магических числах — 76% за Путина при явке 67%: как раз ок. 51% от имеющих право голосовать. И надо же такому случиться, что на референдуме по «обнулению» официальные данные опять показали предзаданный результат: 77% за при явке 67%.

Это можно было списать на совпадение, если бы не ещё одно любопытное подтверждение — не где-нибудь, а в «третьей столице России» Казани на большинстве УИКов проценты по обоим параметрам также очевидно «подогнаны» под упомянутое «техзадание». И тут уже чистое совпадение маловероятно — в том числе и потому, что и та самая логика, о которой говорили социологи, проявляется здесь с поистине ювелирной точностью: дело в том, что «контрольные цифры» для казанских УИКов — явно не 67 и 75 процентов, а 65 и 77 (см. иллюстрацию). Почему это важно? Как отметили многие в обсуждении, 65% х 77% — это 50,05%. Иными словами, при такой явке и такой доле голосов «за» последних окажется как раз больше половины от числа всех имеющих право голосовать — но при этом больше всего на 1/20 процента (минимальное превышение, которого можно добиться при использовании целочисленных процентных значений, приближенных к 2/3 и 3/4).

Но из этих цифр — и из официальных результатов ЦИК, и — с абсолютной ясностью — из казанских данных, и даже из результатов президентских выборов 2018 — следует не всем очевидный вывод: целью организаторов общероссийского спектакля было не только получить официальный результат «более половины граждан РФ — за», но и минимизировать это «более» настолько, насколько возможно. Иными словами: заданные «ключевые параметры» мыслились не как нижний предел, а как идеал. Вероятно, потому, что и они уже явно выглядят не слишком правдоподобно, так что каждый лишний процент приближает официальные результаты голосования к гротеску.

А это, в свою очередь, означает, что абсолютное число голосов «за» и «против» поправок также должно быть как можно ближе к предустановленному — и если с голосами «за» это никаких проблем не создаёт (недостающее легко вбросить), то с голосами «против» ситуация другая: ведь вбросы их число никак не меняют. Параметры «явка 65%, за поправки 50% от общего числа избирателей» означают, что официально против должны проголосовать 15% от всех внесённых в списки. Поскольку, судя по опросам, оппозиционно настроенных и голосующих россиян ощутимо больше 15%, вряд ли власть в последние годы сталкивалась с необходимостью «довбрасывать» оппозиционные бюллетени — куда актуальнее была проблема «лишних» протестных бюллетеней, а эта проблема решается старым-добрым методом перекладывания из стопки в стопку.


Примечание: помимо «вброса» и «перекладывания», существует и такой вид фальсификации, как «рисовка» — т.е. просто внесение в протоколы заранее определённых цифр (см. пример Казани выше). Технически она эквивалентна сочетанию первых двух видов, но иногда приводит и к завышению числа протестных голосов на участке — что, впрочем, скорее исключение.

И здесь мы обнаруживаем феномен, который можно назвать «парадоксом Шпилькина». По его приведённой выше приблизительной оценке, настоящая явка по России — 42%, а настоящая доля голосов «против» — 35% (в наших расчётах мы везде включаем в это число и недействительные бюллетени, которых, впрочем, пренебрежимо мало). Это означает, что истинная «протестная явка»(отношение числа бюллетеней «нет» к общему числу избирателей) близка к (0,42 х 0,35) 14,7% — иными словами, согласно Сергею Шпилькину против поправок на самом деле высказались как раз те самые 15% избирателей России, которые и требовались по «техзаданию», а привычное «перекладывание» бюллетеней в заметных масштабах не использовалось вовсе!

(Позднее Сергей Шпилькин скорректировал оценку явки до 44%, но и это даёт результат того же порядка — 15,4%.)

Здесь можно было бы, опять же, предположить совпадение реальности с пожеланиями начальства, но в этом случае оно должно быть подозрительно регулярным – «техзадание», как уже отмечалось выше, восходит самое меньшее к президентским выборам 2018 года. А главное – вероятность того, что перекладывание не использовалось в массовом масштабе, то есть что голоса «вбрасывали», но не «крали», кажется призрачной исходя из многолетних систематических наблюдений за фальсификациями. И о том же говорит график-«комета» общероссийского голосования.

Дело в том, что если из всех видов фальсификации действительно массово используется только «вброс», это даёт определённый визуальный эффект на графике – «хвосты комет» как бы загибаются навстречу друг другу по мере приближения к правому краю. Объясняется он тем, что каждый следующий вброшенный бюллетень увеличивает долю голосов «за» меньше, чем предыдущий – а вот явка, напротив, при этом увеличивается равномерно.

Такой эффект мы можем в действительности наблюдать на графике голосования в Москве, опубликованном Шпилькиным:


Иначе говоря, московский график визуально полностью соответствует гипотезе, что «перекладывание» в Москве в по-настоящему значительных масштабах не применялось. Но на общероссийском графике, как можно легко убедиться, «хвосты комет» фактически выгибаются в обратную сторону по направлению к углам, что однозначно указывает на массовый характер перекладывания бюллетеней.

Соответственно, именно Москва иллюстрирует «парадокс Шпилькина» с другой стороны: оценивая столичную протестную явку всё тем же методом, «по ядру кометы», мы получаем максимум (0,39х0,41) 16% – между тем, официальная цифра по «бумажному» голосованию (т.е. без учёта электронного, не влияющего на график) – 17%. Принятие нескорректированного метода оценки Сергея Шпилькина означает в данном случае необходимость признать, что в Москве неизвестными оппозиционерами было вброшено самое меньшее 65 тысяч фальшивых голосов против поправок – во что поверить довольно трудно.

Лучший способ понять, в чём причина подобного феномена – построить по московским данным 2018 и 2020 года графики-гистограммы протестной явки: этот показатель хорош именно тем, что на него, в отличие от обычной явки, совсем не влияют вбросы – ведь ПЯ получается делением числа протестных голосов на общее число избирателей в списке, а вбросы ничего не добавляют ни к тому, ни к другому. Таким образом, если в Москве действительно не было массового перекладывания и рисовки, графики должны быть аутентичными. Для выборов 2018 протестными считаются голоса «не за Путина».

Результат выглядит так (по оси Х отложена протестная явка в процентах, шаг, или «бин», – 1%; высота столбиков показывает число УИКов в соответствующих процентных интервалах):


Получившиеся графики содержат разгадку «парадокса Шпилькина». Действительно, они не выглядят деформированными – это правильное «колоколообразное» распределение, более узкое (т.е. с небольшим разбросом) в 2018 и более широкое в 2020. Однако – и тут мы подходим к существу проблемы – это даже приблизительно не распределение «по Гауссу».

Дело в том, что нормальное, оно же «Гауссово», распределение – симметричное, то есть у него совпадают три показателя: пик (на математическом языке «мода»), медиана (линия, левее и правее которой находится одинаковое число точек) и среднее арифметическое («матожидание»). Иными словами, будь распределение УИКов нормальным, или хотя бы близким к гауссиане типологически, это означало бы, что пиковое значение протестной явки было бы одновременно и медианным, и средним – то есть для 2020 значение 15% соответствовало бы и самому частому для отдельного УИКа, и среднему, и к тому же число УИКов с ПЯ меньше и больше 15% было бы примерно одинаковым. Именно на этом строится метод оценки средних показателей «по ядру кометы», т.е. фактически по пиковым значениям (которым соответствует самый высокий столбик на гистограмме).

Однако тут мы имеем дело с асимметричным распределением (см. форму «колокола») – не «нормальным», а, вероятно, так называемым «логнормальным». Здесь нет нужды углубляться в природу этой функции, тем более, что само предположение на данный момент остаётся правдоподобной, но гипотезой: у меня нет доказательств, что речь именно о чистой логнормальной кривой, а не о модифицированной – или даже не о кривой другого, внешне сходного, типа. Сам термин я буду употреблять далее условно, вынося за скобки вопрос о его доказательной применимости. В любом случае для всякого правильного асимметричного распределения верно следующее: его пик, медиана и среднее значение не совпадают, при этом пик сдвинут по отношению к медиане в одну сторону, а среднее – в другую. Выражаясь образно: медианное значение располагается на более пологом из двух склонов графика на некотором удалении от пика, а среднее – ещё дальше.


Примечание: (протестная) явка по городу, стране и т.д. не совпадает в точности с матожиданием, но разница не играет роли для последующих приблизительных расчётов.

Соответственно, совершенно логично, что для Москвы 2020 официальная ПЯ («бумажная») составляет 16,96% при пиковом значении в диапазоне 15-16%, а для Москвы 2018 – 17,43% при пиковом значении в диапазоне 16-17%. Если взять для сравнения график явки на французских президентских выборах 2017 года (второй тур), имеющий сходную форму при более сильной дисперсии, то мы увидим, что его пик приходится примерно на отметку 80%, в то время как средняя явка по стране – всего 74,56%.

И не менее логично, что на гистограмме общероссийского голосования 2020 пиковое и официальное значение ПЯ сблизились именно и только вследствие массового перекладывания бюллетеней. Чтобы оценить его масштаб в первом приближении, для начала следует построить графики для России 2018 и 2020. Получается следующая картина:


Мы видим, что в обоих случаях правый склон графика имеет правильную форму, соответствующую колоколообразному распределению московского типа, а вот левый деформирован – отчётливо виден «нарост», дающий второй малый пик в диапазоне 4-5%. Этот нарост и свидетельствует о массовом перекладывании бюллетеней: оно снижает протестную явку на затронутых им УИКах, в результате сами УИКи смещаются на графике влево пропорционально доле «украденных голосов» – если, скажем, ПЯ на участке была 10%, но половину голосов «против» переложили в стопку «за», он перемещается из столбика 10 в столбик 5.

Естественно, абстрактно можно предположить, что малый пик – не следствие фальсификаций, а просто в России есть некоторые особенно лояльные власти регионы, где ПЯ естественным образом втрое ниже, чем в среднем по стране. Однако в таком случае размер «нароста» должен был бы быть примерно одинаковым в 2018 и 2020 году – а он сильно различается, так что это предположение правдоподобно лишь на первый взгляд. Действительно, структура УИКов в России за два года никак принципиально не изменилась, а переход целых регионов в гипотетическую категорию «сверхлояльных» из «обычных» между 2018 и 2020 нельзя считать реалистичной гипотезой. Не говоря уже о том, что социологам попросту не известны никакие аномалии такого масштаба, если речь о настоящем, а не официальном, уровне протестных настроений в разных частях страны.

Таким образом, остаётся для начала принять как гипотезу по умолчанию, что настоящий график протестной явки для России, так же как и московский, имеет форму правильного асимметричного колокола (логнормальное распределение), а сильная деформация появилась вследствие «перекладывания». При этом масштаб фальсификаций этого типа сильно вырос между 2018 и 2020 годом, т.е. доля затронутых ими – «грязных» – УИКов заметно увеличилась, как это можно легко увидеть невооружённым глазом.

При этом перекладывание, по всей видимости, было как «низовым» – осуществлявшимся на местах физически, так и отчасти «централизованным» – виртуальным (изменение цифр на этапе введения их в ГАС «Выборы»): только корректирование его в едином центре и могло обеспечить достаточно точную подгонку под параметры «техзадания». А точность оказалась прямо педантичной – если округлять до второго знака после запятой, по официальным данным общероссийское голосование показало протестную явку 14,99%. В 2018 ПЯ такой ювелирной подгонки на первый взгляд не демонстрирует, но если посчитать по альтернативному принципу – без недействительных бюллетеней, – то результат получается ещё более впечатляющим: почти ровно 15,00% (если до третьего знака – 15,005%). Совпадение маловероятно.

Но сколько же протестных голосов могли таким образом «украсть»? Для того, чтобы хотя бы приблизительно ответить на этот вопрос, нам нужно более точно понять, как вообще устроено распределение (протестной) явки на общероссийских выборах. В этом нам поможет прекрасная Франция: изучение графиков французских президентских выборов 2017 года и российских голосований 2018 и 2020 показало, что между двумя странами тут нет принципиальных различий, явка и ПЯ распределяются в обеих согласно одинаковым закономерностям – и установить их помогает отсутствие систематических фальсификаций в менее суверенной из двух демократий.

Как анализировать графики явки: «рентген» и «центрифуга»

Исследование графиков общероссийской протестной явки уже на раннем этапе выявляет одну неожиданную трудность. Дело в том, что по умолчанию в таких случаях мы считаем не связанные между собой очевидным образом параметры независимыми – в частности, исходим из того, что характер голосования на участке не зависит от его размера, т.е. большее или меньшее число избирателей в списке не влияет на то, как именно они голосуют. Это означает, что крупные и мелкие УИКи теоретически должны распределяться по графику относительно равномерно. Однако эмпирические данные свидетельствуют о том, что это не так: разным значениям ПЯ систематически соответствуют и разные усреднённые размеры УИКов. Более того, эта зависимость не устроена очевидным образом – простой корреляции вида «чем больше ПЯ, тем больше/меньше будут в среднем и участки» не наблюдается.

Таким образом, график ПЯ, выражаясь образно, имеет в этом отношении некоторую не определимую по его внешнему виду внутреннюю структуру. Для того, чтобы её можно было изучать, нужно использовать «рентген»: построить ещё один график, где по оси Х отложена ПЯ в процентах, а по оси Y – средний размер УИКа (число избирателей в списке) в каждом процентном интервале ПЯ. Например, вот исходный график президентских выборов 2018 года (шаг – 0,25%) и его «рентгенограмма»:


Хорошо видно, что, за исключением левой части, где вследствие фальсификаций концентрируются прежде всего «грязные» УИКи, форма двух графиков демонстрирует удивительное сходство (на правом где-то после отметки 30% начинается «область шума», что очевидно объясняется малыми числами – случайность начинает постепенно преобладать над закономерностью). Иными словами, чем ближе тот или иной процентный интервал ПЯ к пиковому значению – тем крупнее в среднем участки в этом интервале. И подобную странность нельзя списать на перекладывание бюллетеней: абстрактно вполне допустимо предположить, что на малых УИКах перекладывали больше (принимая во внимание «чистую» Москву) – но это не могло способствовать их почти симметричному смещению как к левому, так и к правому краю, ведь «обратные фальсификации» редки.

Следовательно, феномен следует считать естественным, и по умолчанию его проще всего объяснить своеобразно устроенным центробежным эффектом: складывается впечатление, что для разных групп УИКов существует обратная зависимость между размером и дисперсией (разбросом по исследуемому параметру). Проще говоря, большие участки мало отклоняются от пиковых значений, а средние и малые как будто разлетаются к краям графика тем дальше, чем они меньше. Это похоже на принцип действия центрифуги, только инвертированный – в том смысле, что малые участки ведут себя как тяжёлые частицы, а не как лёгкие.

Однако, как ни логично кажется на первый взгляд предположить, что по мере уменьшения размера УИКов их дисперсия увеличивается в силу некоей простой закономерности, столь банальное объяснение не выдерживает эмпирической проверки. Если бы оно было верным, «центробежный эффект» наблюдался бы в похожем виде также в Москве и Петербурге, но в реальности такого обнаружить не удаётся. Чтобы найти настоящую причину, понадобилось изучить при помощи данных сайта www.electoral.graphics/ru-ru/ не только российские, но и французские графики (второй тур президентских выборов 2017 года) – поскольку в случае Франции отсутствует фактор «чуровщины», это облегчило задачу.

Их исследование показало, что законы распределения явки, судя по всему, устроены одинаково в обеих странах и распространяются в том же виде на протестную явку в РФ (для конкурентных французских выборов понятие ПЯ, естественно, не имеет смысла). При этом, что существенно, графики явки для России 2020 и для Франции 2017 демонстрируют принципиально иной вариант «рентгенограммы»: от правого края к пику средний размер участка растёт, как и в первом примере, но после прохождения пика не начинает падать, а продолжает расти. «Центробежный эффект» уже не работает симметрично, хотя сам принцип неравномерного распределения УИКов по графику сохраняется – далее для краткости он будет метафорически обозначаться как эффект «волшебной центрифуги» («ВЦ»).

Выглядит это так («область шума» на обеих рентгенограммах не показана):


Наиболее вероятное объяснение такого странного на первый взгляд феномена на самом деле не слишком сложно и может быть вкратце сведено к следующим пунктам.

1. И во Франции, и в России распределение УИКов по размеру имеет неоднородную «двугорбую» структуру: грубо говоря, крупных и мелких много, но относительно мало средних. Эта закономерность соответствует условному делению участков на «городские» и «сельские». В одной стране структура более математически правильная, в другой – менее, но общий принцип один и тот же:


Соответственно, можно предположить, что группа А («городские» УИКи) и группа В («сельские» УИКи) достаточно однородны внутри себя, и каждая по отдельности дала бы более или менее правильный график логнормального распределения явки вроде московского – притом без чёткой корреляции между средним размером участка в процентном интервале и местом этого интервала на оси Х: эффекта «ВЦ» нет в отдельно взятой Москве, как уже было сказано выше.

2. Вместе с тем, между собой группы А и В по исследуемым параметрам несколько различаются – у них (по умолчанию) не одинаковая дисперсия и не одинаковое медианное/пиковое значение явки. Из этого следует, что общий график для всей страны представляет собой на самом деле результат сложения двух различных логнормальных кривых с определённым сдвигом по оси Х относительно друг друга. Сдвиг в рассматриваемых случаях не слишком велик, поэтому результирующая кривая сохраняет в целом характерный вид логнормальной, но как бы «расфокусированной»: у неё два близко расположенных пика вместо одного.

На французском графике, не деформированном из-за вбросов, это хорошо видно: он напоминает всё тот же асимметричный «колокол», но бросается в глаза скошенный верх – между пиками А и В вместо закругления образуется почти прямой «срез».

3. Таким образом, именно сложением двух графиков и объясняется эффект «волшебной центрифуги»: средний размер участка в каждом столбике гистограммы зависит от соотношения УИКов группы А (крупных) и группы В (мелких) в данном процентном интервале. Это соотношение меняется от столбика к столбику в зависимости от того, с какой скоростью растёт или падает каждая из двух кривых на конкретном участке оси Х. Скорость же зависит от двух факторов:

·
во-первых, от дисперсии – чем она меньше, тем больше «крутизна склонов»;

·
во-вторых, от положения пика на оси Х – логнормальная кривая растёт не по экспоненте, при приближении к пику её рост замедляется. Поэтому достаточно простого относительного сдвига, чтобы создать разницу скоростей в каждом интервале даже между двумя идентичными кривыми.

Этот механизм можно схематически проиллюстрировать для Франции 2017 и России 2018 (ПЯ) следующим образом:

Симметричная российская рентгенограмма получается за счёт того, что дисперсия «городских» УИКов ощутимо меньше, чем «сельских», и в силу этого от края графика до ближайшего пика значение А с обеих сторон растёт быстрее, чем В; между пиками, где одна кривая растёт, а другая падает, возникает резкий перепад в сторону пика А. Сдвиг же особой роли не играет, т.к. он относительно невелик. Асимметричная французская рентгенограмма – результат другой ситуации: здесь сдвиг между А и В больше, а разница дисперсии (если ощутимая разница вообще есть) – меньше, чем в России, поэтому определяющим становится первый фактор, а не второй, при аналогичном устройстве перепада между пиками.

При этом график общей явки для России 2020 демонстрирует конфликт двух факторов: левее пика А по направлению от центра средний размер УИКа сначала чуть-чуть вырастает вследствие сдвига, потом начинает падать вследствие меньшей дисперсии кривой А (см. иллюстрацию выше).

Здесь следует подчеркнуть один важный момент: в 2018 и 2020 гг. пики А и В на российских графиках протестной явки оказались очень близко, поэтому их общая форма близка к однопиковой (унимодальной). Но это вовсе не постоянная закономерность для России – достаточно посмотреть, скажем, на гистограмму президентских выборов 2000 года:

На тех выборах перекладывание бюллетеней использовалось крайне скромно: «малый пик» слева, бросающийся в глаза на рентгенограмме, на исходном графике сводится к едва заметному утолщению в интервале 0-10%. Таким образом, график слабо деформирован и почти не отличается от аутентичного – и нетрудно убедиться, что пики А и В находятся на сравнительно большом расстоянии друг от друга.

Таковы общие принципы распределения явки (и ПЯ) на российских и французских выборах – разумеется, только в первом приближении: дальнейшее изучение, несомненно, уточнит эту схему, но вряд ли опровергнет её фундаментальную логику. Исходя из неё мы можем теперь попытаться приблизительно определить долю «украденных голосов» на общероссийском голосовании 2020 года.


2 миллиона украденных голосов

Исходя из сформулированных выше общих принципов, мы уже можем кое-что сказать о первоначальных российских графиках протестной явки и о том, как, собственно, устроено в общих чертах «перекладывание бюллетеней».

Для общероссийского голосования 2020 график ПЯ и его «рентгенограмма» (шаг по оси Х – 0,25%) выглядят так:


По сравнению с выборами 2018 года (см. иллюстрацию выше) видны как сходства, так и различия, но первых больше. Так, судя по симметричному пирамидальному распределению среднего размера УИКов, в обоих случаях дисперсия «сельских» – они же группа В – ощутимо больше, чем «городских».

Что же касается пиков А и В, то их положение рентгенограмма везде позволяет восстановить с хорошей точностью – из общих соображений понятно, что перекладывание практически не должно искажать её в центральной части, хоть оно и деформирует график ПЯ: оно ведь затрагивает меньшинство участков, и по умолчанию относительно равномерно по всему диапазону. Искажение заметно там, где «грязные» УИКи в результате фальсификаций концентрируются, то есть в левой части; в центре же они, образно выражаясь, оседают тонким равномерным слоем. Собственно, даже график общей явки 2020 года, радикально видоизменённый вследствие огромного масштаба вбросов, «на просвет» сохраняет первоначальную структуру.

Мы видим, что и в 2018, и в 2020 расстояние между пиками невелико – порядка 0,75%, и пик А расположен правее пика В. Это означает, что при большей дисперсии «сельской» группы медианные/средние значения А и В могут совпадать или располагаться в любом порядке – действительно, медиана и среднее отстоят от соответствующего пика по правому (пологому) склону тем дальше, чем разброс шире, поэтому в данном случае относительный сдвиг пиков частично, полностью или даже с запасом компенсируется различием по параметру дисперсии. Иными словами, из того факта, что пиковое значение ПЯ для малых УИКов несколько меньше, ещё не следует, что в сельской местности протестные настроения слабее: средняя ПЯ там может оказаться и чуть ниже, и насколько-то выше.

Характер деформации левой части обеих рентгенограмм позволяет сразу же выделить два типа перекладывания. Во-первых, высокие столбики на значениях, близких к нулю, обнаруживают концентрацию в этой зоне «грязных» УИКов, на которых протестные голоса переложили в другую стопку практически целиком – поскольку такое происходит на самых разных участках, средний размер оказывается большим. Во-вторых, в ближнем диапазоне вокруг значения ок. 4% (соответствующего аномальному пику на обоих графиках ПЯ) выделяется «малая пирамида» – очень отчётливая в 2018, «полузасыпанная» в 2020. Её структура соответствует простой формуле: из каждого столбика первоначальной гистограммы пропорциональная доля участков смещается влево приблизительно на 2/3 дистанции, отделяющей его от нуля. Что означает перекладывание в среднем тех же двух третей протестных бюллетеней.

При этом средние размеры УИКов в столбиках, составляющих «малую пирамиду», заметно меньше, чем в центральной зоне – это говорит о том, что данная разновидность фальсификации характерна не для любых участков, а для некоей их подгруппы, не входящей целиком в группу В, но захватывающей не слишком большую долю группы А: вывод, хорошо согласующийся, в частности, с отсутствием массового перекладывания в Москве. Поскольку, тем не менее, внутри этой подгруппы эффект «волшебной центрифуги» тоже действует, хоть и слабее, общая пирамидальная форма при сдвиге влево по вышеназванной формуле сохраняется. Основные показатели – коэффициент ок. 2/3 и средний размер участка для аномального пика порядка 850 – не различаются для 2018 и 2020; но число затронутых УИКов в последнем случае сильно больше.

Этими двумя типами перекладывания дело, разумеется, не ограничивается: есть и такие участки, где оно устроено иначе, и их много – левый склон обеих гистограмм ПЯ, в отличие от правого, зримо отклоняется от правильной формы на всём своём протяжении, а на рентгенограмме 2020 избыток «грязных» УИКов поблизости от левого края почти скрывает «малую пирамиду» (которая при этом хорошо видна на исходном графике). Но, поскольку при сравнительно небольшом и равномерном сдвиге части УИКов влево ни рентгенограммы, ни сами графики не деформируются критически, определить масштаб явления на глаз нельзя. Поэтому, чтобы оценить примерно долю «украденных голосов», идти приходится не от типологии фальсификаций, а от дисперсии.

Суть метода в следующем: как уже отмечалось ранее, чем шире дисперсия логнормальной кривой и вообще правильного асимметричного распределения, тем дальше отстоят медианное и среднее значения от пикового. При этом для неискажённых московских графиков ПЯ дистанцию можно приблизительно измерить эмпирически, что и задаёт нижний предел уже для графиков общероссийских – их разброс, естественно, больше, так как Россия менее однородна, чем Москва. Последние, напомню, хоть и «расфокусированы», структурно близки к правильной «однопиковой» форме, поскольку расстояние между пиками А и В у них незначительно.

Визуально легко убедиться, что в порядке возрастания дисперсии четыре «колокола» расположены так: Москва 2018 – Москва 2020 – Россия 2018 – Россия 2020. Однако в случае России нужно сделать поправку на эффект «ВЦ», поскольку в том, что касается интересующего нас расстояния между пиковым и средним значениями, влияние более широкого разброса нивелируется меньшим размером УИКов в периферийных интервалах. Для устранения этой помехи нужно «перевзвесить» каждый столбик на средний размер участка, т.е. построить гистограмму так, чтобы высота столбика соответствовала сумме всех избирателей, внесённых в списки на УИКах в данном процентном интервале ПЯ. Также для более наглядного сравнения дисперсии московских и российских «колоколов» высоту лучше отображать в процентах от общего числа избирателей, а не в абсолютных цифрах. Построенные таким образом графики дают следующую картину:


Сравнение скорректированных гистограмм Москвы 2020 и России 2018 в разных разрешениях выявляет два важных момента: 1. их пики совпадают по месту и ширине (у второй пики А и В при этом де-факто сливаются в один), 2. правый – не деформированный – склон у российской чуть более пологий, чем у московской. Исходно он, следовательно, был ощутимо более пологим: ведь чем дальше каждый столбик от пика, тем больше доля малых УИКов в соответствующем интервале – а среди них доля «грязных» выше, чем среди крупных. Из-за этого в результате фальсификаций, сдвигающих «грязные» участки к левому краю, столбики справа уменьшаются неравномерно, и правый склон графика становится более крутым.

Иными словами, «колокол» РФ 2018 показывает более широкую дисперсию, чем М 2020, и коль скоро их пики при этом находятся на одной отметке – по умолчанию среднее значение ПЯ в первом случае выше (расположено правее по оси Х). Конечно, здесь требуется осторожность: российский график «расфокусирован», и может иметь немного другой коэффициент асимметрии – т.е. при приведении его к правильной логнормальной форме с аналогичной дисперсией «идеальный пик», возможно, окажется чуть левее. Однако из общих соображений, в которые здесь нет возможности углубляться, явствует, что этот эффект в данном случае вряд ли может перевесить влияние более сильного разброса. Учитывая, что 1. два пика графика РФ 2018 расположены очень близко, 2. левый соответствует более пологой кривой В, 3. рентгенограмма симметрична (не возникает критического разрыва между матожиданием – средней ПЯ на УИКе, и средней ПЯ по стране), так или иначе следует признать: условно приравнивая реальную общероссийскую протестную явку на выборах 2018 года к «бумажной» московской 2020 года (16,96%), мы получаем хоть и не минимально возможную, но консервативную оценку. При официальной ПЯ 15,73% это означает, что из примерно 18,5 миллионов протестных голосов около 1,34 миллиона (7,25%) были «украдены».

Процент УИКов, затронутых «перекладыванием бюллетеней», оценить труднее. Считая, что дисперсия скорректированного «колокола» РФ 2018 ощутимо, но не сильно превышает показатели М 2020, можно допустить, что его пиковые столбики исходно были ненамного ниже и в результате фальсификаций потеряли, соответственно, почти 1/6 своей высоты. Поскольку периферийные столбики потеряли больше, и притом на пике также «осело» сколько-то «грязных» УИКов etc., доля последних может быть порядка 18% – но это заведомо грубая оценка. В 2020 их число заметно увеличилось (судя по масштабам деформации графиков ПЯ), однако тут уже и 22%, и 27% можно признать равно правдоподобными цифрами, о какой-либо точности говорить явно не приходится.

Что касается общего числа голосов, «украденных» на общероссийском голосовании по поправкам к Конституции, то оно с очевидностью сильно больше, чем в 2018, – но насколько? Чтобы ответить на этот вопрос, имеет смысл прежде всего попытаться понять, увеличилась или уменьшилась в целом протестная явка в 2020 по сравнению с последними президентскими выборами. Исходя из естественного предположения, что динамика протестных настроений в России в целом и в Москве мало различается (социологи до сих пор не отмечали ситуаций, когда они росли бы в столице и одновременно падали в среднем по стране) – может показаться очевидным, что ПЯ должна была вырасти: в Москве 2018 она равнялась 17,43%, а в Москве 2020 – 19,31%.

Однако здесь следует учитывать фактор электронного голосования: поскольку оно дало возможность воспользоваться своим избирательным правом многим из тех, кто находился в отъезде или по другим причинам не мог прийти на участок, прирост может объясняться и его влиянием на общую – а тем самым и протестную – явку. Физическая («бумажная») явка составила в 2020, судя по графику, ок. 40% – общая же «в естественном состоянии», то есть за вычетом тех, кто смог проголосовать исключительно благодаря ЭГ, должна была бы оказаться выше. Для России в целом Сергей Шпилькин, чью высокую квалификацию аналитика трудно поставить под сомнение, дал крайне правдоподобную оценку 44%. Этому соответствует «естественное» значение для Москвы на уровне 42%, если исходить из приблизительного коэффициента расхождения 2018 года.

Примем как условное допущение, что та доля электронных бюллетеней, которая таким образом принимается за эквивалент бумажных (т.е. за волеизъявление избирателей, чьё участие не зависело от самой возможности голосовать дистанционно), характеризуется соотношением сторонников и противников поправок 62/38 – для ЭГ официальные цифры именно таковы, а фальсификации, если они и были, недоказуемы. При этих вводных «естественная» ПЯ в Москве 2020 оказывается примерно такой же, как в 2018: ок. 17,5%.

Подобный результат не удивителен, поскольку он всего лишь более точно показывает тенденцию, очевидную уже при первичной грубой оценке «по ядрам комет»: протестная явка от 2018 к 2020 году по большому счёту не изменилась – некоторый прирост наметился, но там, где не было ЭГ, его «съела» сезонная динамика, так как летом явка при прочих равных, очевидно, всегда меньше.

Усилившиеся за два года протестные настроения выразились в основном не в увеличении ПЯ, а в массовом неприходе тех, кто ранее худо-бедно поддерживал власть на выборах. Иными словами, на данный момент оппозиция не извлекает особых выгод из падения популярности власти – разочаровавшиеся чаще всего проявляют нелояльность пассивно и «голосуют ногами», то ли не доверяя оппозиционным политикам, то ли попросту не веря в саму возможность повлиять на что-либо в рамках выборных процедур в условиях тотальных фальсификаций. Из-за этого и возникла потребность «вбросить» более 25 миллионов бюллетеней, компенсировавших огромную естественную убыль лояльного электората.

Вышеприведённые расчёты подводят нас к выводу, что общероссийское голосование 2020, по-видимому, показало в действительности протестную явку примерно на уровне 2018, т.е. около 17%. Поскольку она всё же могла оказаться и несколько ниже, в качестве консервативной оценки можно принять 16,75%. Это хорошо согласуется и с тем фактом, что в Москве доля проголосовавших против поправок и испортивших бюллетени при указанных вводных не могла быть ниже 41%, откуда при сохранении примерного коэффициента расхождения 2018 следует нижняя граница 38% для России в целом – соответствующая при явке 44% значению ПЯ 0,1672. Таким образом, изначально протестных голосов в 2020 было с большой вероятностью не менее 18,3 миллионов, из них было «украдено» более 1,9 миллиона (10,5%).

Разумеется, учитывая все сделанные допущения, речь идёт только о грубой оценке в первом приближении: вряд ли получится строго доказать, что она не завышена – хотя обратное правдоподобнее. Её наверняка можно уточнить более сложными методами; но практического смысла в этом нет. С одной стороны, если даже на самом деле «украденных голосов» было не почти два миллиона, а напр. всего полтора (что в действительности трудно допустить, т.к. разница с 2018 не могла быть столь незначительной) – всё равно и 1,5 миллиона переложенных бюллетеней на более 20% участков означали бы, что данный тип фальсификации уже приобрёл крайне впечатляющий размах.

С другой стороны, окажись ПЯ заметно выше – даже около 18%, это будет лишь означать, что в России за поправки проголосовали 59%, как в отдельно взятой Москве, а не 62%. Соотношение сторонников и противников 62/38 ощутимо отличается от 59/41, как и от 65/35 (оценка Шпилькина), но различие не влияет принципиально на общий результат: так или иначе сторонников оказалось сильно больше – пусть это и не отражает реальные настроения в обществе, учитывая сказанное выше про привычку «голосовать ногами».

Однако в будущем ситуация может измениться. Не стоит забывать, что масштаб «перекладывания» на данный момент, видимо, ограничен сверху не объективными трудностями, а исключительно задачей уменьшить ПЯ до конкретной величины 15%. Если тенденция переломится и бывший провластный электорат начнёт чаще предпочитать протестное голосование бойкоту, ничто не помешает произвольно увеличить и долю переложенных бюллетеней, благо за пределами крупных городов независимое наблюдение за выборами часто фактически отсутствует. Лучший способ наглядно показать, как мало препятствий встречает власть на этом пути – анализ тех же вбросов: достаточно построить отдельные «кометы» для крупных и мелких УИКов.


На левом графике показаны участки, где зарегистрировано свыше 1500 избирателей, на правом – где их менее 600. Легко заметить, что на последнем «ядра комет» исчезают: так немного во всей России малых УИКов, не затронутых вбросами.

Если в будущем и перекладывание на участках без наблюдения будет производиться со столь же раблезианским размахом, вероятно, восстанавливать истинные значения протестного голосования нужно будет методом математической реконструкции исходных кривых. Такое решение кажется в принципе возможным, поскольку при использовании достаточно устойчивых к фальсификациям рентгенограмм графики ПЯ позволяют с некоторой точностью определить исходное место пиков А и В – притом площадь под кривыми А и В постоянна: она соответствует числу «городских» и «сельских» УИКов соответственно, а этот показатель от выборов к выборам не меняется (к тому же он общий для графиков ПЯ и обычной явки). Упомянутые факторы наряду с другими, можно надеяться, позволят преодолеть трудности, связанные с изменчивостью дисперсии – во всяком случае, в общероссийском масштабе, когда закон больших чисел на стороне исследователя.


В это воскресенье, 13 сентября, наступит «единый день голосования» — в России пройдут выборы глав 20 субъектов и депутатов законодательных органов в 11 субъектах. Ряд инициатив (такие как «Умное голосование» и «Городские проекты») поддерживают независимых кандидатов, однако организовать настоящее наблюдение будет сложно, поэтому при оценке фальсификаций снова придется полагаться на математиков. Основным способом оценки «вбросов» в России считается метод Сергея Шпилькина, которому, к примеру, удалось обнаружить 24–26 млн «аномальных» голосов на референдуме по «обнулению» Путина. Но вбросы не единственный вид фальсификации. Комиссии также нередко перекладывают бюллетени из одной пачки в другую, особенно когда нет наблюдателей, а проценты нужно подогнать под нужный результат — и математический метод Шпилькина этот вид фальсификации не видит. Пытаясь восполнить пробел, мы выяснили, что способ выявить «переложенные» бюллетени всё же существует: в этом нам помог сравнительный анализ российских и французских электоральных графиков. Согласно нашим расчётам, на последнем рефрендуме таким образом могло быть «украдено» порядка 2 миллионов голосов — почти каждый девятый протестный бюллетень. Содержание Результаты по разнарядке и парадокс Шпилькина Как анализировать графики явки: «рентген» и «центрифуга» 2 миллиона украденных голосов Результаты по разнарядке и парадокс Шпилькина Инфографика в тексте подготовлена Юлией Алыковой После путинского референдума, прошедшего 1 июля, «Новая газета» опубликовала статью аналитика Сергея Шпилькина с оценкой истинных результатов волеизъявления граждан. Масштаб фальсификаций и настоящие значения явки и распределения голосов Шпилькин оценил по графику, на который он нанёс тысячи УИКов — каждому соответствуют три точки: красная (процент голосов «за» на данном УИКе), синяя (процент голосов «против») и розовая (процент недействительных бюллетеней). Проценту голосов соответствует координата Y, координата Х показывает явку. Поскольку процент испорченных бюллетеней ожидаемо оказался незначительным, сумма голосов «за» и «против» почти везде оказалась близка к 100% и они, соответственно, дали на графике две симметричные «кометы» с отчётливым «ядром» слева и длинными «хвостами» справа. Именно по «ядрам» Шпилькин и заключил, что истинные показатели для всей России — явка около 42% и примерно 65% голосов «за». Логика такой оценки понятна: главный способ фальсификации — это, как известно из опыта наблюдателей, так называемый «вброс»: к настоящим бюллетеням, которыми проголосовали избиратели, добавляется некоторое количество фиктивных — бумажных или виртуальных (в последнем случае «вброс» отражается только в протоколах, никак не влияя на содержимое урн). Соответственно, каждый «вброшенный» бюллетень поднимает одновременно и явку, и процент голосов за провластного кандидата (или за нужное властям решение). Отсюда и длинный скошенный вверх «хвост» на графике: чем больше вброшено, тем дальше красная точка сдвигается вправо по оси Х и вверх по оси Y. Из этого следует правдоподобное умозаключение, что «ядро» красной «кометы» образуют те участки, где вбросов не было (предполагая, что их достаточно много). По Шпилькину: «круглое размытое пятно на 42% явки и 65% за — это как раз те участки, где считали честно». Цифры соответствуют приблизительному «центру тяжести» красного ядра. Однако такая оценка истинных значений явки и процентов вызывает определённые вопросы, если принять во внимание некоторые факторы, не учтённые в анализе Шпилькина. Ещё за пару недель до рефрендума аналитики писали о предзаданности его результатов. Центризбиркому, по их словам, было дано определённое «техзадание», чтобы более чем 50% граждан РФ, имеющих право голосовать, проголосовало за поправки. Для этого нужно добиться явки около 67% и около 75% голосов «за». Именно такое задание якобы было дано на президентских выборах 2018 года; правда это или нет, но после многочисленных вбросов официальный счетчик остановился на магических числах — 76% за Путина при явке 67%: как раз ок. 51% от имеющих право голосовать. И надо же такому случиться, что на референдуме по «обнулению» официальные данные опять показали предзаданный результат: 77% за при явке 67%. Это можно было списать на совпадение, если бы не ещё одно любопытное подтверждение — не где-нибудь, а в «третьей столице России» Казани на большинстве УИКов проценты по обоим параметрам также очевидно «подогнаны» под упомянутое «техзадание». И тут уже чистое совпадение маловероятно — в том числе и потому, что и та самая логика, о которой говорили социологи, проявляется здесь с поистине ювелирной точностью: дело в том, что «контрольные цифры» для казанских УИКов — явно не 67 и 75 процентов, а 65 и 77 (см. иллюстрацию). Почему это важно? Как отметили многие в обсуждении, 65% х 77% — это 50,05%. Иными словами, при такой явке и такой доле голосов «за» последних окажется как раз больше половины от числа всех имеющих право голосовать — но при этом больше всего на 1/20 процента (минимальное превышение, которого можно добиться при использовании целочисленных процентных значений, приближенных к 2/3 и 3/4). Но из этих цифр — и из официальных результатов ЦИК, и — с абсолютной ясностью — из казанских данных, и даже из результатов президентских выборов 2018 — следует не всем очевидный вывод: целью организаторов общероссийского спектакля было не только получить официальный результат «более половины граждан РФ — за», но и минимизировать это «более» настолько, насколько возможно. Иными словами: заданные «ключевые параметры» мыслились не как нижний предел, а как идеал. Вероятно, потому, что и они уже явно выглядят не слишком правдоподобно, так что каждый лишний процент приближает официальные результаты голосования к гротеску. А это, в свою очередь, означает, что абсолютное число голосов «за» и «против» поправок также должно быть как можно ближе к предустановленному — и если с голосами «за» это никаких проблем не создаёт (недостающее легко вбросить), то с голосами «против» ситуация другая: ведь вбросы их число никак не меняют. Параметры «явка 65%, за поправки 50% от общего числа избирателей» означают, что официально против должны проголосовать 15% от всех внесённых в списки. Поскольку, судя по опросам, оппозиционно настроенных и голосующих россиян ощутимо больше 15%, вряд ли власть в последние годы сталкивалась с необходимостью «довбрасывать» оппозиционные бюллетени — куда актуальнее была проблема «лишних» протестных бюллетеней, а эта проблема решается старым-добрым методом перекладывания из стопки в стопку. Примечание: помимо «вброса» и «перекладывания», существует и такой вид фальсификации, как «рисовка» — т.е. просто внесение в протоколы заранее определённых цифр (см. пример Казани выше). Технически она эквивалентна сочетанию первых двух видов, но иногда приводит и к завышению числа протестных голосов на участке — что, впрочем, скорее исключение. И здесь мы обнаруживаем феномен, который можно назвать «парадоксом Шпилькина». По его приведённой выше приблизительной оценке, настоящая явка по России — 42%, а настоящая доля голосов «против» — 35% (в наших расчётах мы везде включаем в это число и недействительные бюллетени, которых, впрочем, пренебрежимо мало). Это означает, что истинная «протестная явка»(отношение числа бюллетеней «нет» к общему числу избирателей) близка к (0,42 х 0,35) 14,7% — иными словами, согласно Сергею Шпилькину против поправок на самом деле высказались как раз те самые 15% избирателей России, которые и требовались по «техзаданию», а привычное «перекладывание» бюллетеней в заметных масштабах не использовалось вовсе! (Позднее Сергей Шпилькин скорректировал оценку явки до 44%, но и это даёт результат того же порядка — 15,4%.) Здесь можно было бы, опять же, предположить совпадение реальности с пожеланиями начальства, но в этом случае оно должно быть подозрительно регулярным – «техзадание», как уже отмечалось выше, восходит самое меньшее к президентским выборам 2018 года. А главное – вероятность того, что перекладывание не использовалось в массовом масштабе, то есть что голоса «вбрасывали», но не «крали», кажется призрачной исходя из многолетних систематических наблюдений за фальсификациями. И о том же говорит график-«комета» общероссийского голосования. Дело в том, что если из всех видов фальсификации действительно массово используется только «вброс», это даёт определённый визуальный эффект на графике – «хвосты комет» как бы загибаются навстречу друг другу по мере приближения к правому краю. Объясняется он тем, что каждый следующий вброшенный бюллетень увеличивает долю голосов «за» меньше, чем предыдущий – а вот явка, напротив, при этом увеличивается равномерно. Такой эффект мы можем в действительности наблюдать на графике голосования в Москве, опубликованном Шпилькиным: Иначе говоря, московский график визуально полностью соответствует гипотезе, что «перекладывание» в Москве в по-настоящему значительных масштабах не применялось. Но на общероссийском графике, как можно легко убедиться, «хвосты комет» фактически выгибаются в обратную сторону по направлению к углам, что однозначно указывает на массовый характер перекладывания бюллетеней.Соответственно, именно Москва иллюстрирует «парадокс Шпилькина» с другой стороны: оценивая столичную протестную явку всё тем же методом, «по ядру кометы», мы получаем максимум (0,39х0,41) 16% – между тем, официальная цифра по «бумажному» голосованию (т.е. без учёта электронного, не влияющего на график) – 17%. Принятие нескорректированного метода оценки Сергея Шпилькина означает в данном случае необходимость признать, что в Москве неизвестными оппозиционерами было вброшено самое меньшее 65 тысяч фальшивых голосов против поправок – во что поверить довольно трудно. Лучший способ понять, в чём причина подобного феномена – построить по московским данным 2018 и 2020 года графики-гистограммы протестной явки: этот показатель хорош именно тем, что на него, в отличие от обычной явки, совсем не влияют вбросы – ведь ПЯ получается делением числа протестных голосов на


Комментарии (0)
Добавить