1.
"선거데이터는 모든 것을 증언하고 있다."
당일투표 득표수, 사전투표 득표수과 같은 선거데이터의 생산자는 선관위다. 따라서 그 데이터와 관련해서 발생하는 모든 문제점 역시 선관위가 책임져야 한다.
2.
대한민국 선거문제와 관련된 모든 논의는 우선적으로 선거데이터 분석에서 시작돼야 한다.
"요즘 세상에 부정선거가 어디있어"와 같은 주장은 개인의 경험과 판단 그리고 지식에 기반을 둔 것으로 편견, 감정 그리고 사적 이익으로부터 자유롭지 않다.
오로지 데이터만이 "이미 일어난 사실을 명확하게 증언해 줄 수 있는 증거물이다"라고 판단할 수 있다.
3.
따라서 대한민국 선거공정성 문제 한 걸음 더 나아가 사전투표 조작설에 대한 검증은 2017대선 선거데이터로부터 시작해서 2018지방선서, 2020총선, 2022대선, 2022지방선거 선거데이터를 종합적으로 분석하면 쉽게 문제의 실상을 파악할 수 있다.
4.
현대 통계학의 근거가 되는 '대수의 법칙(The Law of Large Numbers)'은 우리들에게
선거부정 문제에 대한 분명한 판단 근거와 잣대를 제시하고 있다.
"같은 모집단으로부터 추출된 표본집단의 경우 표본의 수가 커지면 커질수록
모집단과 표본집단의 통계적 특성을 같거나 비슷해야 한다."
이를 선거에 그대로 적용하면 다음과 같이 요약할 수 있다.
"특정 지역의 투표자들로 구성되는 모집단으로부터 4박5일의 차이를
두고 사전투표그룹(표본집단1)과 당일투표그룹(표본집단2)을 추출할 때
모집단, 사전투표그룹, 당일투표그룹 모두 통계적 특성 즉, 특정 후보에 대한 지지도가
같거나 비슷해야 한다."
표본집단이 커다는 것은 대부분 1000개 정도를 기준으로 하지만 선거의 경우
수천, 수만, 수십만, 수백만, 수천만개의 표본 수로 구성되기 때문에 더더욱 '대수의 법칙'이
적용된다.
5.
따라서 사전투표에서 문제가 있었는가, 없었는가를 판별할 수 있는 가장
유용하고 간편한 잣대는 "차이값=사전투표 득표율 - 당일투표 득표율"을
살펴보면 쉽게 선거공정성 문제를 진단할 수 있다.
첫째, 차이값은 '0'에 가까워야 하고, 오차범위 1~3%를 넘지 않는 작은 수치여야 한다.
차이값이 10%대처럼 큰 값이 나온다면 이는 사전투표에서 후보별로 투표수 증감이 있었음을 뜻하며, 이는 곧바로 사전투표 조작을 뜻한다.
둘째, 차이값의 분포는 플러스 마이너스가 교차되어야 하고, 특정후보가 모두'플러스' 혹은 '마이너스'가 되어선 안된다.
셋째, 좌우대칭과 같은 인위적인 현상이 나타나선 안된다.
2020년 4.15총선 당시 전남, 전북, 광주광역시 대부분 지역에서는 사전투표 조작이 없었거나
경미하였다. 아래는 전남 고흥군과 나주시 사례로 사전투표 조작이 없는 경우 선거데이터 분포 특성을 잘 말해주고 있다.
6.
유감스럽게도 2017대선부터 2022지방선거에 이르기까지 대한민국의 모든 공직선거는
뚜렷하다는 표현으로 담기에 부족할 정도로 어마어마한 규모의 통계적 변칙이 일어났다.
다시 말하면 공정선거에서는 도저히 일어날 수 없는 선거데이터가 생산되었으며,
선거데이터의 생산주체는 대한민국 중앙선관위이다.
따라서 선거데이터는 대한민국 공직선거에서 반복적으로 사전투표 조작 즉 전산프로그램에 의한 사전투표 조작이 발생하였을 가능성을 증언해 주고 있다.
<표1> 2017년 대선(종로구 사례), 차이값=사전투표(관내) 득표율-당일투표득표율
<표2> 2017년 대선(서울시 사례), 차이값=사전투표(관외) 득표율-당일투표 득표율
<표3> 2022년 대선(부산시 사례), 차이값=사전투표(관외) 득표율-당일투표 득표율
<표4> 2020년 총선(17개 도 및 광역시 사례), 차이값=사전투표(관외) 득표율-당일투표 득표율
<표5> 2022년 지방선거, 차이값=사전투표(관외) 득표율-당일투표 득표율
<표6> 2022년 지방선거, 차이값=사전투표(관내) 득표율-당일투표 득표율
참고: [선거해부 시리즈]
(5) 프로그램 운영 주체가 당락에 결정적 영향력 행사
(3) 선거데이터는 모든 것을 말한다
(2) 대구시장 선거도 마찬가지였다