바실리아TV는 4월 10일(토), 서울시장 보궐선거에 대한 25개구 단위의 통계 분석 결과를 공개하였다. 1. 특이한 현상은 통계적 변칙을 체크할 때 사용되는 각 후보의 차이(당일득표율-사전득표율)가 통계적으로 도저히 허용할 수 없을 수준으로 크다는 사실이다. [도표1] 4.7보궐선거 25개구단위 통계분석 결과 출처: 바실리아TV, 4/10/2021 예를 들어, 종로구의 경우 박영선 후보와 오세훈 후보는 각각 +12.57%와 -11.73%이다. 중구의 경우도 양 후보는 각각 +11.09%와 -10.38%다. 여기서 주목해야 하는 것은 격차가 +10%와 -10%라는 것은 양 후보 사이에 20% 격차가 만들어짐을 뜻한다. 이는 통계적으로는 발생할 가능이 아주 낮은 경우다. 통계적으로 '아주 낮다'는 이야기는 현실적으로 일어나기가 거의 불가능하다고 해석할 수 있다. 일반적으로 모집단에서 나온 표본집단(당일투표 그룹, 사전투표 그룹)은 선거처럼 표본집단 수가 큰 경우에는 거의 비슷한 통계적 특성을 보여야 한다. 이것은 곧바로 차이가 오차범위(1~3%) 이내에 있어야 함을 뜻한다. 2. 다음으로 2020년 4.15총선에서 차이(당일득표율-사전득표율)과 2021년 4월
세상의 모든 행위는 흔적을 남긴다. 그것이 좋은 행위든 나쁜 행위든 말이다. 선거는 선거데이터에 고스란히 그 흔적을 남긴다. 불행히도 4.7보궐선거는 일년전의 4.15총선과 아주 유사한 흔적이 발견되었다. 흔적이라고 하지만 그것은 '중요한 단서'라 불러도 손색이 없다. 왜냐하면 숫자에 각인된 것이기 때문이다. 숫자는 누군가를 봐주는 법이 없다. 어떤 행위를 했으면 한 것이고, 하지 않았으면 하지 않은 것이다. 선거에 개입하였으면 개입한 증거가 낱낱이 선거 데이터에 기록되고 것이고, 그렇지 않았으면 자연상태에서 발견되는 선거 데이터가 생산되게 된다. 암담한 것은 한번이 아니라 꼭 행위가 두 번씩이나 일어났을 가능성이 현저히 높아졌다는 사실이다. 물론 추가적인 조사가 더 필요할 것이다. 그러나 통계자료를 보는 사람들은 몇 가지 주요 특성을 보면 특이 상황을 금새 잡아낼 수 있다. 아래는 25개 구에 대한 서울지역의 보궐선거 결과를 이용해거 각 후보의 득표율 격차(당일득표율-사전득표율)이다. 퍼센트이기 때문에 인위적인 개입이 없는 정상투표의 경우는 오차범위는 1~3% 정도이다. 쉽게 말하면 아래의 그래프에서 제로('0')을 중심으로 오세훈 후보(붉은색)과 박영선