2023.08.31 (목)

  • 흐림동두천 20.1℃
  • 흐림강릉 21.2℃
  • 박무서울 21.0℃
  • 박무대전 20.0℃
  • 대구 21.3℃
  • 구름많음울산 24.0℃
  • 박무광주 20.4℃
  • 구름조금부산 25.6℃
  • 흐림고창 18.9℃
  • 흐림제주 21.7℃
  • 흐림강화 19.3℃
  • 구름많음보은 19.5℃
  • 구름많음금산 19.1℃
  • 구름많음강진군 21.1℃
  • 구름많음경주시 23.0℃
  • 구름많음거제 25.3℃
기상청 제공

선거

"선거 데이터에는 유권자들이 내린 최종 결과가 고스란히 담기게 된다"...특히 표본집단의 수가 큰 경우에는 이변이 일어나기 힘듬

모집단과 표본집단 사이에 통계적 유사성이 존재해야 한다는 것은 통계학의 존립을 가능하게 하는 대원칙. 이런 원칙에서 이변이 계속해서 나온다면 진지한 고민과 분석이 뒤를 따라야

일상의 분주함 때문에 대다수 사람들은 투표하는 것만으로도 대단한 일을

한 것입니다. 그런데 사람에 따라서는 선거결과 데이터에 자연스럽게 주목하는

사람들이 있습니다. 이렇게 주목하는 사람들이  주목의 대가로 어떤 이익을 누리는

경우도 있겠지만 대부분은 본능적인 호기심 때문에 선거결과 데이터를 요모조모 비교해

보게 됩니다. 때로는 그냥 데이터의 분포나 간단한 비교 수치를 보는 것만으로도 "어, 이건 아닌데"라는 판단을 내리게 됩니다. 

 

1. 

사실 선거에 검증이 포함되기 때문에 궁금함을 갖거나 의문을 갖고 해명이나 설명을

요구하는 일은 나무랄 일이 아닙니다. 언제부터인가 우리 사회에서는 선거결과를

보고 특이점을 지적하는 사람들은 크게 비난하는 분위기입니다. 그러나 그것은 앞뒤가 뒤바뀐 경우에 해당합니다. 사람이 이상한 것을 보고 "어, 이게 이상한데요"라고 하는 것은 너무나 당연한 일입니다. 더욱이 체제의 근간인 선거인 경우는 더더욱 그렇습니다. 

 

지난 4.15총선의 경우에 크게 문제가 되었던 것이 전국의 거의 대부분 지역에서 특정 정당의

후보의 경우 당일득표율과 사전득표율 차이에 큰 차이가 발생하였습니다. 그러니까 특정 정당의 경우는 이상하고 남음이 있을 정도로 사전득표율이 당일득표율보다 크고, 여기에다 그 득표율 일정한 비율이었습니다. 특정 정당 후보는 플러스 10%이고 반대당 후보는 마이너스 10% 였습니다. 

 

사실 <그림3>처럼 차이(당일득표율-사전득표율)이 '0'을 중심으로 완전히 반대방향에 위치하는 이같은 현상은 충격적인 일입니다. 수만, 수백만, 수천만명으로 구성된 표본집단에서는 도저히 나올 수 없는 일입니다. 쉽게 이야기하면 같은 아버지와 어머니 밑에서 나올 수 없는 혈액형을 가진 아이가 나온 것과 같습니다. 이것을 보고 "문제없다"고 이야기하는 것은 온전한 정신을 가진 사람으로서는 취할 태도가 아니라고 봅니다. 

그런데 더욱 충격적인 일은 꼭 같은 일이 2021년 4.7보궐선거에서도 출현하였다는 사실입니다. 

차이(당일득표율-사전득표율)이 이처럼 서로 마주 보는 것처럼 '0'을 중심으로 포진하는 것은 천지가 개벽할 만한 사건이라고 봅니다. 이것을 보고 "문제가 없다"고 이야기하는 것은 도무지 받아들이기 힘든 일입니다. 

 

 

혹자는 "사전투표에는 젊은 사람들이 떼로 몰려가서 투표를 했기 때문이다"라고 주장합니다. 이런 주장은 설득력이 떨어지는 이유는 수만, 수백만, 수천만명의 표본집단인 경우에는 어떤 이유든지 간에 모집단과 비슷한 통계적 특성을 가져야 합니다. 

 

쉽게 말하자면 어떤 경우에서든 같은 모집단에서 나온 당일득표율과 사전득표율이 오차범위를 크게 벗어나면 이것은 비정상이라고 밖에 볼 수 없습니다. 

 

2. 

그런데 이번의 국민의힘 전당대회의 결과를 보면 차이(모바일득표율-ARS득표율)에서는 비슷한 현상이 일어났습니다. 1위 후보는 +10.92%% 이고 나머지 2위와 3위 후보는 각각 -7.82%와 -2.66%(합계 -10.48%)입니다. 

 

이렇게 '0'을 기준으로 승리한 쪽은 +10% 이상의 플러스쪽에 그리고 패배한 쪽은 -10% 이상의 마이너스 쪽에 뚝 떨어져 위치한 것은 과거의 사전득표율과 당일득표율 차이를 연상시킵니다. 일어나기 힘든 일이라고 봅니다. 

 

모바일득표율이 나온 표본집단(11만)이고 ARS득표율이 나온 표본집단(4만)입니다. 32만으로 구성된 모집단에서 11만과 3만은 일반적인 통계분석에서 아주 표본집단의 수가 큰 것을 뜻합니다. 일반적인 여론조사의 경우는 표본집단의 수가 1000개 정도입니다. 

 

혹자는 "모바일투표에 젊은 사람들이 떼로 몰려가서 그렇다"는 이유를 대기도 합니다. 그럼에도 불구하고 모집단 수가 수십만이고 표본집단 수가 수만에서 수십만 정도라면 "떼로 지어서 표를 했다"는 것도 그저 한강물에 돈을 던지는 것에 비유할 수 있습니다. 그런 것이 통계적 결과에 크게 영향을 미칠 수 없음을 뜻합니다.

 

젊은 사람들이 모바일투표에 몰렸든 몰리지 않았던 것에 관계없이,  어떤 후보든 간에 모바일득표율과 ARS득표율을 비슷해야 합니다. 그리고 그 차이는 '0'을 중심으로 오차 범위 내에서 분포해야 합니다.  이런 현상에 대하 의문을 갖게 되는 것은 억지가 아니라 '합리적 의심'에 해당합니다. 

 

이같은 현상이 지방선거, 총선, 보궐선거, 당 대표 선거 등에서 계속해서 등장하기 때문에 자연스럽게 대선에서도 이같은 현상이 등장할 것을 전망하게 됩니다. 생업에 분주한 사람들은 그렇다 치더라도 전문가들이 사익을 제쳐두고 이런 문제에 대해 허심탄회한 의견 개진이 있어야 한다고 봅니다.  혹자는 "이 시대의 화두는 공정이다"라고 말합니다. 그런데 공정의 관점에서 선거만큼 공정의 중요성이 더해져야 할 곳이 어디에 있겠습니까?