2024.04.15 (월)

  • 흐림동두천 1.0℃
  • 흐림강릉 1.3℃
  • 서울 3.2℃
  • 대전 3.3℃
  • 대구 6.8℃
  • 울산 6.6℃
  • 광주 8.3℃
  • 부산 7.7℃
  • 흐림고창 6.7℃
  • 흐림제주 10.7℃
  • 흐림강화 2.2℃
  • 흐림보은 3.2℃
  • 흐림금산 4.4℃
  • 흐림강진군 8.7℃
  • 흐림경주시 6.7℃
  • 흐림거제 8.0℃
기상청 제공

선거

"4.7보궐선거에 대한 데이터 분석결과 발표"...서울대 통계학과 명예교수이자 학술원 회원인 박성현 교수 주장

발전이나 성장은 문제를 해결해 가는 과정에서 이루어진다. 같은 문제가 계속해서 발생하지 않도록 분석하고, 개선하는 것은 모든 발전의 토대이다

2020년 4.15총선이 끝난 직후에서 선거 정직성을 둘러싸고 여러 의견이 분분할 때에

박성현(서울대 통계학과 명예교수, 학술원 회원)의 5월 4일자, <조선일보> 인터뷰는 상당히

중요한 의미를 갖고 있다.("사전투표 결과 통계적으로 이해안돼...선관위, 의혹 풀어줄 책임있어")

https://www.chosun.com/site/data/html_dir/2020/05/04/2020050400098.html

 

국내통계학의 권위자로부터 나온 객관적인 발언이었기 때문이다. 

당시 박성현 명예교수의 핵심 주장은 다음과 같다.

 

#1. 

통계학회 회장과 한국과학기술한림원 원장을 지낸 박성현(75) 서울대 통계학과 명예교수는 이렇게 말문을 열었다.

 

"사전 투표를 둘러싸고 말들이 많아 전국 지역구 253곳의 선거 데이터를 자세히 봤다. 통계적 관점에서는 확실히 일어나기 어려운 투표 결과였다. 어떤 형태로든 인위적 개입이 있었을 가능성을 배제하기 어렵다고 본다."

 

"조작 증거라고 단언할 수는 없어도 통계학자의 눈으로는 몹시 의아하게 비친다. 아주 우연히 그렇게 일어났다고 주장할 수는 있지만, 통계적으로 이런 우연이 일어나기는 쉽지 않다. 굳이 말하면 '신(神)이 미리 그렇게 해주려고 작정하지 않고는 일어날 수 없다'는 것이다."

 

"더 세부적으로 서울의 424개 동(洞) 단위에서도 한 곳 예외 없이 민주당의 사전 투표 득표율이 당일 득표율보다 높았다. 동별로 특색이 있는데도 일률적인 결과가 도출됐다. 통계적으로 도저히 발생하기 어려운 것이다."

 

#2.

그런데 2021년 4.7보궐선거가 끝난 직후 박성현 교수는 5월 7일자 <미래한국>에

"[데이터로 보는 세상] 4.7서울시장 보궐선거 연령별 특징들"이란 글을 기고하였다.

박성현 명예교수의 주장은 필자가 보궐선거 이후에 몇 차례에 걸쳐 제시한 주장한

정확히 일치한다. 이것은 조금도 이상한 일이 아니다. 선거 데이터 분석결과가 A씨와 B씨가 다를 수 없기 때문이다. 숫자는 그냥 숫자일 뿐이다. 다른 욕심이나 의도가 개입되지 않는 한 말이다. 

 

박성현 명예교수의 주장은 다음과 같다. 

 

어떤 선거이든 간에 선거는 선거 데이터에 고스란히 그 흔적이 남는다.

이번 보궐선거도 1 년 전의 4·15 총선과 똑같은 흔적이 발견되었다.

박영선 후보는 사전투표에서 당일투표와 비교해 높은 지지를 받았고 그 반대로 오세훈 후보는 당일투표에서 사전투표보다 높은 지지를 받았다.

 


<그림 2>는 서울 425개 동에 대한 두 후보의 (당일득표율·사전득표율)에 대한 그래프이다.

만약 두 후보 모두 당일득표율과 사전득표율에 큰 차이가 없다면 이 그림은 두 후보 모두 제로(‘0’)를 중심으로 종(정규분포) 모양의 분포를 보여줘야 한다.

 

그러나 놀랍게도 박영선 후보는 -10%를 중심으로 종 모양을 하고, 오세훈 후보는 +10% 중심으로 종 모양의 그래프를 그린다. 

이런 현상은 통계적으로 일어나기 힘든 현상이다. 오직 가능한 하나의 분석은 사전투표에 박영선 지지자들이 대거 몰려나가고, 당일투표에는 오세훈 후보 지지자들이 대거 몰려나가야만 가능한 분석이다.

작년 4·15 총선에서도 <그림 2>와 같은 양봉형 봉오리와 지나치게 큰 편차를 보여줬다. <그림 3>은 작년 총선의 253개 지역구에서 더불어민주당 후보의 (당일 득표율-사전 득표율) 그래프를 보여주고 있다.

 



이 차이들의 평균은 더불어민주당이 -11%, 미래통합당이 +11%로 이번 보궐선거와 매우 유사하다. 이런 현상으로 혹자는 사전투표에서 부정선거 행위가 개입되었다고 주장하고 있다. 의혹이 가는 부분이 있는 것도 사실이다.  

 

요컨대 사전투표와 당일투표 간에 상당한 차이를 보인다는 것이다. <그림 2>에서 보면 동별로 (사전 득표율-당일 득표율)의 차이가 일정한 패턴을 보이고 있으며, 박 후보는 -10%를 평균으로 -6%에서 -14% 사이에 몰려 있는 정규분포 모양을 하고, 오 후보는 정반대 현상을 보이고 있다. 매우 특징적인 현상으로 향후 연구의 대상이 된다고 생각한다. 
출처 : 미래한국 Weekly(http://www.futurekorea.co.kr)

 

#3. 

지방선거, 총선, 보궐선거에서 거의 동일한 현상이 반복되고 있음을 알 수 있다. 이 같은 주장은 어떤 개인의 감에 의존한 발견이 아니라 유권자들이 남긴 공식 선거데이터에 의해 입증된 관찰 결과이다. 이 문제에 대한 엄격한 검증과 수정 작업이 없다면 2018,, 2020, 2021에 이어서 2022년 3월에도 동일한 패턴이 선거 데이터에 나타날 것으로 전망한다.