[단상] "선거 데이터에서 규칙을 찾아낸 것은 대단한 발견" 세상이 뒤집어질 정도로 큰 사건임에도 조용한 한국 사회.
"사회과학 논문은 특정 사회 현상을 담은 데이터에서 규칙을 찾아내는 것이 목표" 경제학 논문, 정치학 논문, 사회학 논문은 가설을 세운 다음에, 그 가설과 관련된 데이터(통계자료)에서 자신의 가설을 입증할 수 있는 '규칙(regularity)'을 찾아내는데 주목한다. 1. 선거도 마찬가지다. "선거에서 조작이 있었는가, 아닌가"라는 것을 규명하기 위해서, 예를 들어, "4.15총선에서 종로구 선거가 조작되었다"는 가설을 세운 다음에 선관위 발표 후보별 득표수를 분석해 보면 된다. 사전투표 조작이 없었다면, 선관위 발표 후보별 득표수는 무작위수(random numbers)일 것이다. 난수이자 자연수로 불리는 숫자는 다음처럼 어떤 규칙도 찾아낼 수 없다. X(더불어민주당 후보 득표수)와 Y(미래통합당 후보 득표수) 사이에는 어떤 규칙도 존재하지 않음이 밝혀지면 "선거에 문제가 없었다"고 결론 내릴 수 있고, 가설은 폐기된다. <표1> 데이터에서 어떤 규칙을 찾아낼 수 없는 경우 2. 그런데 외부 개입 즉 사전투표 조작이 있었다면, 정확한 규칙(reguality)을 찾아낼 수 있다. 예를 들어, X(더불어민주당 후보 득표수)와 Y(미래통합당 후보 득표수