What a beautiful world!
세상이 조금이라도 더 나은 방향으로 가기를 기대하면서

정치, 사회

문재인-안철수 양자 대결을 가정한 여론조사의 문제점

thinknew 2017. 4. 11. 16:56


http://bbs1.agora.media.daum.net/gaia/do/debate/read?bbsId=D115&articleId=3970193&pageIndex=1



네티즌들은 정말 대단하다. 짤방 이미지를 보면 현재 국회의장인 정세균 의원이 오세훈과 붙었을 때 여론조사 상으로 무려 17% 이상 열세로 나왔는데 실제로는 정세균이 52.6% 득표로 당선되었다. 여론조사 믿을 수 없다는 말이 나오는 것이 당연했다. 최근에는 실현 가능성도 없는 문재인-안철수 양자 대결에서 안철수가 이기는 결과가 나왔다. 그런데 우연의 일치라고 보기에는 너무나 괴이한 사실이 드러난다. 정세균 때의 여론조사와 양자 대결 여론조사가 같은 기자에 의해 작성되었다는 사실이다. 선관위에서 여론조사의 신뢰성을 조사하겠다고 했으니 그 결과를 두고 볼 일이다. 그 문재인-안철수 양자 대결 가상의 여론조사에 문제 제기를 한 통계학자가 있다. 기사를 보자.

http://www.ohmynews.com/NWS_Web/View/at_pg.aspx?CNTN_CD=A0002315587&PAGE_CD=N0004&utm_source=naver&utm_medium=newsstand&utm_campaign=top1&CMPT_CD=E0018M


"아래는 11일 장윤선 오마이TV 방송국장과 김재광 미국 아이오와주립대 통계학과 교수가 함께한 인터뷰 내용이다."
"제가 제기한 문제는 크게 두 가지인데요. 첫 번째 것은 3월과 4월 두 달에 한 번씩 한 조사에서 4월 조사가 3월 조사와는 많이 다른 모습이 조사 과정에서 보였는데요. 특히 비적격 사례 비율이라는 것이 있는데요. 조사에 사용할 수 없는 전화번호의 비율입니다. 조사 과정 중에서 나오는 통계인데요. 그걸로 보니까 3월에는 그것이 50% 이상이었는데, 4월에는 10% 미만으로 나왔습니다. 무작위 추출에서는 그렇게 나올 수가 없는 것이거든요. 이게 무작위 추출이 아니거나, 뭔가 이상한 일이 일어난 게 아닌가 하는 생각을 하게 됐고요. 두 번째로 제기한 문제는 무선 조사에서 사용된 국번이 60개밖에 되지 않습니다. 3월에는 무작위로 뽑으니까 8천 개가 뽑혔는데요. 그게 국번이 총 9999개거든요. 거기서 무작위로 뽑으면 많이 뽑혀야 하는 게 정상인데요. 4월에는 60개밖에 사용되지 않아서 왜 그걸 굳이 그렇게 위험하게 했을까 하는 부분이 제가 문제 제기한 부분입니다."

여론조사가 정확하지 않다는 것은 널리 알려져 있는 것이고, 실제로도 엉터리 결과를 내놓아 망신을 산 경우가 흔하다. 그래서 여론조사는 그 한번의 결과에 관심을 가지는 것이 아니라 변해가는 정도에 주로 관심을 가진다. 한편, 찌라시들을 중심으로 한 안철수 띄우기가 상당히 강도높게 진행되고 있다는 점도 대체로 인정하는 사안일 것이다. 그런데 이런 움직임을 확인시켜 준 것이 바로 '문재인-안철수 양자 대결'에서 안철수가 이긴다는 그 여론조사 결과일 것이다. 이 결과는 두가지 점에서 황당하다. 하나는 실현 가능성이 없는 양자 대결을 가정했다는 것이고, 다른 하나는 그동안의 여론조사의 흐름을 일거에 뒤집은 결과라는 점이다. 아니나 다를까, 그 결과가 심히 의심스럽다는 것이 통계학자의 문제 제기에 의해 드러났다.

여론이 이렇게 한순간에 손바닥 뒤집듯이 뒤집힐 수는 없다. 다른 몇몇 조사에서 보면 안철수의 상승세는 분명하게 확인되지만 5자 대결에서 안철수 우세로 뒤집힌 것은 문제가 되는 KBS-연합뉴스 조사 외에는 없다. 장난도 도가 지나치면 탈나게 되어 있다. 그러니 선관위의 조사를 예의 주시할 필요가 있다.