학계에서는 통계가 빠질 수 없다. 전공과목에 상관없이 통계가 들어가지 않은 논문이 없을 정도니 말이다. 또, 통계가 들어가야 뭔가 있어보인다고 하는 교수도 있으니, 우리 나라 대학에서 통계에 대한 사랑은 아주 유별나다고 할 수 있다. 하지만, 통계를 모두 믿는 것은 때로는 잘못된 정보를 얻는 지름길이 된다. 그리고, 통계를 인용하길 좋아하는 언론의 뉴스 역시 같은 이유로 잘못된 정보일 가능성이 높다고 할 수 있다. 그렇다면, 왜 통계를 믿으면 안되는 이유에 대해서 알아보자.
1. 같은 주제에 대해 매번 달라지는 조사 주체
나는 커피에 대한 연구 결과가 참으로 흥미로운데, 어떤 결과를 보면 커피가 건강에 좋다고 하고, 어떤 결과를 보면 커피가 건강에 해롭다고 하기 때문이다. 이것은 커피와 건강의 관계를 두고, 조사 주체가 다르기 때문에 발생한다.
가령, 카페인에 대해 연구하는 연구소는 커피의 카페인과 건강을 연관시켜, 커피에 카페인이 많고, 이에 부정적으로 반응하는 사람이 많기에 커피를 자주 마시면 건강에 해롭다는 결론에 이른다. 반면, 커피의 황산화 물질에 주목하는 연구소는 이것이 많은 사람에게 긍정적인 영향을 미치기 때문에 건강에 좋다고 말한다. 결국, 건강에 대한 조사 주체가 다르기 때문에 우리는 지금 커피가 건강에 좋다 또는 건강에 나쁘다 라는 말을 시도없이 언론을 통해 들을 수 있다.
여기에 통계 수치는 건강에 좋다 또는 건강에 나쁘다 라는 것을 증명해주는 자료로 사용되는데, 이 자료는 애초에 건강 정도를 판단하는 조사 주체가 다르므로 통계 결과는 그저 보여주기식에 불과하다고 볼 수 있다. 통계를 바탕으로 커피를 마시는 것이 '건강에 좋다 또는 건강에 나쁘다' 라고 판단하기에는 부족하다는 것이다.
과연 어떤 커피가 건강에 좋은 것일까?
2. 같은 통계 결과라고 해도 자료 수집 기준이 달라
이것의 가장 좋은 예는 전세계를 대상으로 조사한 성범죄율이다. 우리 나라 사람들이 잘 모르겠지만, 스웨덴은 강간 범죄율 2위의 나라다. 이 사실은 내가 아마 최초로 우리 나라 사람들에게 알렸을 것이다. 나는 지난 2012년 9월달에 이 사실을 여기 블로그를 통해 밝힌 적이 있다. (링크)
하지만, 여기에는 큰 통계적 오류가 있다. 우선, 스웨덴은 강간 범죄에 아주 엄격하여, 일정 시점에 한 여성에게 발생한 다수의 범죄를 모두 각각의 범죄로 기록하고 있다. 가령, 스웨덴의 여성이 1년 동안 남편에게 강간당했다고 경찰에 신고하는 순간 그 여성은 365회의 강간을 당했다고 스웨덴 경찰은 기록하는 것이다. 다른 나라 같은 경우라면, 1회라고 기록하는 반면 스웨덴 강간 범죄 숫자는 365회라고 보는 것이다. 그리고, 만약 법원에서 그 형이 확정되면, 정말 365회의 강간범죄가 된다.
다른 나라인 경우, 이러한 사건은 1회로 보고 된다. 그리고, 인도 같은 경우는 강간 범죄에 대한 신고가 거의 없다. 즉, 강간범죄율이란 통계만 봤을 때, 스웨덴은 인도보다 아주 위험한 국가라고 판단할 수 있는 것이다. 하지만, 아무도 그렇게 생각하는 사람은 없다. 인도가 스웨덴보다 안전하다고 생각하는 사람을 오히려 더 찾기 힘든 것이다. 이처럼 통계의 자료 수집 기준이 다를 경우 같은 통계 결과만 보고 잘못된 판단을 할 수 있다. 아마 스웨덴과 인도에 대해 아무것도 모르는 여성이 있다면, 여행 비용 등 다른 조건이 모두 같다고 할 때 이 통계만 보고 스웨덴보다 인도 여행을 선택할 가능성이 높을 것이다.
BBC가 보도한 스웨덴의 강간률이 주목받는 이유
3. 통계 자료 수집 자체에 강압적이거나 심리적 요인이 들어갈 수 있어
이것은 보여주기식으로 통계를 적극 활용한 예다. 그리고, 이것의 가장 좋은 예는 군대에서 살펴볼 수 있다. 군대는 참으로 특수한 조직이다. 폐쇄적이면서도 국민들에게 어느 정도 정보를 공개해야 하기 때문이다. 그리고, 정보 공개에는 통계가 꼭 활용된다. 아래는 국방부가 발행하는 신문이다.
국방일보 말대라면 군대에서 사고치는 사람이 거의 없어야 한다.
장병 중 군생활에 만족하는 비율이 96%가 나왔다는 사실은 군대에 갔다온 사람이라면 절대 믿을 수 없는 수치다. 어쩌면, 여성들은 이 수치를 아무렇지도 않게 믿을 수 있겠지만, 군대에 갔다온 남자라면, 저 수치는 절대 불가능한 것이라고 본다. 춥고, 먹고 싶은 것을 먹지 못하고, 잘 씻지 못하고 훈련하는 생활을 좋아할 남자는 아무도 없는 것이다.
그렇다면, 저 통계 수치는 어떻게 나온 것일까. 내가 판단하기에 상관의 명령을 들어야 하는 군대라는 특수성으로 인해 설문 조사 자체가 강압적이었을 가능성이 높다. 그리고, 사실대로 조사에 임해야 하는데, 사실대로 말할 경우 그 이후에 따라오는 군대 생활의 험난해질 수 있다는 심리적 압박감도 한몫했을 것이다.
이처럼 통계 자료 수집 자체에 심리적으로 자유롭지 않은 상태라면, 통계 수치 자체를 신뢰할 수 없게 된다. 하지만, 대부분의 통계는 그 정도의 차이는 있겠지만, 군대에서의 군생활 만족도 조사나 기업 자체에서 조사하는 직장 만족도 조사같은 것처럼 강압적인 경우가 종종 있다. 이와 같이 믿을 수 없는 통계가 양산되고 있는 한 통계를 곧이곧대로 신뢰하기에 무리가 있지 않을까.