gimmesilver's blog

Agbird.egloos.com

포토로그



인과관계와 상관 단상

이상한 홍준기 - 아이추판다
이상한 판다님 - 둘

 상관이란 통계 대상이 되는 두 변수간의 관계를 의미한다. 가령 우리 나라의 흡연률에 대해 조사를 해봤더니 남/여 통틀어 흡연률이 20%라고 하자. 이 때 만약 남성의 흡연률이 20%이고 여성의 흡연률도 20%라면 담배를 피는 것과 성별에는 아무런 상관이 없다라고 말한다. 하지만 남성의 흡연률은 10%인데 여성의 흡연률이 30%라고 한다면 이 때는 흡연과 성별에는 상관이 있으며 여성인 경우에 대해서 흡연이 양의 상관이 있다고 말한다.

 반면 인과는 말그대로 A사건이 B사건의 원인이 되는 경우(혹은 그 역)을 말한다. 따라서 통계적으로 인과관계에 있는 A,B 두 변수는 서로 상관있다라고 말할 수 있다. 하지만 물론 그 역(A, B가 상관있으면 둘은 인과 관계에 있다)가 항상 참인 것은 아니다. A와 B가 상관있는 경우 인과 관계로 엮을 수 있는 경우는 다음과 같다.
 1. A와 B가 어떤 다른 사건 C에 의해 야기되었다.
 2. A는 B의 원인이다. 혹은 그 역
 3. A(혹은 B)가 어떤 사건 C와 상관있는데 C는 B(혹은 A)의 원인이다.

  첫 번째 경우의 예는 감기의 증상인 열과 기침간의 관계를 들 수 있다. 열이 있으면 기침을 하는 경우가 많기 때문에 열과 기침은 상관이 있다. 하지만 열이 기침의 원인이거나 혹은 기침이 열의 원인인 것은 아니다.
 두 번째 경우를 우리는 인과관계라고 한다. 하지만 이 경우에도 A와 B중 어떤 것이 원인인지를 파악하는 것이 중요하다. 대개 우리가 알고 있는 미신이나 풍습에는 원인과 결과를 반대로 해석함으로써 생긴 것들이 많다. 예를 들어 옛날 우리 나라에는 바퀴벌레를 '돈벌레'라고 부르며 잡지 않는 풍습이 있었다. 왜냐하면 부잣집에는 바퀴벌레가 많이 살았는데 이것을 보고 바퀴벌레가 그 집안에 부를 가져다 준다고 생각했기 때문이다. 사실 집이 부유하면 먹을 것이 많아 바퀴벌레가 많이 생긴 것이고 따라서 집이 부자인 것이 바퀴벌레가 많이 생기는 것의 원인이지만 이것을 반대로 해석함으로써 생긴 잘못된 미신인 것이다.
 세 번째의 경우 역시 인과관계라 볼 수 없다. 예를 들어 담배를 피우는 사람이 재털이를 이용할 확률이 높다고 해서 재털이를 사용하는 것이 페암의 원인은 아니다. 

 위에 링크한 '이상한 홍준기'라는 글에서는 결혼적령기의 히스테리 여성과 아버지의 병간호 사이에 상관을 토대로 둘 간의 인과 관계에 대해 이야기하고 있다. 홍준기라는 분이 글에서 주장하는 바는 다음과 같다.
 1. 아버지의 병간호가 히스테리의 원인이 되었다고 생각하는 것은 상식적, 과학적 사고의 한계에 의한 단순한 원인 제시이다.
 2. 프로이트는 오히려 히스테리가 아버지 병간호의 원인이 된다고 주장했다.
 3. 따라서 프로이트는 당시의 단무지한 과학적 사고의 한계를 넘어섰다.

 아이추판다님이 글에서 주장하는 바는 다음과 같다.
 1. 아버지 병간호가 히스테리의 원인이라고 생각하든 아니면 역으로 히스테리가 아버지 병간호의 원인이라고 생각하든 둘 다 과학적 사고에 기초하고 있다. 따라서 프로이트가 과학적 사고의 한계를 극복했다는 홍준기의 주장은 모순된다.
 2. 홍준기의 글에는 히스테리가 아버지 병간호의 원인이라는 주장에 대한 근거가 미약하고 오류가 있다.

 아이추판다님의 첫번째 주장에는 논의의 여지가 없다. 홍준기라는 분은 확실히 과학적 사고에 대해 오해하고 있거나 적어도 표현을 잘못한 듯 보인다. 그가 말한 19세기 당시 다른 많은 사람들의 사고나 프로이트의 사고나 둘 다 어떤 두 가지 사건의 상관을 토대로 인과 관계를 파악하려는 전형적인 과학적 사고이다. 이 중에 어떤 것이 옳은가(혹은 단순한가) 하는 문제는 제시된 문단만으로는 평가할 수 없다(이를 위해 과학자들은 실험을 통해 근거를 제시한다).

 자 이제 두번째 주장은 통계적 사실을 통한 인과 관계 추정 시 빠지기 쉬운 오류를 이야기하고 있다.  위의 예의 경우 히스테리가 병간호의 원인이다라는 주장을 입증하려면 단순히 전체 결혼 적령기 여성 중 오랜 세월 아버지 병간호를 하는 비율보다 히스테리 여성의 병간호 비율이 높다는 사실을 제시하면 된다라고 생각하기 쉽다. 따라서 홍준기님의 글에 의하면 히스테리 여성 대부분이 아버지 병간호를 하고 있으므로 최소한 전체 결혼 적령기 여성 대부분이 아버지 병간호를 하고 있지만 않는다면 이 주장은 신빙성이 있어 보인다.
 그러나 이것은 상관이지 인과 관계가 아니다. 위 사실만으로는 히스테리와 병간호 중에 어떤 것이 원인이고 결과인지를 판단할 수 없다(심지어 인과 관계에 있는지조차 불분명하다). 심지어 히스테리가 병간호의 원인이라는 주장은 중요한 문제를 갖고 있는데 아이추판다님의 글에 나와 있듯이 히스테리 여성의 아버지들 대부분이 병에 걸렸다는 점 때문이다. 히스테리가 '아버지가 병에 걸리는 사건' 의 원인이거나 혹은 히스테리의 원인이 동시에 아버지의 발병원인이 아닌 이상 대부분의 히스테리 여성의 아버지가 병에 걸려 있다는 점을 설명하기 힘들다.
 이점에 대해서 둘님은 다음과 같은 가능한 사례를 들어 반박하고 있다.
사례2: 딸의 히스테리 발병 (time 1)--> 아버지 병에 걸리다 (time 2)-->딸의 아버지 간호 (time 3)
사례3: 아버지 병에 걸리다 (time 1)--> 딸의 히스테리 발병 (time 2)-->딸의 아버지 간호 (time 3)
 바로 이런 다양한 가능성 때문에 위와 같은 단순한 통계적 사실만으로는 히스테리와 병간호 사이의 인과 관계에 대해서 어떤 것도 단정지어 주장할 수 없다. 예컨대 둘님이 제시하신 사례2의 경우는 히스테리와 상관없이 '자신때문에 병에 걸린 아버지에 대한 죄책감으로 인한 병간호'라는 식으로도 설명이 가능하다.

 결론적으로 말해서 어떤 통계적 사실에서 인과 관계를 이끌어 내려면 단순히 두 사건 사이의 상관 이상의 다양한 통계 자료가 필요하다. 가령 위 내용에서처럼 히스테리와 아버지 병간호 간에 인과 관계를 규명하기 위해서는 적어도 딸의 히스테리 발병과 아버지 발병, 그리고 병간호 간의 시간적 순서에 따른 다양한 시나리오 간에 나올 수 있는 통계 자료가 필요하다. 물론 충분한 사례 수집을 통해 이런 데이터를 전부 얻을 수 있다면 가장 바람직하지만 실제 이런 다양한 자료를 수집하기에는 현실적으로 많은 어려움이 있다. 그리고 이런 한계 때문에 잘못된 인과 관계를 얻는 사례도 많이 있다. 관찰 기술의 한계로 인해 바이러스를 보지 못했던 20세기 초반까지 엉뚱한 박테리아들을 발병원인으로 몰고갔던 과거 사례가 그 예이다.
 이런 경우 인간은 직관과 상상력의 도움을 받아 논리를 구축하고 이를 통해 이론을 먼저 제시한 후 나중에 관찰을 통해 입증하기도 한다. 상대성 이론이 그 예이다. 어쩌면 홍준기님이 글에서 말하고 싶었던 것은 이것이었을지도 모르겠다.

덧글

댓글 입력 영역