관리 메뉴

happyday**

[심리학과의 만남]제 1과/ 심리학 연구방법(2) 본문

임상심리학 Study

[심리학과의 만남]제 1과/ 심리학 연구방법(2)

dlrudals__* 2022. 12. 1. 13:01
반응형

(2) 상관 연구

상관 연구(correlational study)에서는 변인 두 개를 측정하여 두 변인이 서로 관련되어 있는지(둘 중 하나의 측정치로 다른 변인의 측정치를 예측할 수 있을 정도)를 결정한다. 변인(variable)이란 두 가지 이상의 값을 취할 수 있는 요인(연구대상의 특성)을 일컫는다. 

1. 상관계수

두 변인이 관련된 정도를 검토하기 위해 연구자는 상관계수(correlation coefficient)라는 통계치(statistics)를 계산한다. 상관계수는 두 변인이 관련된 정도 및 그 유형을 알려주는 통계치로 -1.0에서 +1.0 사이의 값을 취한다. +/- 기호는 각각 상관이 정적 상관인지 부적 상관인지를 나타낸다. 정적 상관(positive correlaiton)은 두 변인의 값이 함께 변한다는 뜻이다. 즉, 한 변인의 값이 증가하면 다른 변인의 값도 증가하고 한 변인의 값이 감소하면 다른 변인의 값도 감소한다는 뜻이다. 즉, 한 변인의 값이 증가하면 다른 변인의 값도 증가하고 한 변인의 값이 감소하면 다른 변인의 값도 감소한다는 뜻이다. 부적 상관(negative correlation)은 두 변인의 값이 서로 반대로 변한다는 뜻이다. 즉, 한 변인의 값이 증가/감소하면 다른 변인의 값은 감소/증가한다. 부적 상관의 좋은 보기로는 초등학생의 TV 시청 시간과 학교 성적을 들 수 있다. TV 시청 시간이 길 수록 성적은 낮아지는 것으로 드러났다(Ridley-Johnson, Cooper, & Chance, 1983).  한 마디로 요약하면 상관관계의 기호는 두 변인 간 상관관계의 유형을 나타낸다. +/-는 정비례 관계를 나타내고 -는 반비례 관계를 나타낸다. 

 상관계수의 두 번째 부분인 0과 1 사이의 절대치는 두 변인 간 관계가 밀접한 정도를 나타낸다. 0과 0에 가까운 상관이 없다는 뜻이고, 1에 가까울수록 그 관계는 더욱 밀접해진다는 뜻이다. 수직선상 숫자는 양수가 음수보다 크지만 상관계수의 경우 관계의 강도는 그 절대치로만 말한다. 예컨대 상관계수 -. 50은 +. 25보다 두 변인 간의 관계가 더 강하다는 뜻이다. 관계의 강도가 높을수록 두 변인 간 관계에 대한 예측이 더욱 정확해진다. 상관계수가 +(-) 1.0이라면 한 변인의 값을 기초로 다른 변인의 값을 완벽하게 예측할 수 있다. 그러나 심리학 연구에서 발견되는 상관계수는 사실상 전부 다 그 절대치가 1.0보다 작다. 그러므로 실제로는 어떤 경우이든 완벽한 예측은 할 수가 없다. 상관관계가 매우 강해도 거의 항상 예외가 존재한다는 뜻이다. 예외는 두 변인 간의 관계가 완벽하기 않다고 말할 뿐이다. 

2. 산포도와 예측력

상관계수의 예측력을 이해하는 좋은 방법 중 하나는 산포도(scatterplot)를 검토하는 것이다. 산포도는 상관 연구를 통해 수집된 자료를 시각적으로 묘사하는 그림이다. 산포도의 각 점은 표본의 구성원 각자에서 측정한 두 변인의 점수를 나타낸다. 상관 연구는 대부분 많은 대상을 상대로 자료를 수집하기 때문에 산포도는 대부분 많은 점으로 구성된다. 

 한 변인에서 낮은 점수는 다른 변인에서 낮은 점수와 짝을 이루고, 높은 점수는 높은 점수와 짝을 이룬다. 이런 관계를 정비례 관계라 한다. 그리고 한 변인에서 낮은 점수가 다른 변인에서 높은 점수와 짝을 이루고, 높은 점수와 짝을 이루는 관계를 반비례 관계라 한다. 

 점수들이 특정 방향으로 모이는 경향을 보이지 않고 아무렇게나 흩어져 있는 경우 상관계수는 0에 가깝고 예측력은 최소가 된다. 이는 두 변인 사이에 상관이 없음을 보여 준다. 산포도의 점들이 사방에 골고루 흩어져 있을수록 상관관계의 강도는 낮아진다. 흩어진 경우가 최대이면 관계의 강도는 0에 가깝고 예측력이 거의 없다.

3. 제3변인 문제

관계가 밀접(강)할수록 예측력은 증가한다. 그러나 아무리 관계가 강해도 두 변인 간 관계가 인과관계라는 결론은 내릴 수 없다. 상관관계는 인과관계의 필수조건일 뿐 충분조건은 되지 않기 때문이다. 변인 간 인과관계에 관한 논의는 엄격한 실험을 통해 수집된 자료가 있을 때만 가능해진다. 상관관계를 나타내는 자료로는 두 변인의 인과관계를 결정할 수 없다는 뜻이다. 그 이유를 따져보자.

 자긍심과 우울증 간의 부적 상관관계를 예로 들어 따져보자. 자긍심(self-esteem)이 낮아질수록 우울증은 높아진다. 그러나 자긍심이 낮아지기 때문에 우울증이 높아진다고는 말할 수 없다. 첫째, 우울증이 높아져 자긍심이 낮아졌을 수도 있기 때문이다. 둘째, 이 두 변인 간 관계의 배후에 제3변인이 관여하고 있을 수도 있다. 예컨대 낮은 자긍심과 높은 우울증을 경험하도록 하는 성향을 가지고 태어난 사람도 있을 수 있고, 뇌 속 특정 화학물질의 작용 때문에 자긍심은 낮아지고 우울증은 높아질 수 있다. 이 처럼 전혀 엉뚱한 다른 변인 때문에 두 변인 사이의 관계가 밀접하게 나타날 수도 있는데, 이런 문제를 제3변인 문제(third-variable problem)라 한다. 간단히 말해 상관 연구에서는 이런 제3 변인이 통제되지 않기 때문에 두 변인 간 관계가 인과관계인지를 결정할 수가 없다. 

 이번에 아이스크림 판매량과 산불 발생 횟수 사이에 발견된 정적 상관관계(Silver, 2012)를 생각해보자. 이 상관관계를 유발한 제3변인은 무엇일까? 한 여름의 땡볕이다. 아이스크림 판매도 산불 발생도 여름에 더 자주 일어난다. 이처럼 다른 변인들에 의해 유발된 상관관계를 피상적 상관관계라고 한다. 피상적 상관(spurious correlation)이란 변인 간 관계가 서로 간의 직접적 관련성이 아니라 이들 각각과 다른 변인들과의 비인과적 관련성을 통해 간접적으로 설정된 상관관계를 일컫는다. 

 요컨대 상관 연구를 통해 연구자가 할 수 있는 것은 인과관계에 관한 가설 개발밖에 없다. 이렇게 개발된 가설의 타당성, 즉 실제로 두 변인이 인과관계로 연결되어 있는 지를 판단하기 위해서는 실험을 실시해야만 한다. 이 실험에서는 두 변인 중 하나를 조작하고 그 조작이 다른 변인에 미치는 효과를 측정한다. 이때 알게 모르게 이 두 번째 변인에 영향을 미칠 수 있는 제3변인을 포함한 모든 다른 변인은 엄격하게 통제되어야 한다. 

 

반응형