제가 통계 분석 방법을 배울 때 가르쳐 주는 사람없이 혼자 배워서 너무 힘들었던 기억이 있기 때문에,
제가 할 수 있는 범위 내에서 가능한 한 친절하게 가르쳐 드리려고 하는데,
다른 통계 분석 방식에 비해 SEM에 대해서 만큼은 너무나 많은 편견과 오해가 있는 것 같고,
또 많은 분들이 SEM에 대한 막연한 비판도 많이 하시는 것 같습니다.
저에게 SEM에 대해 말씀하시는 분들의 대표적인 이야기들은 다음과 같은 것들 입니다.
" SEM으로 통계 분석하면 원하는 결과는 다 만들 수 있잖아 ㅎㅎ"
"구조 방정식으로 돌려 보니까 통계 결과가 예상한 대로 안나와요...
이거 이리저리 돌려보고 연결해 보면 잘 나오게 할 수 있죠?? ^^;;"
"SEM... 그거 아~~~트 잖아^^"
(물론 모든 분들이 이런 오해나 편견을 가지고 계시는 것은 아니라는 점은 명확히 밝혀 둡니다...)
SEM이 과연 이런 요술 상자일까요??
(Marcoulides & Saunders (2006)은 최근에 요술 상자라는 표현을 Magical Silver Bullet으로 표현했더군요..)
결론적으로 말씀드리면 SEM은 아무 생각없이 분석했을 때 대단한 요술 상자가 맞습니다^^;;
그런데 포샵질 잘못하다가 모 교수님이 제자들 대동하고 기자 회견을 했던 것처럼,
SEM을 요술 상자로 생각했다가는 줄기 세포 포샵질과 같은 심각한 문제가 생길 수도 있습니다.
(물론 SEM으로 아무리 열심히 삽질해 봤자 줄기 세포 포샵질의 임팩트와는 비교할 수 없겠죠^^)
SEM을 요술 상자로 생각하시는 분들의 가장 큰 이유는,
1. 화살표를 이리저리 연결해 보거나,
2. Data Screening을 통해,
원하는 결과를 어떻게 해서든 만들 수 있고, 모델 적합도 수치 (Model Fit)를 높일 수 있기 때문인 것 같습니다.
그러나 이와 같은 방법으로 연구 결과를 만들어 내는 것은 SEM의 기본 가정이나 연구 윤리를 어기는 것이며,
이와 같은 내용을 근거로 SEM에 대해 비판하는 것도 문제가 있다고 생각합니다.
대부분의 비판 내용이 SEM에 자체의 문제이라기 보다는 SEM을 사용하는 연구자들의 문제이거나,
다른 통계 분석 방식에서도 동일하게 발생할 수 있는 문제들 이기 때문입니다.
1. 화살표를 이리저리 연결해 보는 경우의 문제
SEM은 설문이나 실험을 통해 수집한 데이터를 가장 간명한 모형 (Parsimonious Model)으로 가능한 한 데이터의 많은 부분을 설명하고자 하는 통계 분석 방법입니다.
이러한 관점에서 SEM의 모델 적합도 수치는 연구자가 수집한 데이터의 전체 연결 관계를 통해 산출된
Covariance Matrix와 연구자가 구성한 연구 모형을 통하여 산출된 Covariance Matrix을 비교하여,
연구자의 연구 모형을 통한 Covariance Matrix가 수집된 Data Set의 Covariance Matrix와 얼마나 Fit 한지 (얼마나 많은 부분을 설명해 주는지)에 대한 수치입니다.
(물론 모든 적합도 수치가 이러한 것을 의미하지는 않지만 이렇게 설명하는 것이 보다 이해가 쉬울 것 같습니다)
따라서 SEM 상에서 변수들 간 연결 관계를 많이 만들면 만들 수록 모델 접합도 수치는 높아지게 되며,
변수들 간 연결 가능한 모든 관계를 설정했을 때, 모델 적합도 수치는 1이 됩니다.
이러한 SEM의 원리 때문에 복잡한 연관 관계를 맺은 모델은 모델 적합도 수치는 높아 지게 되는 것입니다.
그러나 SEM은 Confirmatory Analysis 이기 때문에 이리저리 변수 간의 연결 관계를 만들면서,
모델 적합도 수치를 높이거나, 우연히 (Capitalization on Chance) 영향력이 높은 Path를 발견하는 것은
이론적으로 또는 실용적으로 전혀 의미가 없을 수 있습니다.
Chin (1998)이 말한 것처럼 "Everything correlates to some extent with everything else" 이기 때문이죠.
따라서 SEM에서 변수 간의 연결 관계는 반드시 이론적인 또는 논리적인 근거가 있어야 하는 것입니다.
이러한 이유 때문에, 이론적인 또는 논리적인 근거 없이 Model Modification을 통한 Path의 발견은 Confirmatory Mode라는 SEM의 기본 가정을 위배하는 것입니다.
따라서 이리저리 연결하면 원하는 결과를 만들 수 있는 것이 SEM이라는 비판은 SEM을 제대로 활용하지 못하는 사람에 대한 비판이 되어야 할 것 같습니다.
또한 아무 이론적 또는 논리적 근거 없이 Model Modification을 통해 모델 적합도 수치를 높여 나가는 방식은,
아무 이론적 또는 논리적 근거 없는 독립변수를 기반으로 한 실험 데이터의 ANOVA 또는 t-Test에서 통계적으로 유의미한 차이를 만들어 내는 것과 다를 바 없는 것입니다.
따라서 SEM에 대한 이리저리 연결하면 원하는 결과를 만들 수 있는 것이 SEM이라는 비판은 ANOVA나 t-Test에도 똑같이 적용될 수 있는 논리로 보여집니다.
2. Data Screening의 문제
많은 분들이 SEM에서 Data Screening을 통해 원하는 결과를 만들어 내는 것에 대해 비판을 하십니다.
그런데 이러한 Data Screening의 문제도 ANOVA나 t-Test를 비롯한 모든 통계 분석 방법에 적용되는 문제임에도 불구하고, SEM을 비판하시는 분들이 빠짐없이 이야기 하는 문제인 것 같습니다.
얼마나 연구자들이 Data Screening을 통해 원하는 결과를 만들어 내는 상황이면,
SEM에만 적용되는 문제가 아님에도 불구하고 이것을 가지고 많은 분들이 비판하시는지 걱정이 됩니다.
제가 추측해 보면,
일반적으로 SEM으로 분석하는 데이터가 N값이 많기 때문에 연구 윤리에 어긋나는 Data Screening이 많이 일어나는 것 같습니다.
그러나 Data Screening의 문제를 근거로 한 SEM의 비판도 SEM 자체에 대한 비판이라기 보다는 연구자에 대한 비판이어야 할 것 같습니다.
물론 타당한 원칙에 근거한 Data Screening은 반드시 해야 하는 것입니다.
그러나 원하는 결과를 만들어 내기 위한 Data Screening은 연구 윤리에 위배되는 것이겠죠.
SEM 자체에도 많은 타당한 비판과 문제점들이 있습니다.
그러나 아직까지는 SEM이 상당히 Powerful한 통계 분석 방식임도 분명한 것 같습니다.
이상의 이야기를 정리하면,
1. SEM에 대한 비판의 대부분은 SEM 자체에 대한 비판이라기 보다는,
SEM을 잘못 활용하는 연구자에 대한 비판이 되어야 한다
2. SEM에 대한 많은 비판은 ANOVA나 t-Test와 같은 다른 통계 분석 방식에서도 동일하게 발생할 수 있는 문제이다
정도로 정리할 수 있을 것 같습니다.
따라서 SEM을 비판하시는 분들은 이와 같은 것들을 이해해 주시면 좋을 것 같고,
SEM을 활용하시는 분들도 이러한 오해와 편견에서 자유로워 지기 위해서는,
SEM에 대해 보다 명확하게 알고 활용해야 할 필요가 있을 것 같습니다.
저도 SEM에 대해 아직 잘 알지 못하지만,
현업에 계신 분들이나 심리학을 전공하신 분들이 가끔 저에게 말씀하시는 SEM에 대한 비판을 듣고,
저의 생각을 나름대로 정리해서 블로그에 남겨 봅니다...
사실 저는 SEM 보다 ANOVA나 t-Test를 훨씬 좋아 합니다^^
[참고 문헌]
Marcoulides G.A. & Saunders, C. (2006). PLS: A Silver Bullet? MIS Quarterly, 30(2), 3-11.
Chin, W.W. (1998). Issues and Opinion on Structural Equation Modeling. MIS Quarterly, 22(1), 7-16.
Kline, R.B. (2005). Principles and Practice of Structural Equation Modeling (2nd ed.). NY: The Guilford Press
'eBiz전략마케팅' 카테고리의 다른 글
1위 사이트는 무언가 있다. (0) | 2008.04.25 |
---|---|
왜 아키텍쳐 설계가 필요한가? (0) | 2008.04.25 |
좋은 디자인이란?? (0) | 2008.04.23 |
진상고객때문에 망하는 쇼핑몰 (2) | 2008.04.23 |
웹 2.0과 도서관 (0) | 2008.04.23 |
댓글