서동기 한림대 심리학과 교수
다른 학문에 비해, 심리학이 어려운 이유는 이러한 심리검사가 온도계와 달리 물리적인 것을 측정하는 것이 아니라 눈에 보이지 않는 인간의 마음을 측정하기 때문에 정확하게 측정하기 어렵다는 것이다. 즉 측정의 오차가 필연적으로 발생하고 오차의 종류가 많을 뿐만 아니라 생각지도 못한 곳에서 발생하기 때문에 이를 줄이기가 쉽지 않다. 이러한 측정의 부정확성을 해결하기 위해 심리학자들이 여러 가지 방법론을 이용하여 검사 개발을 해오고 있다. 최근에는 데이터 분석과 컴퓨터를 이용해 검사를 개발하고 있고 피검사자의 성격과 특성에 따라 자동으로 검사가 생성되는 맞춤형 검사(adaptive testing)도 개발하고 있다. 많은 인공지능(AI) 및 빅데이터 소프트웨어 전문회사들은 감성 분석 인공지능을 이용한 심리분석과 심리상담 플랫폼을 제공하고 있고 인공지능을 이용하여 면접하면 좀 더 훌륭한 인재를 채용할 수 있다고도 광고한다. 그러나 그 어디에도 그 결과가 과학적으로 타당하다는 증거를 찾아볼 수는 없다.
4차산업 시대에서 인공지능과 빅데이터 분석 도구를 이용한 심리학 연구는 피해갈 수 없는 흐름임이 확실하다. 하지만 인공지능과 빅데이터 분석 도구가 모든 것에 만능인 것은 아니다. 심리학이 주술이나 점성술과 다르게 학문으로 남을 수 있는 이유는 검정 가능한 과학이기 때문이다. 아무리 새로운 도구가 잘 발달하였다고 하더라도 이론과 목적에 맞게 사용되어야 하고 예측에 대한 이론이 검정 가능해야 한다. 예를 들어, 혈액형을 가지고 사람의 성격을 파악하는 것을 재미로 즐기는 것은 문제가 없다. 그러나 그 결과를 가지고 채용이나 선발을 결정하는 도구로 사용한다면 큰 문제이다. 과학적으로 검정되지 않았기 때문에 이제는 혈액형이 성격유형과 관계있다고 말하는 사람은 거의 없다. 전형적으로 너무 모호해서 누구에게나 적용 가능한 설명을 특정한 개인에게 적용되는 것처럼 받아들이는 바놈효과(Barnum effect)로 쉽게 말하면 코에 걸면 코걸이, 귀에 걸면 귀걸이인 식으로 해석이 가능하기 때문이다. 심리학에서도 인공지능과 빅데이터 연구 방법이 사용되고 활성화되는 현상은 바람직하다. 하지만 인공지능 분석 도구를 이용해서 나온 결과를 검정하지 않고 현장에 적용하는 것은 위험하다. 최근에 대화형 인공지능 “이루다”의 서비스가 잠정적으로 중단된 것을 보았다. 서비스가 중단된 이유는 여러 가지가 있겠지만 많은 데이터를 수집하고 복잡한 알고리즘을 이용한다고 해서 더 적합한 서비스를 제공한다고 볼 수 없음이 여실히 드러났다. 모의실험과 검정의 결과를 많이 축적하고 서비스를 제공했다면 오랫동안 사랑을 받았을 텐데 아쉬움이 남는다. 인공지능을 이용한 분석의 방법론에 대한 문제가 있다고 말하는 것이 아니다. 인공지능과 빅데이터 분석은 심리학 연구에서도 이용하고 발전시켜야 할 훌륭한 도구이다. 간과하지 말아야 할 것은 새로운 도구를 가지고 예측한 결과가 타당한지를 검정하는 과정이 있어야 한다는 것이다. 인공지능이나 빅데이터 분석을 이용한 결과에 대한 타당성 검정이 이루어지기 전에 현장에 적용한다면 이는 백신을 개발하고 임상시험을 하지 않은 채 사람에게 백신을 투여하는 것과 같은 결과를 초래할 수 있을 것이다.
서동기 한림대 심리학과 교수
Copyright ⓒ 서울신문. All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지