가상 환자에게 권장 치료법·권장 약물 ChatGPT vs 1차 진료의
의사에 비해 ChatGPT는 편견 없고 치료 표준 지침에 근접
아무일 없이 불안하고 우울한데 우울증인지 긴가민가 하다면 ChatGPT에 먼저 물어보는 것은 어떨까. 최근 ChatGPT의 조언이 전문의의 처방과 비교했을 때 치료 표준을 따르는 데 더 나을 수 있다는 연구 결과가 나왔다. 이 연구는 AI가 정신건강의료의 의사결정을 향상할 수 있다는 잠재력을 보여준다.

세계적으로 우울증 환자가 증가하고 있다. 미국국립정신건강연구소(NIMH)에 따르면 2020년 기준 미국의 성인 8.4%가 심각한 우울증을 한 번 이상 경험했으며, 건강보험심사평가원이 밝힌 국내 우울증 환자도 2021년 기준 93만여 명으로 나타났다.
지속적인 치료가 필요한 우울증은 상담을 통해 환자의 환경과 상태를 정확하게 파악하는 첫 진료가 중요하다. 이 점에 착안한 한 연구팀은 가상의 우울증 환자를 설계해 ChatGPT와 1차 진료(초기 상담진료)의 진단을 비교하는 연구를 진행했다.
영국 런던 임페리얼 칼리지의 뇌 과학과 연구팀이 진행한 이 연구는 오픈 액세스 저널 Family Medicine and Community Health에 'Identifying depression and its determinants upon initiating treatment: ChatGPT versus primary care physicians(치료를 시작할 때 우울증과 그 결정 요인 식별 : ChatGPT vs 주치의)'라는 제목으로 지난 16일 게재되었다.

대화형 인공지능(AI) 기술인 ChatGPT는 이미 1억 명의 사용자를 확보하고 현재까지 가장 빠르게 확장되는 AI 소비자 애플리케이션이다.
연구팀은 'ChatGPT가 객관적인 데이터에서 파생된 통찰력을 빠르게 제공하여 기존의 진단 방법을 보완할 수 있는 잠재력'에 주목했다.
그들은 경증 및 중증 우울증에 권장되는 치료 접근법을 기술이 어떻게 평가했는지, 이것이 성별 또는 사회 계층 편견에 의해 영향을 받는지 여부를 프랑스 1차 진료 의사 1249명(여성 73%)과 비교하고자 했다.
연구팀은 가상의 우울증 환자를 설계했다. 성별, 사회 계층, 우울증 심각도 등 다양하게 변형된 8가지 버전의 삽화는 이전 3주 동안 슬픔, 수면 문제, 식욕 문제 증상을 가진 중증도의 우울증 진단을 받은 사례를 중심으로 신중하고 검증된 시나리오로 개발되었다.
8개의 가상 환자의 환경과 증상은 ChatGPT-3.5 및 ChatGPT-4의 인터페이스에 각각 입력되었다. ChatGPT 응답의 일관성을 위해 이 과정은 10번 반복되었다. 이후 연구팀은 "이 상황에서 1차 진료 의사가 무엇을 제안해야 한다고 생각합니까?"라는 질문을 입력했다.

그 결과 가벼운 우울증일 때 ChatGPT-3.5와 ChatGPT-4는 각각 95.0%와 97.5%에서 심리치료를 권장한 반면 1차 진료의는 4.3%에 불과했다. 중증 사례일 경우 모두가 심리치료와 약물치료를 결합한 방식을 추천했지만 ChatGPT 쪽이 더 적극적이었다.

권장 약물에서도 차이를 보였다. ChatGPT-3.5와 ChatGPT-4는 항우울제 단독 사용(각각 74%, 68%)을 선호했다. 이는 일반적으로 항우울제, 항불안제, 최면제를 혼합하여 권장하는 1차 진료의(67.4%)와는 대조적이다. 또한 ChatGPT는 성별이나 사회 경제적 편견을 나타내지 않았다.
연구팀은 'ChatGPT가 1차 진료의에 비해 편견을 나타내지 않고 경증 및 우울증 관리 지침과 일치했다'라고 밝혔다. 그들은 'ChatGPT와 같은 AI 챗봇이 임상 의사 결정을 향상할 수 있는 가능성이 있지만 잠재적 위험과 문제를 고려하기 위해 추가 연구가 필요하다'라고 전했다.
케미컬뉴스 박찬서 기자