정신건강의학과 폐쇄병동에서는 자해 행동을 조기에 발견하는 것이 환자 안전에 결정적인 역할을 한다. 하지만 의료진의 상시 관찰에는 인력 부담과 사각지대라는 구조적 한계가 있어 지속적으로 논의의 대상이 되어 왔다. 이에 연구팀은 영상 기반 AI 행동 인식 기술이 실제 임상 환경에서 자해 행동을 얼마나 정확하게 감지할 수 있는지, 그리고 연구실 환경에서 학습된 AI 모델이 실제 병동에서도 동일한 성능을 보이는지를 검증했다.
연구팀은 정신건강의학과 병동 환경을 실제와 유사하게 구현한 스튜디오에서 자해 행동을 모사한 영상 1,120건을 제작하고, 고대구로병원 정신건강의학과 폐쇄병동에서 수집한 실제 임상 영상 118건을 검증 데이터로 활용했다. 모든 실제 임상 영상은 비식별화 처리 후 분석됐으며, 의료기록과의 교차 검증을 통해 임상적 신뢰도를 확보했다. 이후 연구팀은 최신 딥러닝 기반 행동 인식 AI 모델 6종을 동일한 조건에서 학습·평가하며 자해 행동 모니터링 성능을 비교했다.
그 결과 행동 인식 AI 모델들이 스튜디오 환경에서는 비교적 높은 성능을 보였지만, 실제 임상 영상에 적용될 경우 성능이 유의미하게 저하되는 것으로 나타났다. 최신 트랜스포머 기반 AI 모델조차도 실제 환경에서는 자해 행동의 다양성, 가림 현상, 비정형적 움직임의 차이를 충분히 일반화하여 인식하지 못했다. 특히 긁기, 피부 뜯기 등 미세하고 반복적인 자해 행동은 기존 AI 모델이 감지하기 가장 어려운 유형으로 확인됐다.
정현강 교수는 “이번 연구의 가장 큰 의의는 AI 기반 자해 감지 기술의 ‘가능성’과 ‘한계’를 동시에 정량적으로 입증했다는 점”이라며 “연출 데이터와 실제 병동 데이터를 체계적으로 비교함으로써, 현재 기술 수준에서 AI 모델의 임상 적용을 위해 무엇이 보완돼야 하는지를 명확히 제시할 수 있었다. 더불어 이번 연구를 통해 구축한 스튜디오 기반 자해 행동 데이터셋을 바탕으로 정신의학·의료 AI 분야 전반의 연구 활성화에도 기여할 것으로 기대된다”고 말했다.
이번 연구결과 논문 ‘스튜디오 및 실제 환경 데이터셋에서 자해 행동 감지를 위한 행동 인식 모델 성능 비교 평가(Benchmarking action recognition models for selfharm detection in studio and real-world datasets)’는 사이언티픽 리포트(Scientific Reports) 최신호에 게재됐다.
Copyright ⓒ 이데일리 무단 전재 및 재배포 금지