인공지능(AI) 보조 대장내시경 시스템에서 위양성(False, positive, 정상적인 대장주름과 점막을 용종으로 오인식하여 경보) 비율을 낮추는 것이 선종 발견률을 높이고 불필요한 용종 절제 비율을 줄이는 데 효과적이라는 연구 결과가 발표됐다.
서울대학교병원 강남센터 배정호 교수팀(제 1저자: 정고은 교수)은 동일한 민감도(100%)를 가진 두 가지 대장내시경 인공지능 시스템(아이넥스코퍼레이션)에서, 위양성 비율이 높은 시스템 A(3.2%)와 낮은 시스템 B(0.6%)를 비교했다.
그 결과 위양성 비율이 낮은 시스템 B가 선종 발견률과 대장내시경 당 선종 수에서 유의미하게 높은 성과를 보였다.
위양성 비율이 낮은 시스템 B는 선종 발견률에서 50.4%를 보이며 표준 대장내시경(44.3%)과 위양성 비율이 높은 시스템 A(43.4%) 보다 높은 달성률을 보였다.
또한, 비종양성 용종 절제 비율을 21.3%로 억제하며, 위양성 비율 관리가 임상 성능과 효율성 향상에 중요하다는 점을 입증했다.
이 연구는 2021년부터 2022년까지 약 3,000명의 수진자를 대상으로 전향적 디자인으로 진행됐다.
교수팀은“인공지능 시스템의 불필요한 경보가 과도하면 임상의의 집중도가 저하되어 중요한 병변에 대한 경보를 놓칠 가능성이 높아지는‘양치기 소년 효과(Crying Wolf Effect)’가 발생할 수 있다.”라며, “적정수준의 민감도를 유지하면서 동시에 위양성 비율을 효과적으로 관리하는 것이 실질적인 임상 활용도를 높이는 핵심이다.”라고 강조했다.
세부 분석에 따르면“위양성 비율이 높은 시스템 A는 대장내시경 숙련자들에서 표준 대장내시경에 비해 선종 발견률을 저하시키는 동시에 불필요한 용종 절제를 늘여서 오히려 환자의 안전과 의료의 비용효과성에 나쁜 영향을 줄 수 있다.”라며,“인공지능 도입 시 실제 의료환경에서 다양한 의료진과의 상호작용이 철저히 검증되어야 한다.”라고 설명했다.
이번 연구는 인공지능 보조 시스템 개발에서 민감도와 특이도 간 균형이 중요함을 재확인하며, 의료 인공지능 기술 발전과 임상 적용 가능성에 중요한 시사점을 제공한다.
이번 연구 결과는 과학 분야 세계적 권위지 네이쳐 리서치(Nature Research)의 온라인 의학 저널인‘디지털 메디신(npj Digital Medicine)’최신호에 게재됐다.
한편 대장암은 전 세계적으로 세 번째로 흔한 암이며, 암 관련 사망 원인 중 두 번째를 차지한다.
선종을 포함한 전암성 용종의 발견 및 절제는 대장암 위험을 줄이는 데 핵심적이며, 대장내시경은 이를 위한 표준 절차로 자리 잡고 있다.
하지만 대장내시경은 시술자의 실력에 따라서 검사의 수행성적이 차이가 있는 것이 한계점으로 지적되고 있다.
교수팀은“인공지능 보조 대장내시경 시스템이 시술자에 따른 내시경 검사의 기술적‧인지적 한계를 극복하기 위한 가능성을 지니고 있다.”라고 설명했다.
[메디컬월드뉴스 김영신 기자]
Copyright ⓒ 메디컬월드뉴스 무단 전재 및 재배포 금지