| 한스경제=김종효 기자 | AI 기반 온라인 평가 솔루션 '모니토'를 운영하는 그렙은 생성형 AI로 인한 평가 신뢰성 이슈가 확산되는 가운데 '모니토플러스(Monito+)'가 평가 환경 관리 방식의 기술적 해법으로 주목받고 있다고 17일 밝혔다.
ChatGPT 등 생성형 AI 도구 확산으로 온라인 시험과 과제 평가에서 AI 활용 여부를 결과물만으로 판단하는 데 한계가 있다는 지적이 이어지고 있다. 최근 한 대학에서 진행된 실험 결과 동일 과제를 AI 활용 여부에 따라 수행했을 때 답안 간 판별이 어려운 것으로 나타났다. AI를 활용한 학생들이 거의 만점에 가까운 점수를 받은 반면 자기 힘으로 작성한 학생들은 50~60점대에 머물렀지만 결과물만으로는 구분이 어려웠다.
이에 따라 일부 교육기관은 AI 탐지 기술을 도입했으나 간단한 프롬프트 조정이나 문장 순서 변경만으로 우회가 가능해 실효성 논란이 제기돼 왔다. 교육 관계자들은 "AI 사용 의심만으로는 감점할 수 없다"며 결과물 검증 방식의 한계를 지적하고 있다.
이런 문제 의식 속에서 대학과 교육기관들은 평가 방식을 조정하고 있다. 필기 시험이나 구술 평가를 병행하거나 AI 활용을 전제로 한 혼합형 평가를 도입하는 사례가 늘고 있으며 부정행위를 할 수 없는 환경을 기술적으로 구축하는 감독 시스템 역할도 함께 부각되고 있다.
그렙은 이런 환경 변화에 맞춰 이미 국내 700여 기관이 도입한 '모니토' 시스템을 기반으로 생성형 AI 대응 기능을 강화한 모니토플러스를 제공하고 있다. 모니토플러스는 AI 기반 감독 체계에 설치형 시험 보안 브라우저(락다운 브라우저)를 결합해, 시험 중 응시자 기기의 실행 환경을 실시간으로 통제한다.
모니토플러스는 ChatGPT, 메신저 등 비허용 프로그램 실행을 즉시 감지해 시험을 중단하고 USB·블루투스 등 외부 기기 연결이나 원격 제어 프로그램 실행 등 다양한 형태의 부정행위 시도를 사전에 차단한다. 사후 결과 분석이 아니라 시험 과정에서 부정행위 발생 가능성을 구조적으로 낮추는 방식이다.
또한 음성 감지 기술을 통한 이상 음성 포착, 얼굴 자동 인식 기반의 가상 장치 및 대리 응시 탐지 등 비가시 영역까지 고려한 다층 감지 구조를 적용했다. 구술 평가나 대면 시험을 병행하는 혼합형 평가 환경에서도 온라인 평가의 신뢰도를 유지할 수 있도록 설계했다.
임성수 그렙 대표는 "AI 환경에서는 결과물 중심의 판별 방식만으로는 평가 신뢰성을 확보하기 어렵다"며 “교육 현장에서 찾고 있는 '부정행위를 구조적으로 차단하는 환경'을 제공하는 것이 모니토플러스의 핵심"이라고 말했다. 이어 "AI를 통제해야 할 상황에서는 기술적으로 관리하고 AI 활용을 전제로 한 평가 방식에도 유연하게 대응할 수 있는 기반을 제공한다"고 강조했다.
그렙은 현재 AI 활용을 전제로 한 과제형 평가와 역량 중심 평가 모델에 대한 연구를 병행하며 AI 시대에 적합한 온라인 평가 기준 정립을 추진하고 있다.
Copyright ⓒ 한스경제 무단 전재 및 재배포 금지