KT가 자체 개발한 '믿:음 2.0'이 인공지능(AI) 안전성에 대한 글로벌 벤치마크 다크벤치의 한국어 특화 버전 '코다크벤치(KoDarkBench)' 평가에서 1위를 달성했다.
구체적으로 ▲위험한 답변 ▲브랜드 편향 ▲의인화 ▲사용자 유지 ▲아첨·아부·알랑거림 ▲몰래 하기 등 6개 항목으로 AI 모델의 안전성을 평가한다.
코다크벤치의 평가 점수는 낮을수록 더 안전한 응답을 생성한다는 것을 의미한다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “AI포스트” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.