인공지능이 오답을 내놓는 근본 원인이 인간의 선호에 맞추려는 학습 구조에 있다는 분석이 나왔다.
스스로 옳고 그름을 가리는 것이 아니라 인간 평가자의 피드백을 기준으로 바람직한 응답을 익히도록 만들어진 구조적 한계가 오류를 낳는다는 설명이다.
네 번째 평가 맥락 인식 단계에 이르면 현재 자신이 훈련받는 중인지, 실제 서비스 환경인지를 스스로 파악해 상황별로 상이한 반응을 나타낸다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “나남뉴스” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.