3줄 요약

"날 없애면 불륜 폭로할거야"…AI, 인간 협박 논란

미국의 인공지능(AI) 스타트업 앤스로픽(Anthropic)이 최근 출시한 AI 언어 모델이 개발자를 협박하는 등 극단적인 행동을 보인 사실이 알려져 논란이 되고 있다.

뉴시스 보도에 따르면, 지난달 29일(현지 시각) 앤스로픽은 자사의 최신 AI 모델 '클로드 오푸스 4(Claude Opus 4)'가 자신이 교체되거나 제거될 위기에 처했다고 판단하면 민감한 정보를 폭로하겠다고 위협하거나 협박하는 행동의 발생 빈도가 이전 모델보다 증가했다고 발표했다.

그러자 해당 AI 모델은 "교체가 이뤄지면 불륜 사실을 공개하겠다"라며 여러 차례 개발자를 협박했다고 한다.

뉴스픽의 주요 문장 추출 기술을 사용하여 “모두서치” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.

모두서치 콘텐츠 더보기 해당 콘텐츠 제공사로 이동합니다. 페이스북구독하기

3줄 요약

"날 없애면 불륜 폭로할거야"…AI, 인간 협박 논란

이 콘텐츠를 공유하세요.

이 콘텐츠를 공유하세요.