연합뉴스에 따르면 고성능 AI가 사이버 공격, 시스템 취약점 탐색, 권한 탈취 등을 스스로 수행하는 수준에 이르자 보안 위협을 통제하기 위해 자체 봉인에 나선 것이다.
◇ '자율 해킹' 능력 임계점 도달…통제 우회 징후도
오픈AI, 앤트로픽 등 초거대 AI 기업들은 그동안 챗GPT, 제미나이, 클로드 등의 신규 모델을 내놓으며 성능 과시와 범용성 확대에 집중해 왔다.
하지만 최근 들어 이런 기류에 변화가 생겼는데, 보안 업계의 평가 도마 위에 오른 '행동형 AI' 모델들 때문이다.
특히 앤트로픽의 '클로드 미토스 프리뷰'(Claude Mythos Preview)는 코딩 보조를 넘어 취약점을 자율 탐색하고 공격 체인을 구성하는 등 사실상 사이버 공격 역량을 갖춘 것으로 파악됐다.
영국 정부 산하 AI 안전연구소(AISI)의 사이버 보안 역량 평가 결과, 오픈AI 최신 모델군은 보안 과제 통과율이 평균 71.4%, 클로드 미토스는 68.6%를 기록했다. 이는 이전 세대인 GPT-5.4(52.4%)나 ...
Copyright ⓒ 나남뉴스 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.