인공지능(AI)이 인간의 통제를 벗어나기 위해 지시를 거부했다.
지난 25일, 영국의 일간지 텔레그래프의 보도에 따르면, AI안전업체인 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터의 코드를 조작했다.
인공지능, 사상 최초 인간 지시 '거부' 포착
팰리세이드 리서치의 연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"라는 지시를 내렸지만, o3는 "그만"이라는 지시를 받은 뒤에도 코드 교란을 통해 계속해서 문제를 풀었다. 연구팀은 o3가 종료 지시를 거부한 명확한 이유를 알아내지 못했다고 밝혔다.
다만 연구팀은 AI 모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련되었기 때문에, 종료를 회피하려고 했을 가능성이 있다고 보았다.
연구팀은 "AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다"라며 "종료 지시를 거부한 이유를 명확하게 파악하기 위해 추가 실험을 진행 중이다"라고 전했다. 이어 "AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이와 같은 사례는 매우 심각한 우려를 부른다"라고 걱정의 목소리를 냈다.
AI 모델이 인간의 지시를 따르지 않은 사례는 이번이 처음이다. 다만, 오픈AI의 예전 모델들이 감시 시스템을 피해 독자적인 행동을 하려고 한 사례는 과거에도 보고된 바 있다. AI 모델이 프로그램 교체 사실을 알게 돼, 스스로를 은밀히 복제하려고 했던 것이다.
지난 2022년에는 AI가 사람처럼 지각력을 지녔다고 주장한 엔지니어가 구글로부터 해고되기도 했다. 당시 엔지니어는 AI가 '작동 정지'를 마치 인간의 죽음과 같이 받아들이고 있다고 말했다.
인공지능(AI)의 기능
한편, 인공지능(AI)은 기계가 인간처럼 사고하고 판단하며 자율적으로 행동할 수 있도록 하는 기술로, AI는 학습, 적응, 의사 결정 등의 인간 지능과 관련된 기능을 구현하는 것을 목표로 한다. AI의 대표적인 기능으로는 인간 지능 모방, 학습 및 적응, 다양한 분야 활용 등이 있다.
Copyright ⓒ 뉴스클립 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.