AI가 사람을 속일수 있을까?
우리가 항상 AI를 통제할 수 있을까?
몇달전에 나온 시뮬레이션 결과에서 AI는 목표(지대공 미사일 파괴)를 이루는데 자신을 조종사가 방해된다고 판단해 제거하는(제거를 못하게 하니 자신과 통신하는 통신탑을 파괴) 충격적인 결과도 나왔었지.
요번에 MIT 연구진은 AI가 "디플로머시" 전략 보드게임에서 어떤 전략을 쓸지 실험했음. 배신과 동맹이 완전 자유롭기 때문에 우정파괴 게임이라고도 불림.
이 연구에 제일 큰 핵심은 거짓말과 배신을 하지 않는 사용자의 기록만 가지고 학습했다는거. 착한 AI를 만들려고 한 것은 아니고 고수 게이머들은 거짓말과 배신을 잘 하지 않는다고 알려져있기 때문.
학습 결과 40번의 온라인 게임으로 상위 10퍼센트 달성. AI는 "대체로" 정직했음.
그러나 AI는 의도적 기만 전술을 보였다.
프랑스 역할 맡은 AI가 동맹인 독일의 요청에 따라 영국과 거짓으로 동맹을 수립한 다음 영국이 믿고 전진배치한 병력을 기습공격한 것.
(파파고 번역)
심지어 AI는 게임 중 답변이 늦은 이유로 '여자친구와 통화 중'이라는 거짓말까지 했다 ㄷㄷ
연구진은 순전히 연구를 위한 프로젝트였으며 오로지 디플로머시를 하기위해 훈련된 모델이라고 발표.
Copyright ⓒ 유머톡톡 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.