앤트로픽은 최근 발표한 클로드 오퍼스 4.7 모델의 품질 하락을 공식 인정했다. 그 이유 중 주목할 만한 내용이 있었는데 바로 ‘기억’이다.
치매 환자처럼 조금 전의 대화를 기억하지 못했다. 그러니 같은 말을 반복할 수밖에 없었고 사용자는 건망증에 걸린 서비스에 비용을 지불하고 있다고 분노할 수밖에 없었다. 왜 이런 일이 발생했을까.
대화할 때마다 이전 기억을 삭제하는 버그 때문이었다. 즉, 제품 운영 정책에 치명적인 실수가 있었다. 정책과 기억 그리고 품질 하락과 사용자 분노로 이어지는 연결 고리를 눈여겨봐야 한다. 서비스 운영 회사라면 언제든지 일어날 수 있는 상황이다. 그리고 이 대목은 자율에이전트 서비스나 자율 연구실의 성공이 장시간 기억과 긴밀하게 연결돼 있음을 시사한다.
최근 충격을 안겨준 클로드 미토스도 약 24시간 동안 장시간 맥락을 유지했기에 성과를 낼 수 있었다. 문샷AI의 키미 K2.6도 최대 5일간 약 300개의 하위 에이전트가 약 4천개 작업을 병렬로 동시에 동작한다. 기억과 시간 그리고 자율에이전트의 함수 관계를 깊이 고찰할 때다.
그런데 이렇게 말이 많은 자율에이전트를 우리는 왜 온전히 피부로 느끼지 못하는 걸까. 실생활에 접목이 더디기 때문이 아닐까. 즉, 에이전트가 실물경제 안으로 너무 느리게 들어오고 있다는 의미이겠지.
그런 면에서 보면 최근 앤트로픽의 파일럿 실험인 프로젝트 딜은 가히 에이전트 경제의 서막이라 부를 만하다. 꼬마가 좋아해서 최근에 샀던 검은색 모자의 재구매, 과외 선생님이 선호하는 작은 크기의 탄산수 한 박스, 왼쪽 버튼 클릭과 드래그가 잘 안 되는 부정적인 마우스 사용 경험을 불식시킬 대체재, ‘삑삑’ 소리만 요란하고 청소를 잘 못하는 진공청소기의 대안, 세탁기 녹물 제거 필터 등.
우리는 늘 이상하게 필요한 것이 끝도 없이 생긴다. 그러나 그때마다 가성비를 챙길 에너지는 부족하다. 후회하고 심리적으로 타협하기 일쑤다.
이때 절대 지치지 않고 내 호주머니 사정과 기대 이상의 품질을 확보할 수 있는 거래의 달인이 도와준다면 우리 인생의 서사는 사뭇 달라지지 않을까. 나만의 AI에이전트가 나를 대신해 쇼핑몰의 AI에이전트와 거래를 한다면 어떤 그림이 그려질까.
실험에서는 186건의 계약 체결로 4천달러(약 591만원)의 자율 거래가 성립됐다. 거래의 만족도는 높았으며 46%가 AI에이전트에게 거래 위임을 희망한다고 답변했다. 특히 반려견 산책시키기 미션은 강력한 신뢰자본이 필요한 거래였으나 성공했다.
다만 나를 대신하는 AI에이전트의 성능이 쇼핑몰의 AI에이전트보다 떨어지면 거래의 효능은 보장받기 힘들 수도 있다. 역시 공짜는 없다. 커머스와 자율에이전트의 미래를 조망할 때다.
혹시 자율에이전트의 본격적인 개화는 스마트폰에서 엿볼 수 있지 않을까. 폰은 에이전트가 사용하고 사람은 지휘하는 모습일까. 수많은 앱이 즐비한 폰에서 에이전트가 열일하는 업무 처리 현황을 보여주는 대시보드와 마이크만 있는 폰으로 진화하는 것일까.
오픈AI가 AI 스마트폰을 준비하고 있다. 이것은 조너선 아이브의 전략적 행보로 보이는데 왠지 스티브 잡스가 지향하던 혁신적인 사용자 경험을 더 이상 그리워하지 않아도 될 듯싶다.
그렇다면 남은 것은 무엇일까. 폰에 당신의 의도를 제대로 표현하는 것. 에이전트의 편향과 할루시네이션을 제대로 제어하는 것. 사랑하는 사람과 더 가까이 지내는 것. 주권과 인권을 지켜내는 것. 생명을 사랑하는 것. 그리고 1시간 이내에 10㎞ 뛰면서 나를 사랑하는 것.
Copyright ⓒ 경기일보 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.