사람처럼 자연스럽게 대화를 주고받는 차세대 음성 기술이 베일을 벗었다. 7일(현지시간) 새롭게 모습을 드러낸 'GPT-리얼타임-2'는 GPT-5에 버금가는 추론 성능을 품은 음성 모델이다. 연합뉴스에 따르면 이번 모델의 핵심은 기존 턴제 방식의 한계를 완전히 뛰어넘었다는 점에 있다.
종전 AI 모델에서는 이용자와 시스템이 교대로 발언해야 했지만, 새 모델은 다르다. 대화 도중 끼어들거나 앞서 한 말을 수정해도 즉시 맥락을 파악해 응답한다. 상황별 어조 조절 기능도 탑재됐으며, 개발자들은 업무 특성에 맞춰 빠른 답변과 심층 추론 사이에서 모드를 선택할 수 있게 됐다.
동시에 공개된 모델은 두 가지 더 있다. 실시간 통역 기능의 'GPT-리얼타임-트랜슬레이트'와 즉석 받아쓰기 전용 'GPT-리얼타임-위스퍼'가 그것이다. 회사 측은 단순 문답을 넘어 대화 흐름 속에서 경청하고 사고하며 번역과 기록, 업무 수행까지 가능한 기술로 진화시키고 있다고 개발 취지를 밝혔다.
실제 현장 적용 사례도 속속 등장하고 있다. 미국 부동산 플랫폼 질로는 음성 명령만으로 매물 검색과 방문 예약을 처리하는 비서 시스템을 구축 중이다. 유럽의 도이체텔레콤 역시 고객이 원하는 언어로 실시간 상담받을 수 있는 번역 서비스를 시험 운영하고 있다.
이번 기술 공개에는 외부 기업 수요 충족 외에 또 다른 목적이 깔려 있다는 분석이 나온다. 지난해 애플 출신 전설적 디자이너 조니 아이브가 이끄는 스타트업 'io'를 65억 달러에 품에 안은 이후, 음성 기반 자체 하드웨어 개발에 박차를 가하고 있기 때문이다. 스마트 안경, 의류 부착형 핀 기기, 스마트 스피커 등이 유력한 출시 후보로 거론된다.
대만 TF인터내셔널증권의 궈밍치 분석가는 한발 더 나아간 전망을 내놓았다. AI 에이전트가 내장된 자체 스마트폰 개발설이 그것이다.
같은 날 챗GPT에는 '신뢰할 수 있는 연락처' 기능이 새로 추가됐다. 대화 중 자해 징후 등 정신건강 위기가 감지되면 미리 지정해둔 가족이나 지인에게 자동으로 알림이 전송되는 안전장치다. 기존에 미성년자 계정에만 적용되던 이 기능이 이제 성인 이용자까지 확대 적용된다.
Copyright ⓒ 나남뉴스 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.