사진=연합뉴스
오픈AI가 이용자의 말을 실시간으로 인식하고 자연스럽게 대화할 수 있는 차세대 음성 인공지능(AI) 모델을 공개했다. AI와 사람이 서로 말을 주고받는 기존 방식에서 벗어나 실제 대화처럼 끊어 말하거나 수정해도 즉각 반응할 수 있도록 한 것이 특징이다.
오픈AI는 지난 7일(현지시간) GPT-5급 추론 능력을 갖춘 음성 모델 ‘GPT-리얼타임-2’를 선보였다.
이번 모델은 이용자가 AI 답변 도중 말을 끊거나 이전 발언을 고쳐 말해도 실시간으로 맥락을 이해하고 반응할 수 있도록 설계됐다. 기존 음성 AI보다 사람 간 대화 방식에 가까워졌다는 평가가 나온다.
또 상황에 따라 말투를 조절할 수 있으며, 개발자가 빠른 응답이 필요한 업무와 신중한 판단이 필요한 업무에 맞춰 추론 수준을 선택할 수 있도록 했다.
오픈AI는 이와 함께 실시간 음성 번역 모델 ‘GPT-리얼타임-트랜슬레이트’와 실시간 받아쓰기 모델 ‘GPT-리얼타임-위스퍼’도 함께 공개했다.
오픈AI는 “실시간 음성 기술이 단순 문답 수준을 넘어 대화 흐름 속에서 이용자의 말을 듣고 추론하며 번역과 받아쓰기, 작업 수행까지 가능하도록 발전하고 있다”고 설명했다.
실제 기업들의 활용 사례도 소개됐다. 미국 부동산 플랫폼 Zillow는 고객 음성 조건에 맞춰 매물을 검색하고 방문 일정을 잡아주는 음성 비서를 구축 중이다. 유럽 통신사 Deutsche Telekom은 고객이 원하는 언어로 상담받을 수 있는 실시간 번역 기반 고객 지원 서비스를 시험 운영하고 있다.
업계에서는 오픈AI가 자체 AI 기기 개발을 염두에 두고 음성 기술 강화에 나선 것으로 보고 있다.
오픈AI는 애플 전 수석 디자이너 조니 아이브가 설립한 스타트업 ‘io’를 지난해 65억달러에 인수한 이후 음성 기반 AI 기기를 준비 중인 것으로 알려졌다.
현재 스마트 안경과 핀 형태 웨어러블 기기, 스마트 스피커 등이 오픈AI의 차세대 제품군으로 거론되고 있다. 최근에는 AI 에이전트 기능을 탑재한 자체 스마트폰 개발 가능성도 제기됐다.
대만 TF인터내셔널증권의 궈밍치는 최근 오픈AI가 AI 에이전트 기반 스마트폰을 개발하고 있다는 관측을 내놓기도 했다.
한편 오픈AI는 이날 챗GPT에 ‘신뢰할 수 있는 연락처’ 기능도 새롭게 도입했다고 밝혔다.
이 기능은 챗GPT가 대화 중 자해 등 정신건강 위기 상황을 감지할 경우, 이용자가 사전에 지정한 가족이나 친구에게 알림을 보내 도움을 받을 수 있도록 연결해주는 안전 기능이다. 기존 미성년자 계정에 적용되던 기능을 이번에 성인 계정까지 확대했다.
Copyright ⓒ 금강일보 무단 전재 및 재배포 금지