크래프톤은 이번 공개를 통해 파운데이션 모델의 전 개발 과정을 자체적으로 수행할 수 있는 기술 역량을 증명했다.
공개된 모델은 ▲Raon-Speech ▲Raon-SpeechChat ▲Raon-OpenTTS ▲Raon-VisionEncoder 등 4종으로, 이는 음성과 시각 정보를 통합 처리하는 크래프톤의 멀티모달 AI 경쟁력을 보여주는 결과물이다.
국내 최초의 실시간 양방향 음성 모델인 ‘Raon-SpeechChat’은 사용자와 모델이 대화 중 자유롭게 끼어들 수 있는 기술을 적용, 응답 지연 시간 등 주요 지표에서 글로벌 최상위권 성능을 냈다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “데일리 포스트” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.