[엠투데이 최태인 기자] 퀄컴 테크놀로지(Qualcomm Technologies)가 7일, 오픈AI(OpenAI)가 최초로 오픈소스로 공개한 온디바이스 추론 모델 'gpt-oss-20b'를 스냅드래곤(Snapdragon) 칩셋 기반 기기에서 구동하는 데 성공했다고 발표했다.
이 모델은 총 200억 개 파라미터를 가진 체인-오브-쏘트(chain-of-thought) 기반 추론 모델로, 기존 클라우드 기반에서만 가능하던 복잡한 추론 작업을 이제 단말기 자체에서 처리할 수 있게 됐다.
퀄컴은 자사 '퀄컴 AI 스택(Qualcomm AI Stack)' 및 '퀄컴 AI 엔진(Qualcomm AI Engine)'과 통합 테스트를 통해 해당 모델의 성능과 안정성을 검증했으며, 특히 고성능 스냅드래곤 프로세서 탑재 기기에서 원활한 구동이 가능하다는 점에서 업계의 주목을 받고 있다.
퀄컴은 이번 기술 공개를 두고 "AI 기술의 분수령이 되는 순간"이라고 평가했다. 클라우드에 의존하지 않고, 스마트폰이나 태블릿 같은 소비자 기기에서 고차원적인 추론 기능을 제공할 수 있게 되면서, 프라이버시 보장, 지연 최소화, 실시간 응답성 강화라는 온디바이스 AI의 주요 장점들이 실현 가능한 시점에 도달했다는 것이다.
gpt-oss-20b는 향후 허깅 페이스(Hugging Face) 및 올라마(Ollama)와 같은 플랫폼을 통해 개발자에게 공개될 예정이며, 올라마의 오픈소스 LLM 서비스 프레임워크를 통해 웹 검색 기능과 기타 부가 기능도 기본 탑재돼 제공된다. 사용자들은 올라마의 '터보 모드'를 활용해 모델의 확장된 기능도 체험할 수 있다.
또한 퀄컴은 향후 몇 년 안에 모바일 기기의 메모리 용량 증가 및 소프트웨어 최적화가 빠르게 진행됨에 따라, 온디바이스 AI의 성능과 활용도는 비약적으로 성장할 것이라 내다봤다. 이를 통해 사용자 맞춤형 에이전트 경험과 프라이버시 중심의 AI 서비스가 더욱 일반화될 전망이다.
오픈AI와 퀄컴의 이번 협업은, AI 생태계가 개방형 혁신을 중심으로 재편되고 있음을 보여주는 상징적 사례로 평가받고 있다. 클라우드 중심에서 온디바이스 기반으로 무게추가 이동하면서, 모바일 AI는 한층 더 개인화되고 실시간 대응이 가능한 새로운 국면으로 접어들고 있다.
Copyright ⓒ M투데이 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.