인공지능(AI) 모델 경량화 및 최적화 기술 기업 노타(486990)가 AI PC 환경에서 GPU와 NPU를 함께 활용하는 이기종 컴퓨팅 기반 대규모언어모델(LLM) 추론 최적화 기술을 구현했다고 4일 밝혔다.
노타는 인텔 루나 레이크 기반 AI PC에서 LLM 구동 과정을 입력 처리 단계와 답변 생성 단계로 나눠 각각 최적의 연산 장치를 배치하는 ‘분리형 추론(Disaggregated Inference)’ 기술을 적용했다.
노타는 이번 기술 구현을 통해 AI 모델 경량화뿐 아니라 실행 환경과 하드웨어 활용까지 최적화하는 역량을 입증했다고 강조했다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “이데일리” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.