한국과학기술원(KAIST) 연구진이 생성형 인공지능(AI)에 최적화된 고성능·저전력 신경망처리장치(NPU) 핵심 기술 개발에 성공했다.
4일 KAIST는 박종세 전산학부 교수 연구팀이 AI 반도체 스타트업 하이퍼엑셀과의 공동연구를 통해 최신 그래픽처리장치(GPU) 대비 전력 소모는 약 44% 낮고, 평균 60% 이상 추론 성능을 발휘하는 NPU 핵심 기술을 개발했다고 밝혔다.
특히 메모리 사용의 상당 부분을 차지하는 KV 캐시(KV Cache)를 양자화해, 적은 수의 NPU 디바이스로도 고성능 AI 인프라를 구현할 수 있게 됐다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “아주경제” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.