이번 측정에 따르면, 가우디2는 처리량(Throughput)과 토큰 하나당 처리시간(TPOT) 모두에서 A100을 능가하는 성과를 기록했다.
◇네이버, 가우디2 최적화 도와…가성비 AI칩 시대 열다 이러한 결과는 네이버가 인텔과 스퀴즈비츠 사이에서 인텔 향 소프트웨어 최적화 작업, 평가 방법, 그리고 거대언어모델(LLM) 서비스 요구사항 등을 전달하며 최적의 연구가 진행될 수 있도록 지원한 덕분이다.
이동수 네이버클라우드 하이퍼스케일AI 이사(네이버AI 반도체 연구소장)는 페이스북에서 “인텔 가우디2의 ‘SynapseAI v1.19’에서 제시된 Contiguous PagedAttention(메모리 블록 또는 데이터 페이지 간의 연속적인 관계를 고려한 주의 메커니즘)은 반도체 아키텍처의 특성에 맞춘 최적화 방안을 잘 보여준다”며, “가성비 좋은 서비스를 제공하는 능력을 중시해야 하는 상황에서 SynapseAI는 효과적인 해결책을 제시했다”고 평가했다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “이데일리” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.