생성형 인공지능 확산으로 추론 비용이 AI 경쟁력의 핵심 변수로 떠오른 가운데, 마이크로소프트가 반도체 설계부터 데이터센터 아키텍처까지 직접 통제하는 ‘수직 통합형 AI 인프라 전략’을 본격화하고 있다.
마이크로소프트는 대규모 AI 추론 비용을 낮추기 위한 자체 추론 가속기 ‘마이아 200(Maia 200)’을 공개했다고 27일 밝혔다.
애저(Azure) 데이터센터에 최적화된 이 칩은 초고속 메모리와 저정밀 연산 성능을 앞세워 달러당 성능을 기존 대비 30% 이상 개선, 차세대 AI 인프라의 핵심 축으로 활용될 전망이다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “이뉴스투데이” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.