단순한 학습 성능을 넘어 실제 서비스 단계에서의 응답 속도와 효율성을 좌우하는 칩 설계로 무게 중심을 이동시키는 모습이다.
구글은 22일(현지시간) 라스베가스에서 ‘구글 클라우드 넥스트 2026’ 행사를 열고, 8세대 텐서처리장치(TPU)를 공개했다.
구글 클라우드의 토마스 쿠리안 최고경영자(CEO)는 “추론 기능이 없다면 학습 비용을 감당할 수 없다”며 “추론 시장은 학습 시장과 맞먹거나 더 커질 것”이라고 강조했다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “데일리임팩트” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.