9일(현지시간) 구글 클라우드 사업부문인 구글 클라우드는 미국 라스베이거스에서 ‘넥스트 2025’를 개최하고, 추론에 특화된 7세대 텐서프로세서유닛(TPU) ‘아이언우드(Ironwood)’를 공개했다.
아이언우드는 추론 기능에 특화된 반도체로, 데이터 분석 및 딥러닝 등에 특화되어 있다. 포드(Pod) 당 9000개 이상의 칩을 탑재하고 42.5엑사플롭스(1초에 100경 번 부동소수점 연산 처리 능력)의 연산이 가능하다.
특히, 전력 효율성도 이전 모델인 ‘트릴리움’ 보다 2배 이상 높으며, 최대 컴퓨팅 용량도 5배 크다. 또한 198GB 대역폭 HBM(고대역폭 메모리)을 탑재했는데 해당 용량의 경우 트릴리움 대비 약 6배 높아졌다.
구글 클라우드는 아이언우드에 대해 “현재까지 개발된 TPU 중에 가장 강력한 칩”이라며 “제미나이 2.5와 같은 AI 모델의 급증하는 연산 수요를 완벽하게 충족한다”고 소개했다.
관련 업계에서는 최근 AI 산업에서 추론형 모델의 중요성이 높아지고 있는 만큼, 아이언우드를 내세워 시장 주도권을 확보하려는 것으로 보고 있다. 아이언우드는 올해 말 구글 클라우드 고객을 대상으로 출시될 예정이다.
한 업계 관계자는 “최근 엔비디아도 AI 기술에 있어 학습에서 추론 영역으로 집중하는 모습”이라며 “구글은 추론에 특화된 반도체를 통해 엔비디아에 대한 의존도를 낮추려는 것으로 풀이된다”고 전했다.
구글은 이날 제미나이 2.5의 보급형 모델 ‘제미나이 2.5 플래시’도 선보였다. 해당 모델은 실시간 요약과 문서 탐색에 최적화된 것으로, 프롬프트의 복잡도에 맞춰 추론 수준 조정이 가능하다는 점이 특징이다.
순다르 피차이 구글 CEO는 “제미나이 2.5 플래시는 모델의 추론 정도를 제어하고 예산과 성능의 균형을 맞출 수 있다”며 “우리의 목표는 최신 AI 기술을 제품과 플랫폼에 적용하는 것”이라고 설명했다.
한편, 구글 클라우드의 행사에서는 고객사들의 혁신 사례도 함께 소개됐다.
삼성전자는 구글 클라우드와의 협력으로 생성형 AI 기술을 적용한 홈 로봇 ‘볼리’(Ballie)를 공개했다. 볼리는 제미나이의 추론 능력과 삼성의 독자적 언어 모델을 결합해 개인화된 대화형 상호작용을 지원한다. 구글은 올해 상반기 출시를 앞두고 있는 볼리에 생성형 AI 모델을 탑재할 예정이다.
LG AI연구원은 구글 클라우드의 AI 하이퍼컴퓨터를 활용해 자체 개발한 LLM 모델 ‘엑사원’(EXAONE)과 함께 엔터프라이즈 에이전트 AI 구축 사례를 소개했다.
토마스 쿠리안 구글 클라우드 CEO는 “인공지능은 우리 삶과 생산성을 혁신할 수 있는 기회를 제공해준다”며 “머신러닝과 정보 체계화로 고객들이 목표 달성을 가속화할 수 있도록 지원할 것”이라고 언급했다.
Copyright ⓒ 투데이코리아 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.