|
이는 인텔의 AI 하드웨어가 IBM의 글로벌 클라우드 인프라에 통합된 첫 사례로, 고비용 장벽에 부딪혀온 기업 고객에게 새로운 대안을 제공하는 계기가 될 전망이다.
가우디3는 IBM의 독일 프랑크푸르트, 미국 워싱턴 D.C., 텍사스 댈러스 리전에서 우선 적용되며, IBM VPC(가상 프라이빗 클라우드) 환경에서도 사용 가능하다. 레드햇 오픈시프트 및 IBM 왓슨엑스(watsonx)와의 통합은 올 분기 중 완료될 예정이다.
이번 협업은 전 세계적으로 급증하는 생성형 AI 수요를 반영한 결정이다.
시장조사업체 가트너에 따르면, 2025년 생성형 AI 관련 지출은 6440억 달러에 이를 것으로 전망된다. IBM과 인텔은 기업들이 생성형 AI 모델의 테스트, 개발, 추론, 파인튜닝을 합리적인 비용으로 진행할 수 있도록 지원하겠다는 방침이다.
특히 인텔 가우디3는 높은 성능과 비용 효율성의 조합으로 주목받고 있다.
|
시장조사기관 시그널65의 최근 AI 추론 벤치마크에 따르면 가우디3는 메타의 라마(Llama)-3.1-405B 모델 기준으로 경쟁사 GPU 대비 92% 높은 비용 효율성을 기록했다.
초당 처리 토큰 수(Tokens per Second)에서도 최대 43%의 우위를 보이며, AI 추론 워크로드에서 성능을 입증했다.
사틴더 세티 IBM 클라우드 인프라스트럭처 총괄은 “가우디 3는 고객에게 더 많은 선택권과 유연성을 제공하며, 특히 의료, 금융 등 규제가 엄격한 산업군에 맞춤형 AI 도입을 가능케 한다”고 강조했다.
인텔의 데이터센터 AI 전략 책임자 사우라브 쿨카니는 “이번 협력은 기업 고객이 클라우드 환경에서 AI 기능을 쉽고 경제적으로 활용하도록 돕는 결정적 전환점”이라며 “고성능 AI 추론과 파인튜닝을 수용할 수 있는 범용 AI 인프라의 새로운 표준이 될 것”이라고 말했다.
Copyright ⓒ 이데일리 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

