NVIDIA 차세대 Feynman GPU, Groq LPU 유닛 통합 가능성 제기

실시간 키워드

2022.08.01 00:00 기준

NVIDIA 차세대 Feynman GPU, Groq LPU 유닛 통합 가능성 제기

위클리 포스트 2025-12-30 03:40:59 신고

3줄요약

 AMD X3D처럼 별도 다이 적층 구조… 2028년 전후가 관건

NVIDIA가 차세대 Feynman GPU 아키텍처에 Groq의 LPU(Language Processing Unit) 유닛을 통합할 가능성이 제기됐다. 이 방식은 AMD의 X3D CPU처럼, 메인 연산 다이 위에 별도의 다이를 적층하는 구조가 될 수 있으며, 시점은 2028년 전후로 거론되고 있다.

전망은 NVIDIA가 Groq의 LPU 기술에 대한 IP 라이선스를 확보한 이후, 이를 어떻게 실제 제품에 녹여낼지에 대한 분석에서 나왔다. 겉으로 보기에는 제한적인 협력처럼 보일 수 있지만, NVIDIA가 추론(inference) 시장을 본격적으로 장악하려는 전략적 움직임이라는 해석이 힘을 얻고 있다.

GPU 아키텍처 분석가 AGF는 NVIDIA가 Feynman GPU에서 TSMC의 하이브리드 본딩 기술을 활용해 LPU 유닛을 적층할 가능성이 크다고 보고 있다. 이는 AMD가 SoIC 기술을 활용해 3D V-Cache를 연산 다이 위에 얹은 방식과 유사하다.

AGF의 분석에 따르면, LPU에 필요한 대규모 SRAM을 하나의 단일 다이로 통합하는 방식은 효율적이지 않다. SRAM은 공정 미세화에 따른 이점이 제한적이며, 이를 최첨단 공정에서 구현할 경우 웨이퍼 면적 대비 비용이 급격히 상승하기 때문이다. 대신 NVIDIA는 연산을 담당하는 Feynman 메인 다이와, 대용량 SRAM을 담은 LPU 다이를 분리해 적층하는 구조를 선택할 가능성이 있다는 것이다.

해당 시나리오에서는 메인 Feynman 다이가 A16, 즉 1.6나노급 공정으로 제작돼 텐서 유닛과 제어 로직을 담당하고, 그 위에 별도의 LPU 다이가 SRAM 뱅크 형태로 얹히게 된다. 두 다이 간 연결은 TSMC의 하이브리드 본딩을 통해 이뤄지며, 이는 패키지 외부 메모리 대비 훨씬 넓은 인터페이스와 낮은 비트당 에너지 소비를 가능하게 한다.

또한 A16 공정은 백사이드 전력 공급을 지원할 예정이어서, 전면 배선 공간을 수직 SRAM 연결에 활용할 수 있다. 이는 추론 작업에서 중요한 낮은 지연 시간을 확보하는 데 유리한 요소로 작용한다.

다만 해결해야 할 과제도 적지 않다. 우선 열 관리 문제가 가장 큰 변수다. 이미 고집적 연산 다이 위에 추가 다이를 얹는 것 자체가 난이도가 높은데, 지속적인 처리량을 요구하는 LPU 특성까지 더해지면 발열 병목이 발생할 가능성이 있다.

아키텍처 차원의 문제도 있다. LPU는 고정된 실행 순서와 결정성을 중시하는 구조인 반면, GPU는 유연성과 병렬성을 중시한다. 두가지 접근 방식이 한 칩 안에서 공존할 경우, 실행 모델 차원에서 충돌이 발생할 수 있다는 지적도 나온다.

소프트웨어 측면에서는 더 복잡하다. CUDA는 하드웨어 세부 구조를 추상화하는 방식으로 설계돼 있지만, LPU 기반 실행은 메모리 배치와 데이터 흐름을 명시적으로 제어해야 한다. 즉, CUDA와 LPU 스타일 실행 모델을 자연스럽게 통합하려면 상당한 수준의 엔지니어링이 필요하다.

결국 NVIDIA가 복잡성을 감수하려는 이유는 분명하다. AI 시장에서 학습(training)은 여전히 중요하지만, 추론이 차지하는 비중과 수익성은 빠르게 커지고 있다. LPU를 GPU 아키텍처에 통합하는 데 성공한다면, NVIDIA는 추론 스택 전반에서 경쟁사와 차별화된 위치를 차지할 수 있다.

접근법이 실제 제품으로 이어질지는 아직 불확실하다. 그러나 Feynman 세대에서 LPU 적층이 현실화된다면, 이는 단순한 성능 향상을 넘어 GPU 아키텍처의 방향 자체를 바꾸는 전환점이 될 가능성이 크다.

press@weeklypost.kr

 

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?
광고 보고 계속 읽기
원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

  1. -
  2. -
  3. -
  4. -
  5. -
  6. -
  7. -
  8. -
  9. -
  10. -

0000.00.00 00:00 기준

이 시각 주요뉴스

알림 문구가 한줄로 들어가는 영역입니다

신고하기

작성 아이디가 들어갑니다

내용 내용이 최대 두 줄로 노출됩니다

신고 사유를 선택하세요

이 이야기를
공유하세요

이 콘텐츠를 공유하세요.

콘텐츠 공유하고 수익 받는 방법이 궁금하다면👋>
주소가 복사되었습니다.
유튜브로 이동하여 공유해 주세요.
유튜브 활용 방법 알아보기