vLLM의 주역들이 설립한 인퍼랙트가 1.5억 달러의 실탄을 확보하며 AI 경제학의 패러다임 전환을 선언했습니다. 수조 원을 쏟아붓는 모델 훈련은 결국 ‘비용’일 뿐, AI가 사용자에게 정보를 전달하고 가치를 창출하는 유일한 순간은 ‘추론’이라는 일침입니다.
AI포스트 핵심 요약
- ✅ [AI 경제학의 재정의] 사이먼 모 CEO는 훈련 단계에서는 가치가 창출되지 않으며, 사용자에게 정보가 전달되는 ‘추론’의 순간이 유일한 수익 지점임을 강조함.
- ✅ [추론 인프라의 복잡성 해결] 모델 아키텍처(MoE, 멀티모달 등)와 하드웨어 가속기가 파편화되는 상황에서, 이를 서버리스 DB처럼 단순하게 배포할 수 있는 통합 실행 인프라를 구축함.
- ✅ [vLLM 생태계의 지배력] 아마존 등 대형 빅테크가 이미 사용 중인 검증된 엔진 vLLM의 핵심 개발진이 뭉쳐, 시드 단계부터 1조 원 이상의 기업 가치를 인정받으며 시장의 게임 체인저로 등극함.
수조 원의 자금이 투입되는 거대언어모델(LLM) 훈련 경쟁이 한창이지만, 정작 인공지능(AI)이 돈을 벌어다 주는 지점은 따로 있다는 분석이 나왔다. 오픈소스 추론 엔진 vLLM의 핵심 개발자들이 설립한 ‘인퍼랙트(Inferact)’가 출범과 동시에 던진 메시지다.
사이먼 모 CEO “전달되지 않는 정보는 무가치하다”
공동 창립자이자 CEO인 사이먼 모(Simon Mo)는 최근 라이트스피드 벤처 파트너스 유튜브 채널에 출연해 인퍼랙트 출범 소식을 알리면서 냉정한 AI 경제학을 역설했다. 그는 “데이터 센터를 짓고 훈련 클러스터를 구축하며 모델을 만드는 시점에는 아무런 가치가 창출되지 않는다”라고 지적했다.
그는 이어 “추론(Inference)을 통해 사용자에게 정보가 전달되는 그 지점이 바로 정보를 실제로 활용하고 가치를 얻는 유일한 순간”이라며, 현재 AI 업계가 주목해야 할 진짜 전장은 훈련이 아닌 '실행 인프라'임을 명확히 했다.
"추론은 가장 어려운 난제"…인프라의 서버리스화 조준
인퍼랙트 팀은 "모델은 점점 커지고, 새로운 아키텍처(전문가 혼합형, 멀티모달, 에이전트형 등)가 급증하고 있다. 모든 혁신에는 새로운 인프라가 필요하다"라며 "한편, 하드웨어는 더욱 세분화되어 가속기, 프로그래밍 모델, 최적화할 수 있는 조합이 더욱 많아지고 있다"라고 말했다.
그러면서 인퍼랙트 팀은 "모델과 이를 지원하는 시스템 간의 역량 격차가 점점 벌어지고 있다. 이대로라면 가장 뛰어난 모델조차 제대로 활용하지 못하고, 맞춤형 인프라를 구축할 수 있는 사용자만이 그 모든 기능을 활용할 수 있게 된다. 이 격차를 해소하면 새로운 가능성을 열 수 있다"라고 설명했다.
모델이 커지고 전문가 혼합형(MoE) 등 아키텍처가 복잡해지면서 추론 인프라 구축이 점점 더 '고도의 전문 영역'이 되고 있다고 진단했다. 이들은 이러한 복잡성을 제거해, 미래의 AI 배포를 서버리스 데이터베이스를 쓰는 것처럼 단순하게 만드는 것을 목표로 한다.
시드 투자만 2,000억 원…아마존도 쓰는 ‘검증된 엔진’의 저력
인퍼랙트의 자신감은 이미 시장을 장악한 vLLM의 생태계에 기반한다. 아마존의 클라우드 서비스와 대형 쇼핑 앱들이 이미 대규모 AI 배포 시 vLLM을 필수적으로 사용하고 있다.
이러한 지배력 덕분에 인퍼랙트는 앤드리슨 호로위츠(a16z)와 라이트스피드로부터 1억 5천만 달러(약 2182억원)라는 기록적인 시드 투자를 이끌어냈다. 기업 가치는 8억 달러(약 1조 1600억원)로 평가받으며 단숨에 글로벌 AI 인프라 시장의 '게임 체인저'로 떠올랐다.
최근 테스트 시간 컴퓨팅(Test-time Compute) 등 추론 단계의 중요성이 커지면서 인퍼랙트의 역할은 더욱 막중해질 전망이다. 오픈소스의 정체성을 유지하면서도 기업용 상용 엔진을 제공하겠다는 이들의 행보는 AI 산업의 무게중심을 훈련에서 실질적인 부가가치 창출의 영역인 '추론의 경제'로 옮겨놓고 있다.
Copyright ⓒ AI포스트 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.