트릴리온랩스, 국내 최초 70B LLM 및 모델 체크포인트 공개

[이뉴스투데이 백연식 기자] 초지능 인공지능(AI) 스타트업 트릴리온랩스가 국내 최초로 700억(70B) 파라미터 규모의 대규모 언어모델(LLM) 트리(Tri)-70B를 10일 공개했다. 이번 모델은 현재까지 한국에서 프롬 스크래치(from-scratch)로 개발된 가장 큰 언어모델이다. 또한 사후학습이 최소화된 베이스모델 형태로 공개돼 연구자와 기업들이 손쉽게 커스터마이징할 수 있다는 장점이 있다.

또한 트릴리온랩스는 70B 모델 공개와 함께 ‘오픈소스 먼스(Open Source Month)’를 선언하고, 0.5B, 1.8B, 7B, 70B 전 라인업을 Apache 2.0 라이선스로 공개했다. 이를 통해 트릴리온랩스의 언어모델 라인업을 연구 목적은 물론 상업적 활용까지 가장 개방된 형태로 제공하며, 단순한 결과물 공유를 넘어 연구와 산업 현장에서 실제로 활용할 수 있는 자산을 제공한다.

특히 트릴리온랩스는 이번 오픈소스 먼스에서 매주 최종 모델뿐 아니라 학습 도중 생성된 중간 체크포인트(Intermediate Checkpoint)까지 전면 공개한다. 이를 통해 학계 및 산업계는 대규모 모델의 학습 과정을 세밀하게 연구할 수 있으며 효율적인 재학습 및 응용 연구를 수행할 수 있다.

이는 글로벌 차원에서도 매우 드문 시도다. 지금까지는 비영리기관인 앨런연구소(AllenAI)나 허깅페이스(Hugging Face) 정도만 제한적으로 해왔으며 트릴리온랩스가 전 세계 세 번째 이자 한국에서는 처음이다. 트릴리온랩스는 국내 최초이자 세계적으로도 손에 꼽히는 규모의 연구 공개를 통해 학습 전 과정의 투명성과 재현성을 보장하는 새로운 연구 표준을 제시한 것으로 평가된다.

이번 공개에는 다국어 번역 특화 모델과 실시간 검색(Search) 특화 모델도 포함됐다. 특히 검색 모델은 덕덕고(DuckDuckGo)와 같은 검색 엔진과 연동하여 최신 정보를 실시간으로 반영할 수 있어, 대규모 언어모델이 지속적으로 새로운 지식을 학습하고 활용할 수 있는 가능성을 보여준다.

신재민 트릴리온랩스 대표는 “우리는 단순히 언어 모델을 만드는 데 그치지 않고, 훈련 과정과 핵심 기법까지 모두 공개해 연구의 투명성을 확보하고 한국은 물론 글로벌 AI 연구 생태계 발전의 토대를 마련하고자 한다”며 “이번 공개는 한국에서 처음 시도되는 의미 있는 도전으로, 국내 AI 기업들이 기술적 우수성과 개방적 연구 문화를 통해 글로벌 경쟁력을 확보할 수 있음을 보여주는 중요한 출발점이 될 것”이라고 강조했다.

한편 2024년 8월 설립된 트릴리온랩스는 한국어 중심 LLM을 독자적으로 설계하고 사전 학습(from-scratch)부터 진행해온 스타트업이다. 생성형 AI 분야의 개척자인 신재민 대표를 주축으로 카이스트, 옥스포드, 버클리, 아마존, 네이버 출신 등 국내외 최고 수준의 AI 엔지니어 및 연구원으로 구성된 팀이다. 2024년 9월 580만달러(약 90억원) 규모의 프리-시드 투자를 유치했다. 지난 3월 선공개모델 트릴리온-7B(Trillion-7B-preview), 지난 7월 트리(Tri)-21B를 오픈소스로 공개했다.

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?

광고 보고 계속 읽기

원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

2022.08.01 00:00 기준

실시간 키워드