NC AI, 비전언어모델 4종 공개...산업 전방위 공략

실시간 키워드

2022.08.01 00:00 기준

NC AI, 비전언어모델 4종 공개...산업 전방위 공략

한스경제 2025-07-16 09:39:52 신고

인공지능(AI) 기업 NC AI는 바르코 비전 2.0의 4가지 버전(14B / 1.7B / 1.7B OCR / 비디오 임베딩)을 오픈소스로 공개한다./NC AI
인공지능(AI) 기업 NC AI는 바르코 비전 2.0의 4가지 버전(14B / 1.7B / 1.7B OCR / 비디오 임베딩)을 오픈소스로 공개한다./NC AI

[한스경제=박정현 기자] 인공지능(AI) 기업 NC AI는 바르코 비전 2.0의 4가지 버전(14B / 1.7B / 1.7B OCR / 비디오 임베딩)을 오픈소스로 공개한다고 16일 밝혔다.

NC AI는 엔씨소프트의 AI 전문 법인으로 게임을 넘어 모든 산업에서 창작과 비즈니스 혁신을 이끄는 AI 솔루션을 개발·공급하고 있다. 

이번에 발표한 모델은 큐원(Qwen) 오픈소스 기반에서 추가학습을 통해 구축됐다. 멀티모달 모델로 제작된 모델 중 글로벌 톱 수준을 갖췄다는 게 의미가 있다고 NC AI는 설명했다. 

여러 장의 이미지를 동시에 분석할 수 있어 복잡한 문서나 표, 차트도 효과적으로 처리할 수 있다는 점이 핵심 차별화 요소다.

한국어와 영어 모두 자연스럽게 이해할 수 있으며 텍스트 생성 능력과 한국 문화에 대한 이해도를 크게 향상시켰다.

바르코 비전 2.014B의 경우 글로벌 오픈소스 비전언어모델(VLM) 최고 성능으로 알려진 InternVL3-14B(140억 파라미터)와 알리바바의 Ovis2-16B, Qwen2.5-VL 7B를 능가하는 성과도 달성했다. 4종의 모델 중 14B와 임베딩 모델 2종은 16일, 1.7B와 OCR모델은 차주 중 공개된다.

14B 모델은 복잡한 멀티이미지 분석과 고도화된 추론이 필요한 업무용 환경에 최적화되어 있다. 1.7B 경량 모델은 스마트폰이나 PC 등 개인 기기에서도 원활하게 동작할 수 있도록 설계됐다.

1.7B-OCR는 이미지 내 문자를 인식하는 광학 문자 인식 작업에 특화된 모델이다. 기존 광학문자판독(OCR) 모델들과 달리 이미지와 언어 정보를 동시에 학습한 VLM기반 접근 방식을 채택해 기존 오픈소스 OCR 모델 대비 한국어 OCR 능력이 더 높다고 NC AI는 전했다.

멀티모달 임베딩 모델은 텍스트, 이미지, 비디오 간의 의미적 유사도를 고차원 임베딩 공간에서 정밀하게 계산한다. 임베딩이란 영상의 내용을 숫자로 변환해서 저장하는 것이다. 이 기술을 통해 사용자의 자연어 질의에 따라 동영상 콘텐츠를 고차원 임베딩으로 변환하고 이 임베딩 간의 거리나 유사도를 기반으로 관련성 높은 이미지나 비디오를 검색할 수 있다.

이번에 공개된 4종의 모델은 금융, 교육, 문화, 쇼핑, 제조 등 다양한 도메인에서 활용 가능하다. 복잡한 보고서, 계약서, 청구서 등의 자동 분석 및 디지털화, 표와 차트가 포함된 문서 처리나 주문서 자동 정리 및 요약 등 문서 처리 및 자동화 분야에서 광범위하게 활용할 수 있다.

제품 이미지 기반 자동 설명 생성, 비디오 콘텐츠의 자연어 기반 검색 시스템, 크리에이티브 콘텐츠 생성 및 광고 문구 작성 등 콘텐츠 및 미디어 분야에서도 업무효율의 증대를 가져올 것으로 기대된다.

NC AI 관계자는 "NC AI는 파운데이션 모델을 기반부터 구축하는 From Scratch 방식의 LLM 모델을 개발한 몇 안되는 기업"이라면서 "멀티모달모델을 오픈소스로 공개할 수 있는 역량이 있는 기업은 국내에 거의 없다"고 전했다. 

이연수 NC AI 대표는 "기술 고도화로 글로벌 트렌드가 텍스트만 처리하는 언어모델을 넘어 비전 모델을 함께 활용하는 비전언어모델로 전환되고 있다"며 "이번 4종 모델 공개를 통해 미디어와 게임, 패션 등 버티컬 AI로 기존 국내 멀티모달 AI를 선도하는 NC AI가 비전언어모델에서도 한국의 주권을 지킬 수 있는 가능성을 확인했다"고 밝혔다.

Copyright ⓒ 한스경제 무단 전재 및 재배포 금지

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?
광고 보고 계속 읽기
원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

  1. -
  2. -
  3. -
  4. -
  5. -
  6. -
  7. -
  8. -
  9. -
  10. -

0000.00.00 00:00 기준

이 시각 주요뉴스

알림 문구가 한줄로 들어가는 영역입니다

신고하기

작성 아이디가 들어갑니다

내용 내용이 최대 두 줄로 노출됩니다

신고 사유를 선택하세요

이 이야기를
공유하세요

이 콘텐츠를 공유하세요.

콘텐츠 공유하고 수익 받는 방법이 궁금하다면👋>
주소가 복사되었습니다.
유튜브로 이동하여 공유해 주세요.
유튜브 활용 방법 알아보기