한국딥러닝, OCRBench 1위…구글·오픈AI 제치고 문서 AI 정상

문서 인식과 이해를 결합한 AI 기술 경쟁에서 국내 기업이 글로벌 선두에 올랐다.

한국딥러닝은 글로벌 멀티모달 OCR 평가 지표인 OCRBench v2 2026년 3월 영어 부문에서 68.1점을 기록하며 종합 1위를 차지했다고 22일 밝혔다. 아시아 기업이 해당 벤치마크에서 1위에 오른 것은 처음이다.

이번 평가에서 한국딥러닝은 Gemini 3 Pro Preview(63.4점)보다 4.7점 높은 점수를 기록했다. GPT-5, Qwen3-Omni-30B, Claude Opus 4.6 등 주요 글로벌 모델들도 순위 경쟁에서 뒤로 밀렸다.

OCRBench v2는 단순 문자 인식을 넘어 문서 구조 분석, 표와 수식 해석, 논리적 추론까지 포함한 31개 항목을 평가하는 고난도 벤치마크다. 사람이 직접 검증한 데이터셋과 별도 비공개 테스트셋을 활용해 모델 성능을 이중으로 검증하는 방식이 적용된다. 업계에서는 50점을 넘기기 어려운 기준으로 알려져 있다.

한국딥러닝의 성과는 문서 특화 시각언어모델(VLM) ‘KDL 프론티어’를 기반으로 한다. 수억 건 규모의 문서 데이터를 학습해 문서 구조 파악과 정보 추출 정확도를 동시에 끌어올린 것이 특징이다. 특히 외부 공개가 제한된 환경에서도 성능이 유지된 점이 강조됐다.

세부 항목별로는 문서 구조화(파싱)와 맥락 이해 영역에서 강점이 확인됐다. 단순 텍스트 인식 수준을 넘어 문서 내 항목 간 관계와 위치 정보를 반영해 결과를 도출하는 구조다. 이 방식은 인식 오류가 실제 의미 왜곡으로 이어지는 문제를 줄이는 데 초점이 맞춰져 있다.

기술적 차별성으로는 ‘Near-Zero Hallucination’ 접근이 제시됐다. 생성형 AI 모델이 존재하지 않는 정보를 만들어내는 환각 현상을 최소화해, 문서에 기재된 정보를 그대로 추출하는 데 집중한 구조다. 범용 모델이 다양한 작업을 동시에 수행하는 대신, 문서 처리에 특화된 설계를 선택한 전략으로 해석된다.

실제 적용 가능성도 함께 강조됐다. 손글씨와 같은 노이즈 환경에서도 인식 성능을 유지하고, 다양한 문서 유형에 대응할 수 있도록 설계됐다. 비공개 테스트셋에서도 성능이 유지되며 금융, 법무, 공공 등 정확도가 중요한 산업군에서 활용 가능성이 제시됐다.

다만 벤치마크 성과가 곧바로 시장 경쟁력으로 이어진다고 보기는 어렵다는 시각도 있다. 실제 기업 환경에서는 데이터 보안, 시스템 통합, 운영 비용 등 추가 요소가 도입 결정에 영향을 미치기 때문이다. 특히 글로벌 빅테크 기업들이 빠르게 모델을 개선하는 상황에서 기술 격차를 유지할 수 있을지도 주요 변수로 꼽힌다.

김동현 한국딥러닝 CSO는 “문서 지능 영역에서 구조적 설계를 통해 기술 경쟁력을 입증했다”며 “정확성이 중요한 산업에서 활용 가치를 확대해 나갈 계획”이라고 말했다.

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?

광고 보고 계속 읽기

원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

2022.08.01 00:00 기준

실시간 키워드