한국딥러닝, 글로벌 OCR 벤치마크 1위

| 서울=한스경제 김종효 기자 | 한국딥러닝은 글로벌 멀티모달 OCR 벤치마크에서 1위를 차지했다고 22일 밝혔다. 아시아 기업으로는 처음이다.

한국딥러닝은 OCRBench v2 2026년 3월 영어 부문 평가에서 68.1점을 기록했다. 구글 제미나이 등 글로벌 주요 모델을 제쳤다.

KDL 프론티어는 문서 처리에 특화된 시각 언어 모델이다. 수억건의 학습 데이터를 기반으로 개발했다. 인식과 정보 추출 정확도를 높였다. 외부에 공개되지 않은 데이터 환경에서도 성능을 유지했다.

OCRBench v2는 HUST와 바이트댄스 등이 공동 개발한 벤치마크다. 텍스트 인식, 레이아웃 분석, 수식·도표 해석, 논리적 추론 등 31개 시나리오를 평가한다. 1만건의 데이터셋과 1500장 규모의 비공개 테스트셋을 활용해 신뢰도를 검증한다.

한국딥러닝은 2위 제미나이 3 프로 프리뷰와 4.7점 차이를 보였다. 오픈AI GPT-5, 알리바바 Qwen3-Omni-30B, 앤트로픽 클로드 오퍼스 4.6 등 글로벌 모델과도 격차를 벌렸다. 문서 구조화와 맥락 이해 항목에서 강세를 보였다.

이번 성과는 AI 환각 현상을 최소화한 기술에서 비롯됐다. 한국딥러닝의 문서 특화 모델은 문서에 쓰인 값을 정확히 추출한다. 범용 모델과 달리 문서 구조 이해에 집중해 설계했다. 문서 내 레이아웃, 항목 간 관계, 위치 정보를 함께 반영한다. 단순 인식 오류가 의미 오류로 이어지는 것을 줄였다. 정보 추출과 관계 이해 정확도를 높였다.

실제 환경에서도 신뢰성을 입증했다. 한국어 손글씨 등 노이즈가 많은 입력에도 안정적으로 인식한다. 다양한 문서 유형에 대응하는 처리 전략으로 일반화 성능을 확보했다. 비공개 테스트셋 평가에서도 성능이 유지됐다.

김동현 한국딥러닝 CSO는 "글로벌 빅테크가 주도하는 AI 시장에서 국내 기술로 의미 있는 성과를 냈다"며 "문서 지능 영역에서 구조적 설계로 기술 격차를 증명했다"고 말했다. 이어 "금융·법무·공공 등 산업 현장에서 환각 없는 문서 AI의 가치를 보여주겠다"고 밝혔다.

한국딥러닝은 2019년 설립된 시각지능 AI 전문기업이다. 초거대 시각 인공지능 모델 DEEP Agent를 자체 개발해 운영한다. OCR 문자인식, 객체 검출, 영상 이해, 이미지 생성 등 다양한 솔루션을 80곳 이상의 공공·기업 고객에 제공 중이다. 4억 장 이상의 데이터셋을 기반으로 정확도를 높였다. 엔비디아 등 글로벌 기업과 파트너십을 맺고 해외 시장 진출도 추진하고 있다.

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?

광고 보고 계속 읽기

원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

2022.08.01 00:00 기준

실시간 키워드