한컴, PDF 데이터 추출 기술 글로벌 AI 표준 등재

실시간 키워드

2022.08.01 00:00 기준

한컴, PDF 데이터 추출 기술 글로벌 AI 표준 등재

이데일리 2025-11-03 09:21:55 신고

3줄요약
[이데일리 김현아 기자] 한글과컴퓨터(030520)(한컴)는 자사의 PDF 데이터 추출 기술 ‘오픈데이터로더 PDF(OpenDataLoader PDF)’가 글로벌 AI 개발 프레임워크 ‘랭체인(LangChain)’의 도큐먼트 로더 PDF(Document Loader PDF) 파트 공식 구성요소(Component)로 등록됐다고 3일 밝혔다.



랭체인은 챗GPT 등 대규모 언어모델(LLM)을 기반으로 한 AI 애플리케이션을 개발할 때 전 세계적으로 가장 널리 사용되는 오픈소스 프레임워크다. 수십만 명의 AI 개발자가 활용하는 사실상의 글로벌 표준 개발 도구로 평가받는다.

이번 등록은 한컴이 지난 9월 깃허브(GitHub)를 통해 ‘오픈데이터로더 PDF’의 코드를 공개한 데 이어, 해당 기술이 글로벌 AI 생태계의 핵심 구성요소로 공식 인정받은 사례다.

단순히 코드를 공개한 것을 넘어 기술의 안정성, 성능, 호환성이 글로벌 표준 환경에서 검증됐다는 점에서 의미가 크다.

‘오픈데이터로더 PDF’는 PDF 문서 내의 텍스트, 표, 이미지 등 비정형 데이터를 정확하게 추출해 AI가 즉시 활용 가능한 형태로 변환하는 기술이다.

사람이 읽기에는 편하지만 AI가 이해하기 어려운 PDF 문서를, AI가 바로 학습하고 분석할 수 있도록 ‘읽을 수 있게 바꿔주는 번역기’ 역할을 한다.

이 기술은 AI 개발 과정에서 발생하는 데이터 병목 문제를 해소하는 핵심 솔루션으로 평가받는다. 이번 등록을 통해 한컴은 전 세계 AI 개발자들이 사용하는 ‘랭체인’ 플랫폼 안에서 PDF 데이터를 처리할 때 바로 활용할 수 있는 공식 기술 제공자가 됐다.

한컴은 이를 계기로 국내 문서 기술 기업에서 글로벌 AI 생태계의 기술 공급자로 도약했다는 평가를 받고 있다. 글로벌 오픈소스 프레임워크에 자사 기술이 공식 채택된 것은, 한컴의 문서처리 기술이 세계적으로 인정받았음을 상징한다.

정지환 한컴 최고기술책임자(CTO)는 “랭체인 공식 등록은 한컴의 문서 처리 기술이 글로벌 AI 생태계에서 기술 표준으로 인정받은 중요한 성과”라며 “AI가 데이터를 활용하는 과정에서 겪는 어려움을 실질적으로 해결하고, 랭체인 커뮤니티와 협력해 기술 고도화와 생태계 발전에 기여하겠다”고 말했다.

Copyright ⓒ 이데일리 무단 전재 및 재배포 금지

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?
광고 보고 계속 읽기
원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

  1. -
  2. -
  3. -
  4. -
  5. -
  6. -
  7. -
  8. -
  9. -
  10. -

0000.00.00 00:00 기준

이 시각 주요뉴스

알림 문구가 한줄로 들어가는 영역입니다

신고하기

작성 아이디가 들어갑니다

내용 내용이 최대 두 줄로 노출됩니다

신고 사유를 선택하세요

이 이야기를
공유하세요

이 콘텐츠를 공유하세요.

콘텐츠 공유하고 수익 받는 방법이 궁금하다면👋>
주소가 복사되었습니다.
유튜브로 이동하여 공유해 주세요.
유튜브 활용 방법 알아보기