PDF 데이터 추출 기술 글로벌 AI 개발 표준에 등록
[포인트경제] 한글과컴퓨터(한컴)의 PDF 데이터 추출 기술 ‘오픈데이터로더 PDF(OpenDataLoader PDF)’가 글로벌 AI 개발 프레임워크 ‘랭체인(LangChain)’의 공식 구성요소로 등록됐다고 3일 밝혔다. 랭체인은 대규모 언어 모델(LLM)을 기반으로 한 AI 애플리케이션 구축에 널리 사용되는 오픈소스 프레임워크다. 전 세계 수십만 명의 AI 개발자가 활용하는 사실상의 표준 개발 도구로 자리 잡았다.
한컴 오픈데이터로더 PDF 랭체인 등록 페이지 /한글과컴퓨터 제공
한컴은 지난 9월 깃허브(GitHub)에 ‘오픈데이터로더 PDF’ 코드를 공개한 데 이어, 이번 랭체인 도큐먼트 로더 PDF(Document Loader PDF) 파트 공식 컴포넌트로 등록되면서 기술의 안정성과 성능, AI 개발 환경에서의 적합성을 공식적으로 검증받았다.
‘오픈데이터로더 PDF’는 PDF 문서 내 텍스트, 표, 이미지 등 다양한 데이터를 정확하고 신속하게 추출해 AI가 즉시 활용 가능한 형태로 변환하는 기술이다. 이 기술은 AI 학습 및 활용 과정에서 발생하는 데이터 병목 현상을 해소하는 데 중점을 둔다. 한컴은 이번 등록을 통해 PDF 데이터 처리에 어려움을 겪는 전 세계 AI 개발자들에게 신뢰할 수 있는 솔루션을 제공하게 됐다.
한컴은 ‘오픈데이터로더 PDF’의 글로벌 AI 표준 프레임워크 기여를 통해 기술 리더십을 강화했다. 정지환 한컴 최고기술책임자(CTO)는 “랭체인 공식 등록은 한컴의 문서 처리 기술력이 글로벌 AI 개발 생태계의 표준으로 인정받은 중요한 성과”라며, “전 세계 개발자들이 가장 활발하게 사용하는 글로벌 AI 프레임워크에 직접 통합됨으로써 AI 시대 데이터 활용의 어려움을 해결하는 데 실질적으로 기여하게 됐다”고 밝혔다. 이어 “앞으로도 랭체인 커뮤니티와 긴밀히 협력해 기술을 지속적으로 고도화하고 AI 생태계 발전에 기여할 것”이라고 덧붙였다.
이번 등록은 한컴이 글로벌 AI 개발 생태계에서 핵심 구성요소로 공식 인정받았다는 점에서 의미가 크다. 랭체인과의 통합은 단순한 코드 공개를 넘어 기술의 신뢰성과 우수성을 입증하는 결과다. 한컴은 이를 기반으로 국내를 넘어 글로벌 AI 표준 프레임워크에 문서 기술력을 기여하고 있다.
Copyright ⓒ 포인트경제 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.