공공부문 인공지능(AI) 행정서비스가 확대되는 가운데, 생성형 AI의 신뢰성과 데이터 품질 관리가 핵심 과제로 떠오르고 있다. 이런 흐름 속에서 오케스트로 AGI가 경기도의 AI 학습데이터 통합 관리체계 구축 사업을 수주하며 공공 AI 데이터 인프라 시장 확대에 속도를 내고 있다.
오케스트로 AGI는 데이터 플랫폼 전문기업 엑셈과 컨소시엄을 구성해 경기도가 추진하는 ‘경기 AI 학습데이터 통합 관리체계 구축사업’을 수주했다고 12일 밝혔다.
이번 사업은 경기도가 보유한 행정 데이터를 생성형 AI가 활용 가능한 고품질 학습데이터로 정비하고, AI 행정서비스의 신뢰도를 높일 수 있는 데이터 기반을 구축하는 데 초점이 맞춰졌다. 부서별·시스템별로 분산된 데이터 자산을 통합 관리해 AI 전환(AX)을 지원하는 것이 핵심 목표다.
특히 이번 사업은 공공기관이 생성형 AI를 도입하는 과정에서 반복적으로 제기된 ‘환각(Hallucination)’ 문제와 답변 신뢰성 확보를 데이터 관리 관점에서 접근한다는 점에서 주목된다. 단순한 AI 플랫폼 구축을 넘어, AI가 어떤 데이터를 바탕으로 답변을 생성했는지 근거를 추적·검증할 수 있는 체계를 구축하는 데 무게를 둔 사업이라는 평가가 나온다.
경기도는 국내 지자체 가운데 비교적 선도적으로 클라우드 기반 행정 시스템 구축을 추진해 온 곳이다. 최근에는 AI 기반 행정서비스 확대를 위해 데이터 관리체계 정비에 속도를 내고 있다. 오케스트로 그룹은 앞서 경기도 클라우드컴퓨팅 시스템 구축 사업을 수행한 데 이어 이번 AI 데이터 관리 사업까지 맡으며 경기도 디지털 전환 프로젝트에서 존재감을 확대하게 됐다.
오케스트로 AGI는 사업을 통해 경기도가 운영 중인 약 80종의 정보시스템과 생성형 AI 플랫폼 내 지식 저장소에 축적된 비정형 데이터를 분석한다. 이후 글로벌 데이터 표준인 DCAT 3.0(Data Catalog Vocabulary) 기반 데이터 카탈로그를 구축해 부서별 데이터 구조와 연계 관계를 체계적으로 정리할 계획이다.
데이터 생성부터 활용까지 이력을 추적할 수 있는 ‘데이터 리니지(Data Lineage)’ 체계도 구축된다. 데이터 출처와 변경 기록을 관리하는 동시에, AI 기본법상 고영향 인공지능 관련 데이터 범위를 식별하고 카탈로그화해 규제 대응 기반도 함께 마련한다는 구상이다.
기술적으로는 기존 검색증강생성(RAG)에 데이터 카탈로그와 온톨로지를 연계한 구조가 적용된다. 단순 유사도 검색이 아니라 답변에 활용될 데이터를 사전에 선별하고 데이터 간 관계성을 반영해 보다 검증 가능한 답변 체계를 구축하는 방식이다. 여기에 질의응답(Q&A) 검증과 튜닝 기술을 추가해 근거 없는 AI 답변 생성을 줄이고 행정서비스 정확성을 높인다는 계획이다.
공공 AI 시장에서는 최근 데이터 품질 관리와 거버넌스 체계 확보가 핵심 경쟁력으로 부상하고 있다. 생성형 AI 도입 자체보다 어떤 데이터를 활용하고, 답변 근거를 얼마나 설명할 수 있는지가 공공기관 신뢰성과 직결되기 때문이다. 이번 사업 역시 단순 시스템 구축을 넘어 향후 공공 AI 표준 사례로 확장될 가능성이 있다는 관측이 나온다.
다만 공공 데이터 통합 사업은 시스템 간 데이터 표준 차이, 부서별 운영 방식, 개인정보 및 보안 규제 등 복합적 변수가 존재하는 만큼 실제 운영 단계에서 데이터 품질과 활용 효율성을 얼마나 끌어올릴 수 있을지가 성패를 가를 전망이다.
오케스트로 AGI는 그동안 AI 플랫폼, 데이터 플랫폼, 온톨로지 기반 지식관리체계 구축 사업을 수행하며 공공 AI 역량을 확대해 왔다. 한국교통안전공단, 한국도로공사, 국민건강보험공단 등 다수 기관 프로젝트 경험을 바탕으로 공공 AI 데이터 관리 시장 공략을 강화할 계획이다.
김영광 오케스트로 AGI 대표는 “공공부문에서 생성형 AI를 안정적으로 활용하려면 데이터 양뿐 아니라 품질, 구조, 출처까지 체계적으로 관리돼야 한다”며 “경기도 AI 행정서비스 고도화를 지원하고 신뢰도 높은 공공 AI 활용 모델을 만드는 데 집중하겠다”고 말했다.
Copyright ⓒ 스타트업엔 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.