셀렉트스타, 국내 최초 ‘EU 개인정보 벤치마크 데이터’ 구축 착수

[이데일리 김현아 기자] 인공지능(AI) 데이터 전문 스타트업 셀렉트스타(대표 김세엽)가 국내 최초로 유럽연합(EU) 개인정보 벤치마크 데이터셋 구축에 나선다.

이번 프로젝트는 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주관하는 ‘2025년도 초거대 AI 확산 생태계 조성사업’의 일환으로, 셀렉트스타가 주관기관을 맡고 플리토, BHSN이 참여기관으로 합류한다.

GDPR·AI Act 기반 표준 데이터 구축

셀렉트스타는 EU의 일반개인정보보호법(GDPR)과 인공지능법(AI Act)을 토대로 초거대 언어모델(LLM)의 개인정보보호 준수 여부를 평가할 수 있는 오픈소스 데이터셋을 구축한다.

이 과정에서 EU 법령과 공공 보고서를 기반으로 대규모 데이터를 수집·정제하고, 개인정보 보호와 관련된 핵심 항목을 체계적으로 분류해 평가 기준을 마련한다.

실제 서비스 환경에 적용할 수 있도록 질의응답 데이터와 다국어 평가 자료를 제작해, AI가 규제 준수 여부를 제대로 이해하고 이행하는지를 검증할 수 있는 체계를 갖출 예정이다.

컨소시엄 역할 분담

프로젝트는 셀렉트스타가 전체 기획·총괄과 데이터 구축 및 품질 검증을 담당한다.

플리토는 다국어 데이터 정제·검수와 번역 품질 관리, 용어사전 구축을 맡고, 리걸 AI 전문기업 BHSN은 개인정보 보호 항목 정의, 시나리오 설계, 법적 리스크 검토를 담당해 데이터셋이 실제 규제 환경에 부합하도록 지원한다.

국내 AI 기업 유럽 진출 도구 제공

이번 사업은 국내 최초로 EU 규제 준수 여부를 검증할 수 있는 벤치마크 데이터셋을 마련한다는 점에서 의미가 크다. 향후 국내 AI 기업들이 유럽 시장에 진출할 때 필요한 검증 도구로 활용될 전망이며, 구축된 데이터셋은 오픈소스로 공개돼 누구나 활용할 수 있다.

김세엽 셀렉트스타 대표는 “이번 프로젝트는 국내 기업들이 글로벌 시장 진출 시 규제 대응 역량을 강화하는 데 중요한 발판이 될 것”이라며 “자체 개발한 AI 신뢰성 검증 기술력을 바탕으로 LLM의 EU 규제 대응 수준을 정량적으로 측정할 수 있는 체계를 마련하겠다”고 말했다.

셀렉트스타는 AI 신뢰성 검증 솔루션 ‘다투모 이밸(Datumo Eval)’을 통해 금융권을 비롯한 다양한 산업 분야에서 입지를 확대해 왔다.

지난 15일 열린 ‘제47차 글로벌 프라이버시 총회(GPA 2025)’ 오픈소스 데이에서는 구글, 마이크로소프트, 메타, 오픈AI 등 글로벌 빅테크 기업과 함께 발표 세션에 참여하며 주목을 받기도 했다.

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?

광고 보고 계속 읽기

원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

2022.08.01 00:00 기준

실시간 키워드