DATA 재단, 클레드와 통합…11억건 AI 학습 데이터 품고 인프라 전환

실시간 키워드

2022.08.01 00:00 기준

DATA 재단, 클레드와 통합…11억건 AI 학습 데이터 품고 인프라 전환

스타트업엔 2026-06-26 09:34:57 신고

3줄요약
DATA 재단, 클레드와 통합…11억건 AI 학습 데이터 품고 인프라 전환
DATA 재단, 클레드와 통합…11억건 AI 학습 데이터 품고 인프라 전환

AI 학습 데이터 인프라를 지원하는 DATA 재단이 ‘스토리’에서 ‘DATA 재단’으로 사명을 바꾸고, 사용자 참여형 AI 학습 데이터 기여 마켓플레이스 ‘클레드(Kled)’와 기술 통합에 나선다. 지적재산권(IP) 네트워크 성격이 강했던 기존 사업 구조를 넘어, AI 학습 데이터의 수집부터 등록, 라이선싱, 출처 증명, 정산까지 아우르는 인프라 사업자로 무게중심을 옮기겠다는 전략이다.

DATA 재단은 26일 클레드와의 통합을 통해 11억건에 달하는 AI 학습 데이터를 자사 네트워크에 등록·운영하고, 모든 학습 데이터의 흐름을 하나의 신뢰 체계 안에서 연결하겠다고 밝혔다. 클레드는 사용자 동의 기반으로 데이터를 수집하고 보상하는 AI 학습 데이터 마켓플레이스로, DATA 재단은 이 데이터의 등록·라이선싱·출처 증명을 담당하는 블록체인 기반 네트워크를 제공한다.

회사가 전면에 내세운 문제의식은 AI 산업의 병목이 더 이상 모델이나 컴퓨팅에만 있지 않다는 점이다. 대형 AI 모델 학습에 필요한 웹 데이터는 과도한 스크래핑과 법적 분쟁 우려 속에 한계가 뚜렷해지고 있다. 남아 있는 데이터 역시 비용이 높고, 데이터 수집 동의와 라이선스 구조가 불명확한 경우가 많다. DATA 재단은 이런 상황에서 데이터의 출처와 권리, 보상 체계를 명확히 검증할 수 있는 인프라가 필요하다고 보고 있다.

이번 통합의 핵심은 데이터 공급과 검증 구조를 동시에 붙였다는 점이다. 클레드는 사용자 동의를 바탕으로 축적한 데이터, 라이선싱 체계, 기여자 보상 시스템을 제공하고, DATA 재단은 이를 블록체인 기반 네트워크 위에서 관리한다. 데이터가 어디서 왔고, 누가 제공했으며, 어떤 조건으로 활용 가능한지를 한 체계 안에서 확인할 수 있도록 하겠다는 구상이다.

DATA 재단은 이날 AI 학습 데이터의 출처와 라이선스를 기록하는 공개 감사 계층 ‘트레이스(Trace)’도 함께 공개했다. 트레이스는 데이터 기여마다 변경이 불가능한 영수증을 생성해, 데이터세트의 정당성을 빠르게 검증할 수 있도록 설계됐다. 데이터 기여자 보상과 라이선스 준수, 감사 가능성을 한꺼번에 담으려는 시도다. 최근 생성형 AI 산업에서 학습 데이터의 저작권과 동의 여부가 주요 쟁점으로 떠오른 만큼, 트레이스는 DATA 재단이 강조하는 차별화 포인트로 읽힌다.

리더십 체계도 바뀐다. 아마존 알렉사 AI 수석 기술 에반젤리스트 출신으로 기존 스토리 최고제품책임자(CPO)와 이사장을 맡아온 안드레아 무토니가 DATA 재단 최고경영자(CEO)를 맡는다. 클레드 창업자 아비 파텔은 최고데이터책임자(CDO)로 합류한다. 스토리 공동창업자 이승윤 대표는 DATA 재단 경영에서 한발 물러나, 스토리가 인큐베이팅한 AI 데이터 인프라 계열사 포세이돈(Poseidon)의 최고전략책임자(CSO) 겸 이사회 의장으로 신사업에 집중할 예정이다.

포세이돈은 실세계 데이터를 수집·정제하고, AI 모델 학습에 곧바로 투입할 수 있는 형태로 가공하는 데이터 인프라 기업이다. DATA 재단에 따르면 포세이돈 역시 DATA 네트워크 위에서 운영되며, 향후 생태계 확장에 참여하게 된다. 포세이돈은 글로벌 벤처캐피털 a16z의 투자를 받은 곳으로 소개됐다.

클레드의 성장세도 DATA 재단이 통합 카드를 꺼내든 배경 중 하나다. 클레드는 사용자 자발적 참여를 바탕으로 데이터를 모으고 실시간 보상을 제공하는 앱으로, 회사 측에 따르면 출시 2주 만에 20만명 이상의 기여자를 확보했다. 하루 업로드 파일 수는 300만~450만건 수준이며, 1인칭 시점 영상, 의료 영상, 도시 모빌리티 데이터 등 1만2000개 이상의 정형화된 데이터세트를 구축했다. DATA 재단은 해당 데이터가 이미 주요 AI 연구소와 기업의 프론티어 모델 학습에 활용되고 있으며, 특히 로보틱스와 피지컬 AI 분야에서 수요가 빠르게 늘고 있다고 설명했다.

투자 이력도 적지 않다. 클레드는 550만달러 규모 시드 투자를 포함해 지금까지 총 1100만달러를 유치했다. 투자자에는 구글 웨이모 자율주행 프로젝트를 이끌었던 세바스찬 스런, LVMH 그룹 베르나르 아르노 회장 측 투자사 아글라에 벤처스, K5 글로벌, 콕스 익스포넨셜(CX2) 등이 포함됐다.

DATA 재단은 기존 $IP 토큰을 $DATA로 1대1 전환한다고도 밝혔다. 기존 보유자는 별도의 조치를 취할 필요가 없으며, 전환 일정과 거래소 공지, 세부 FAQ는 재단 홈페이지를 통해 안내할 예정이다.

다만 이번 통합이 곧바로 시장 지배력으로 이어질지는 더 지켜볼 필요가 있다. AI 학습 데이터 시장은 데이터 품질, 법적 안정성, 실제 모델 성능 기여도, 고객 확보가 동시에 맞물려야 하는 영역이다. 블록체인 기반 감사 체계와 사용자 동의형 데이터 소싱이 분명한 차별점이 될 수는 있지만, 대형 AI 연구소와 기업 고객이 이를 얼마나 표준 인프라로 받아들일지는 별도의 문제다. 결국 DATA 재단이 제시한 ‘출처가 검증된 AI 데이터 인프라’ 모델이 산업 내 신뢰를 얼마나 확보하느냐가 향후 성패를 가를 전망이다.

안드레아 무토니 DATA 재단 CEO는 “AI 산업의 핵심 과제가 컴퓨팅과 모델 구조를 넘어 데이터 확보와 출처 증명의 문제로 옮겨가고 있다”며 “공개 웹 데이터 활용이 한계에 다다른 상황에서, DATA 재단은 클레드와 함께 대규모 AI 학습 데이터 풀에 투명성과 감사 가능성을 더하겠다”고 밝혔다.

아비 파텔 DATA 재단 CDO도 “앞으로의 데이터 거래 시장에서는 데이터 확보 경로와 출처를 명확히 증명할 수 있는 공급자가 경쟁력을 갖게 될 것”이라며 “클레드의 마켓플레이스와 DATA의 감사 가능한 관리 체계가 결합되면서 데이터 제공부터 활용, 정산, 출처 증명까지 하나의 신뢰 체계 안에서 연결될 것”이라고 말했다.

Copyright ⓒ 스타트업엔 무단 전재 및 재배포 금지

본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.

다음 내용이 궁금하다면?
광고 보고 계속 읽기
원치 않을 경우 뒤로가기를 눌러주세요

실시간 키워드

  1. -
  2. -
  3. -
  4. -
  5. -
  6. -
  7. -
  8. -
  9. -
  10. -

0000.00.00 00:00 기준

이 시각 주요뉴스

알림 문구가 한줄로 들어가는 영역입니다

신고하기

작성 아이디가 들어갑니다

내용 내용이 최대 두 줄로 노출됩니다

신고 사유를 선택하세요

이 이야기를
공유하세요

이 콘텐츠를 공유하세요.

콘텐츠 공유하고 수익 받는 방법이 궁금하다면👋>
주소가 복사되었습니다.
유튜브로 이동하여 공유해 주세요.
유튜브 활용 방법 알아보기