[SECON 2026] 대한CNI 우종현 CTO “지키는 보안에서 남기는 보안으로” 아카이브를 다시 생각할 시간

실시간 키워드

2022.08.01 00:00 기준

[SECON 2026] 대한CNI 우종현 CTO “지키는 보안에서 남기는 보안으로” 아카이브를 다시 생각할 시간

위클리 포스트 2026-03-27 00:20:00 신고

3줄요약

AI 시대, 데이터는 더 이상 골라서 남기는 대상이 아니다
백업은 복구를 위한 기술이고, 아카이브는 미래의 활용을 위한 구조가 되고 있다


SECON 2026 현장에서 대한CNI 우종현 CTO가 꺼낸 문제의식은 분명했다. 지금 산업계의 관심은 AI에 쏠려 있지만, 정작 AI를 가능하게 하는 기반은 모델 자체보다 데이터에 더 가까워지고 있다는 것. '아카이브의 재발견, 그러니까 지키는 보안에서 남기는 보안으로 가는 아카이브의 재발견' 이라는 타이틀은 그 인식을 상징적으로 드러낸 문장이다. 보안을 침입 차단과 시스템 방어의 관점으로만 보던 단계에서, 이제는 데이터를 어떻게 남기고 보존할 것인가까지 함께 고민해야 한다는 뜻이다.

AI 시대의 핵심 자원은 결국 데이터다. 모델을 학습시키고 고도화하는 과정에서 무엇보다 중요해지는 것은 얼마나 많은 데이터를 확보하고, 그것을 어떤 방식으로 축적하고 관리하느냐이다. 실제 산업 현장에서는 이미 이 문제가 현실이 되고 있다. 데이터센터 구축, 전력 수급, 서버 인프라, 저장장치 투자가 함께 부상하는 이유도 여기에 있다. 연산 자원만 늘린다고 AI 경쟁력이 완성되는 것이 아니라, 그 연산을 가능하게 하는 데이터 기반이 얼마나 두껍고 지속 가능한지가 더 중요해졌기 때문이다.

이 대목에서 눈여겨볼 것은 데이터에 대한 판단 기준이 바뀌고 있다는 점이다. 과거에는 사람이 데이터를 선별했다. 의미 있는 데이터와 의미 없는 데이터를 나누고, 학습이나 분석에 필요하다고 판단되는 것만 남기려 했다. 그러나 AI와 빅데이터 환경으로 넘어오면서 그런 구분 자체가 점점 설득력을 잃고 있다. 지금 당장은 중요해 보이지 않는 데이터라도 나중에 다른 데이터와 결합해 새로운 의미를 만들 수 있고, 실패 데이터나 저빈도 로그조차 모델링과 재학습 과정에서는 유효한 자원이 될 수 있기 때문이다. 그래서 이제는 어떤 데이터가 쓸모 있는지보다, 얼마나 많은 데이터를 확보하고 장기적으로 보존할 수 있는지가 더 중요한 경쟁력이 되고 있다.

덕분에 변화는 자연스럽게 아카이브의 재등장으로 이어진다. 하지만 예전의 아카이브가 단순히 사용 빈도가 낮은 데이터를 값싼 저장소로 옮겨 두는 보조적 개념이었다면, 지금의 아카이브는 훨씬 전략적인 의미를 갖는다. AI가 고도화될수록 데이터 의존성은 커지고, 한 번 생성된 데이터는 당장 쓰이지 않더라도 미래의 학습과 분석, 규제 대응, 사고 추적을 위해 남겨둘 필요가 생긴다. 그래서 아카이브는 더 이상 묵혀두는 저장소가 아니라, 필요할 때 다시 불러와 활용할 수 있도록 설계된 장기 보존 구조에 가까워지고 있다.


우종현 CTO는 이를 두고 “AI가 도래하면서 Archive라는 개념이 다시 뜨고 있습니다”라고 설명했다. 그리고 아카이브를 “실질적으로 사용 빈도가 낮은 데이터를 저비용 스토리지에 자동으로 이관하는 방식”이라고 정의했다. 얼핏 익숙한 설명처럼 들리지만, 실제 의미는 적지 않다. 데이터는 생성 직후 가장 자주 쓰이고, 시간이 지나면 점차 접근 빈도가 낮아지며, 이후에는 거의 호출되지 않지만 특정 시점에 반드시 필요해질 수 있다. 사실상 모든 데이터를 메인 스토리지에 붙들어 두는 것은 비용 측면에서도, 성능 측면에서도 비효율적이다. 사용하지 않는 데이터가 메인 계층에 계속 남아 있으면 검색 속도와 운영 효율에도 영향을 줄 수밖에 없다. 결국 저장 전략은 어디에 보관할 것인가의 문제가 아니라 언제 어떤 계층으로 이동시킬 것인가의 문제로 바뀌고 있다.

게다가 백업과 아카이브를 구분하는 일도 중요한 상황. 현장에서는 여전히 백업을 하고 있으면 데이터 관리가 충분하다고 여기는 경우가 많지만, 두 기술은 애초에 목적이 다르기 때문. 백업은 운영 데이터를 복제해 장애나 침해가 발생했을 때 복구할 수 있도록 준비하는 체계다. 반면 아카이브는 지금은 사용하지 않지만 언젠가 다시 활용할 수 있으므로 장기적으로 보존이 핵심이다.

그렇다면 왜 지금 아카이브가 다시 부상하는 것일까?


첫째는 데이터 양의 폭증이다. 영상 데이터는 고해상도화되면서 규모가 커졌고, 자율주행과 제조 자동화, 이른바 피지컬 AI 환경에서는 센서 데이터가 매일 수테라바이트 단위로 생성된다. 공정 라인이 여러 개인 제조 현장이라면 그 양은 순식간에 수백 테라바이트 규모로 불어난다. 이들 데이터가 지금 즉시 활용될지 아닐지는 알 수 없지만, 일단 저장해야 한다는 요구는 점점 분명해지고 있다.

둘째는 랜섬웨어와 같은 보안 위협이다. 최근에는 단순히 데이터 백업만으로는 충분하지 않다는 인식이 커지고 있다. 공격자는 원본 데이터를 암호화하거나 변조해 서비스를 중단시키고, 기업은 그 시점에서 복구와 무결성 검증이라는 이중의 과제에 직면한다. 그래서 최근 아카이브에서는 WORM(Write Once Read Many) 기능이 중요해지고 있다. 한 번 기록한 데이터는 수정이나 삭제를 제한해 원본의 무결성을 보장하는 방식이다.

셋째는 규제다. CCTV 영상은 물론이고, 제조 현장의 생산 데이터, 의료 데이터, 금융권 로그와 거래기록까지 점점 더 긴 기간 동안 보관 의무가 부과되고 있다. 현행 CCTV는 30일, 생산 데이터는 5년에서 8년, 향후 10년 이상으로까지 보관 요구가 강화될 가능성도 있다. 그렇다고 이들 데이터를 모두 고성능 메인 스토리지에 유지하는 것은 현실적으로 비용 부담이 따른다. 그렇다고 삭제할 수도 없다. 결국 필요한 것은 저비용으로 오래 보관하되, 법적 요구나 운영상 필요가 생기면 언제든지 호출할 수 있어야 한다. 아카이브가 비용의 문제이면서 동시에 규제 대응의 문제로 부상하는 이유가 여기에 있다.


자연스레 데이터 생애주기(ILM)가 부상할 수 밖에 없다. 데이터는 생성되고, 즉시 활용되며, 시간이 지나면서 사용 빈도가 낮아지고, 이후 보존 중심의 단계로 이동한다. 그리고 필요할 때 다시 재생되어 쓰인 뒤, 최종적으로 폐기된다. 이 가운데 가장 흥미로운 지점은 재생 단계다. 과거에는 오래된 데이터를 쌓아만 두는 경우가 많았지만, 지금은 아카이브된 데이터를 다시 꺼내 AI 학습과 모델 재설계에 활용하는 일이 점점 늘고 있다. 즉, 지금 당장 쓰지 않는 데이터가 미래에는 핵심 학습 자산이 될 수 있는 시대가 된 것이다.

산업별 사례를 봐도 같은 흐름이 반복된다. CCTV 분야에서는 일정 기간 이후 데이터를 삭제하는 정책이 일반적이었지만, 실제 현장에서는 30일이 지난 영상이 민원이나 분쟁, 사후 클레임 대응을 위해 다시 필요해지는 경우가 늘고 있다. 제조 현장에서는 생산 로그와 공정 데이터가 품질 관리와 추적성 확보를 위해 장기간 보존돼야 한다. 자율주행에서는 하루 수십 테라바이트씩 생성되는 주행 데이터를 시나리오별로 다시 꺼내 재학습하는 것이 이미 중요해졌다. 의료에서는 X-ray, MRI, CT 같은 영상 데이터가 법적 보존 대상이면서 동시에 AI 진단 보조 모델을 고도화하는 학습 자원으로 사용된다. 금융에서는 장기 보관한 로그 데이터가 침해 시점과 경로를 역추적하는 백트래킹 자산이 된다. 산업은 다르지만 결론은 같다. 지금은 쓰지 않는 데이터라도, 미래에는 반드시 다시 불러와야 할 가능성이 있다는 점이다.

결국 대한CNI가 현장에서 던진 메시지는 다음과 같다.

아카이브는 AI 시대의 불확실성을 보완하기 위한 전략이며, 규제와 보안, 비용과 미래 활용 가능성을 한꺼번에 대응하는 대응책이다. 데이터가 많아질수록 무엇을 어떻게 남길지가 관건이고, 이는 기업의 데이터 경쟁력을 결정하는 문제에 가까워지고 있다. 덕분에 과거의 보안이 침입을 막고 시스템을 보호하는 데 집중했다면, 이제는 그 이후까지가 관건이 되는 상황. 침해가 발생해도 원본을 보존할 수 있는가, 규제가 요구할 때 데이터를 제시할 수 있는가, 몇 년 뒤 AI가 필요로 할 때 다시 꺼내 쓸 수 있는가. 이런 질문에 답하는 것이야말로 지금의 아카이브가 충족해야할 필수 덕목이 되고 있다. 바야흐로 AI 시대의 저장은 무엇을 남기고, 어떻게 다시 활용할 것인지에 대한 전략 그 자체라는 설명이다.

실시간 키워드

  1. -
  2. -
  3. -
  4. -
  5. -
  6. -
  7. -
  8. -
  9. -
  10. -

0000.00.00 00:00 기준

이 시각 주요뉴스

알림 문구가 한줄로 들어가는 영역입니다

신고하기

작성 아이디가 들어갑니다

내용 내용이 최대 두 줄로 노출됩니다

신고 사유를 선택하세요

이 이야기를
공유하세요

이 콘텐츠를 공유하세요.

콘텐츠 공유하고 수익 받는 방법이 궁금하다면👋>
주소가 복사되었습니다.
유튜브로 이동하여 공유해 주세요.
유튜브 활용 방법 알아보기