인터넷 트래픽의 상당 부분을 처리하는 글로벌 CDN 기업 클라우드플레어(Cloudflare)의 네트워크 오류로 지난 18일 주요 웹서비스 수천 개가 동시에 다운되는 사태가 발생한 가운데, 사고 원인이 드러나 눈길을 끌고 있다.
클릭하우스(ClcikHouse) 기반의 쿼리 동작 방식이 바뀌면서 클라우드플레어의 봇 관리 시스템(Bot Management)이 사용하는 ‘피처(Feature) 파일’ 생성 과정에서 문제가 발생했다.
클라우드플레어는 이번 장애를 계기로 클라우드플레어 생성 구성 파일의 검증 강화와 전역 긴급 중단 스위치(Global Kill Switch) 확대 적용, 핵심 프록시 모듈의 모든 장애 모드 검증 재점검 등과 같은 조치를 즉시 시행한다고 밝혔다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “M투데이” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.