SK AX가 에이전틱AI 기반 인프라 운영 서비스 'AXgenticWire NPO'(New Paradigm for Operation)를 앞세워 시스템 장애 예방에 나섰다. AI 전환(AX)을 가속화하는 동시에 기업 인프라 운영의 안정성과 효율성을 동시에 확보하겠다는 전략이다.
글로벌 조사기관에 따르면 시스템 장애로 인한 기업 손실 비용은 연간 수천만 달러에 달하는 것으로 나타났다. SK AX는 AXgenticWire NPO를 통해 휴먼에러(Human Error)를 최소화하고 문제 상황을 사전에 차단함으로써 기업 손실과 사회적 비용을 줄이겠다는 방침이다.
AXgenticWire NPO의 핵심 경쟁력은 에이전틱AI가 문제 상황을 선제적으로 탐지하고 분석, 판단, 조치까지 수행하는 자동화 구조에 있다. 이를 통해 장애 발생률을 획기적으로 낮출 수 있다는 설명이다.
SK AX 관계자는 "최근 AI 클라우드 환경 확대로 GPU 자원 관리와 워크로드 변동성까지 고려해야 하는 복잡성이 커지면서 휴먼에러 발생 가능성도 증가하고 있다"며 "AXgenticWire NPO는 이러한 환경을 통합 관리해 운영 리스크를 사전에 차단한다"고 말했다.
산업별 적용 범위도 넓다. 제조업에서는 설비 및 공정 과정에서 실시간 이상 징후를 감지해 잠재 리스크를 줄일 수 있으며, 금융 분야에서는 중단 없는 전자금융 IT 운영 체계 구축이 가능하다. 공공 분야에서도 대국민 서비스 안정성과 장애 대응 역량을 동시에 강화할 수 있다.
AXgenticWire NPO는 단순한 운영 자동화를 넘어 기업의 IT 운영 방식과 비용 구조 전반을 개선하는 데 초점을 맞췄다. AI 에이전트가 시스템과 GPU, AI 워크로드 등에서 발생하는 로그·메트릭·이벤트 데이터를 분석해 인력 중심 운영을 지능형 AI 운영 체계로 전환한다.
운영 프로세스는 단계별 에이전트 협업 구조로 구성된다. '탐지 에이전트'가 이상 징후를 감지하면 '분석 에이전트'가 원인을 추론하고, '영향도 에이전트'가 시스템 전반으로 영향을 확장해 판단한다. 이후 '조치 에이전트'가 복구, 설정 변경, 자원 재할당 등을 즉시 수행한다.
또한 운영자는 워크스페이스를 통해 자연어 기반으로 전체 과정을 조회, 분석, 제어할 수 있어 사용자 편의성도 크게 향상됐다.
SK AX는 사용자 경험 강화를 위해 △기업이 자체적으로 에이전틱AI를 설계·운영할 수 있는 'AI 스튜디오(Studio)' △MCP(Model Context Protocol)를 수분 내 생성할 수 있는 'MCP 빌더' 등을 제공한다.
아울러 GPU 자원을 통합 관리하는 'GPU 애즈 어 서비스(GPU-as-a-Service)'를 통해 AI 학습 및 추론 워크로드까지 안정적으로 운영할 수 있도록 지원한다.
도입 방식도 다양화했다. 보안이 중요한 기업은 설치형을 선택할 수 있으며, 특정 공정 개선을 원하는 기업은 BPO(Business Process Outsourcing), 전체 운영 체계 혁신을 원하는 기업은 AI 클라우드 인프라를 포함한 통합 운영(ITO) 방식을 선택할 수 있다. SK AX는 산업별 규제와 운영 환경을 고려한 맞춤형 컨설팅도 함께 제공한다.
차지원 SK AX CAIO(최고AI혁신책임자)는 "운영 전반에서 AI가 선제적으로 대응하는 구조를 통해 휴먼에러로 인한 장애 위험을 최소화할 수 있다"며 "AXgenticWire NPO 도입을 통해 기업은 다운타임(Down-time) 없는 운영 체계 구축은 물론 애플리케이션 지능화 서비스까지 구현하며 AX 전환 속도를 높일 수 있다"고 말했다. 이어 "운영비용 구조 혁신과 프로세스 재설계(Rewire)까지 가능할 것"이라고 강조했다.
박성대 기자 / 경제를 읽는 맑은 창 - 비즈니스플러스
Copyright ⓒ 비즈니스플러스 무단 전재 및 재배포 금지