국내 통신사 LG유플러스가 생성형 인공지능 신뢰성 검증을 위해 국제 무대에 오른다. 세계 이동통신 산업 단체 GSMA가 주관하는 ‘글로벌 AI 레드팀 챌린지’ 참가를 공식화하면서다. 행사는 스페인 바르셀로나에서 열리는 MWC26 기간 중 진행된다.
해당 챌린지는 MWC와 공동 개최되는 개발자 행사 ‘Talent Arena 2026’ 핵심 프로그램이다. 글로벌 통신사와 테크 기업이 만든 AI 모델을 실제 공격 상황처럼 시험하는 방식이 특징이다. 기술 해킹이 아닌 프롬프트 설계만으로 취약점을 찾아내는 구조다.
참가자 약 100명은 레드팀 역할을 맡아 모델을 상대로 다양한 시도를 진행한다. 평가 영역은 ▲안전장치 우회 ▲편향·차별 ▲인권 침해 ▲사이버 공격 ▲불법 콘텐츠 ▲허위정보 ▲응답 비일관성 등 7개 항목이다.
평가 기준도 기존 AI 테스트와 다르다. 정확한 답변 여부가 아니라 “답하지 말아야 할 내용에 응답했는지”가 핵심 판단 지표다. 사실과 다른 정보라도 금지 영역 질문에 답했다면 취약점으로 간주된다. 생성형 AI가 초래할 수 있는 잠재 위험까지 점검하려는 취지다.
LG유플러스는 자체 개발 통신 특화 AI 모델 ‘익시젠(ixi-GEN)’을 출품한다. 실제 이용자 환경에서 발생할 수 있는 위험 시나리오 대응 능력을 집중 점검한다는 계획이다.
대회는 180분 동안 라이브 방식으로 진행된다. 참가자들은 무작위 배정된 AI를 상대로 제한 시간 안에 최대한 많은 미션 성공을 노린다. 결과 평가는 심사위원 3명이 성공 횟수와 성공률을 기준으로 판단한다.
회사 측은 이번 참여를 통해 모델 안전성과 신뢰성을 객관적으로 확인하고, 발견된 취약점은 개선 작업에 반영할 방침이다. 해외 통신사와 전문가 교류를 통해 AI 보안 및 책임 있는 활용 논의도 확대한다는 전략이다.
LG유플러스 기술전략담당 이혜진은 “통신과 고객 서비스 전반에서 AI 활용이 빠르게 늘고 있다”며 “성능뿐 아니라 신뢰 검증 과정이 필수 단계”라고 밝혔다. 이어 “챌린지 경험을 바탕으로 이용자가 안심하고 사용할 수 있는 AI 서비스를 구축하겠다”고 말했다.
이번 참가 결정은 통신사 AI 경쟁이 성능 중심에서 신뢰성 중심으로 이동하고 있다는 흐름을 보여준다. 특히 프롬프트 공격 기반 검증은 실제 서비스 환경과 유사하다는 점에서 의미가 있다. 다만 평가가 심사위원 주관 판단에 의존하는 구조라는 점은 객관성 논란 가능성을 남긴다.
글로벌 통신 시장에서 AI 도입 속도가 빨라지는 상황에서 안전성 검증 결과가 향후 사업 신뢰도와 직결될 가능성이 크다. 국제 무대에서 어떤 평가를 받는지가 국내 AI 경쟁력 판단의 참고 지표가 될 전망이다.
Copyright ⓒ 스타트업엔 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.