AI 에이전트 기술이 확산되는 가운데, 실제 운영 환경에서 반복되는 오류의 원인을 체계적으로 분석한 국내 연구가 국제 학계에서 주목받고 있다.
이번 연구는 ‘AI 에이전트가 클라우드 장애 원인 분석에서 왜 반복적으로 실패하는가’를 주제로 진행됐다.
연구팀은 5개 대형 언어모델(LLM)을 대상으로 총 1,675회 실행, 약 13억 8,000만 토큰 규모의 실험을 수행했다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “스타트업엔” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.