광주과학기술원(GIST, 총장 임기철)은 AI융합학과 대학원생들로 구성된 ‘네 번째 레슨(4thLesson)’ 팀(석사과정 김경보·권은주·김유진·박상연 학생, 지도교수 김경중)이 세계 최고 권위의 인공지능(AI) 학회 ‘뉴립스(NeurIPS)’가 주관한 국제 AI 대회 ‘2025 포케에이전트 챌린지(PokeAgent Challenge)’에서 ‘대전(배틀링) 트랙: 포켓몬 1세대 규칙 부문(Gen 1 OU)’ 준우승을 차지했다고 밝혔다.
예선과 본선은 모두 온라인으로 진행됐으며, 최종 결과는 12월 7일 미국 캘리포니아주 샌디에이고에서 열린 ‘뉴립스(NeurIPS) 2025 컨퍼런스’에서 발표됐다. ‘포케에이전트 챌린지(PokeAgent Challenge)’는 포켓몬 게임의 배틀 방식(포켓몬 선택, 기술 사용, 교체 전략 등)을 그대로 구현한 환경에서 AI끼리 대결을 시키며, AI가 불확실한 상황에서 얼마나 똑똑하게 판단하고 전략을 세우는지를 평가하는 국제 대회다.
참가 팀들은 제한된 데이터와 계산 자원 안에서 자가 대전(Self-play)과 데이터 확장 전략을 활용해 모델을 학습시키고, 포켓몬 게임의 버전에 따라 달라지는 포켓몬 종류·기술·능력치 구조를 반영한 규칙(Gen 1 OU, Gen 9 OU)에 맞춰 다양한 전략을 실험한다.
대회는 배틀링(Battling)과 스피드러닝(Speedrunning) 두 트랙으로 구성되며, 특히 배틀링 트랙은 상대 전략 예측, 장기 계획, 불완전 정보 대응 능력 등 AI의 종합적인 실력을 평가하는 핵심 종목이다.
GIST ‘네 번째 레슨’ 팀은 한정된 자원 속에서도 성능을 극대화하기 위해, 이미 기본적인 능력을 학습해 둔 AI 모델을 출발점으로 삼아 필요한 부분만 추가로 학습시키는 미세 조정(Fine-tuning) 전략을 선택했다. 학습이 더 안정적으로 이뤄지도록 하기 위해 기존 방식 대신 AI가 스스로 더 효율적으로 배울 수 있게 돕는 ‘크론(Kron) 옵티마이저’라는 새로운 학습 기법을 도입했다.
또한, 시간이 지날수록 새로운 정보를 잘 익히지 못하는 ‘가소성 상실’ 문제가 생기지 않도록 AID 기술을 적용해 학습 능력을 지속적으로 유지하도록 했다.
‘네 번째 레슨’ 팀의 가장 큰 강점은 데이터를 스스로 확장하는 능력이다. 약 19만 개의 기본 데이터세트만으로는 전략을 충분히 학습시키기 어렵다고 판단하고, 규모가 다른 19종의 AI 모델을 서로 반복해서 겨루게 하는 자체 실험 환경(로컬 래더 셋업)을 구축해 대량의 추가 학습 데이터를 직접 만들어 냈다.
이를 통해 약 135만 개의 고품질 추가 데이터를 확보하며 모델의 전략적 완성도를 크게 높였다. 이번 성과는 단순히 게임 AI의 승률 향상을 넘어, 데이터가 적거나 불확실성이 높은 상황에서도 강화학습(AI가 시행착오를 통해 스스로 배우는 방식)이 효과적으로 작동하게 하는 방법론을 제시했다는 점에서 의미가 크다.
김경중 지도교수는 “학생들이 한정된 자원 속에서도 창의적 전략과 치밀한 실험 설계를 바탕으로 국제적인 성과를 이뤄냈다”며, “이번 준우승은 GIST AI융합학과의 연구·교육 수준이 세계적으로도 경쟁력을 갖추고 있음을 보여주는 결과”라고 말했다.
이어 “강화학습의 한계를 보완하기 위한 새로운 최적화 알고리즘과 활성화 기법을 과감하게 적용한 시도가 결실을 맺었다”며, “앞으로도 학생들의 도전적 연구를 적극 지원하겠다”고 밝혔다.
김경보 학생은 “김경중 교수님의 열정적인 지도와 AI융합학과의 지원 덕분에 제한된 자원에서도 AI 모델을 효율적으로 최적화할 수 있는 기술적 가능성을 확인했다”며, “앞으로 이번 기술을 실제 산업 문제 해결에도 적용할 수 있도록 계속 연구하겠다”고 소감을 전했다.
Copyright ⓒ AI포스트 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.