"돌발 상황서 올바른 판단 내린다" AI 강화학습 기법 개발
뒤로가기

3줄 요약

본문전체읽기

"돌발 상황서 올바른 판단 내린다" AI 강화학습 기법 개발

뉴시스 보도에 따르면, 울산과학기술원(UNIST)은 인공지능대학원 윤성환 교수팀이 환경 변화에도 성능 저하 없이 안정적으로 작동하는 강화학습 기법을 개발해 세계 3대 인공지능 학회인 ICLR의 구두 발표 논문으로 채택됐다고 21일 밝혔다.

연구팀은 누적 보상의 민감도를 낮추는 학습법을 제안했다.

실제 로봇의 마찰 조건이나 무게 등 물리적 요소를 변화시킨 상황에서, 새롭게 제안된 학습 기법은 평균 보상 유지율이 80~90%에 달하며 높은 수준의 안정성과 강인함을 입증했다.

뉴스픽의 주요 문장 추출 기술을 사용하여 “모두서치” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.

이 콘텐츠를 공유하세요.

알림 문구가 한줄로 들어가는 영역입니다

이 콘텐츠를 공유하세요.