|
한은은 이날 포럼에서 2022년부터 실험적 통계로 편제·발표하고 있는 NSI의 활용도와 신뢰도를 높이기 위해 소규모 언어 모델(Small Language Model)을 이용하는 방안을 제시했다.
챗GPT 등의 생성형 AI 챗봇의 기반이 되는 대규모 언어 모델(LLM)은 방대한 자료로 학습해 활용 범위가 넓지만 비용이 많이 든다. 이에 비해 소규모 언어 모델(SLM)은 특정 영역에 특화돼 빠르게 작동해 비용 효율성이 높다.
기존에는 매일 1만개의 문장을 랜덤으로 뽑아 문장 단위의 감성을 분석해 지수를 산출했다. 이 경우 1만개의 문장의 기사 전체의 대표성을 갖는지에 대한 의구심과 문당 단위에선 중립 비율이 높게 나타나는 문제 등이 있었다.
김소정 한은 통계연구팀 과장은 “SML을 활용해 기사 단위로 경제 정보 포함 여부와 서술시점 분류, 감성분석 등을 효율적으로 처리할 수 있다”며 “학습 데이터 추가와 발전된 SML 모델 교체 등 지속적인 성능 개선도 용이하다”고 설명했다.
또 한은은 국민계정 통계의 새로운 국제기준인 2025 국민계정체계(SNA) 이행의 일환으로 머신러닝 기법을 활용해 한국의 데이터 생산액을 시산한 결과도 공유했다. 온라인 채용정보를 바탕으로 직업 내에서 데이터생산에 직접적으로 기여하는 경제 활동 비중을 추산했다.
이밖에도 한은과 통계학회는 AI와 빅데이터를 기반으로 데이터 분석 및 통계 작성에 대한 방법론을 확장한 연구 결과들을 공유하고 향후 도전 과제 등을 모색했다.
유상대 한은 부총재는 이날 환영사를 통해 “최근 들어 AI 발전 속도가 더욱 가속화되면서 다양한 분야에서 AI의 활용이 확산되고 있다”며 “오늘 발표와 토론에서 제시될 다양한 연구성과와 아이디어들이 학계와 정책 현장에서 널리 활용되어, 우리 경제를 이해하고 대응하는 데 큰 도움이 되기를 바란다”고 말했다.
Copyright ⓒ 이데일리 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.
