AI 성능, 한국식으로 따진다···LLM 수학·장문 이해까지 평가
뒤로가기

3줄 요약

본문전체읽기

AI 성능, 한국식으로 따진다···LLM 수학·장문 이해까지 평가

독자 개발 인공지능 모델 성능을 객관적으로 검증할 수 있는 데이터셋 구축이 추진, 한국형 평가 기준 정립과 연구개발 경쟁력이 강화될 전망이다.

과기정통부는 총 24억원(과제별 8억원)을 투입해 △LLM 수학 풀이 능력 평가(수학) △한국형 지식 평가용 질의·정답 및 추론 데이터(지식) △장문 문맥 기반 성능평가(장문 이해) 등 3개 분야의 데이터셋을 우선 구축한다.

참여를 원하는 기관은 초거대 AI, 자연어처리, 멀티모달 AI 등 대규모 데이터셋 기반 기술 역량을 갖춘 기업·기관이 컨소시엄에 포함돼야 한다.

뉴스픽의 주요 문장 추출 기술을 사용하여 “이뉴스투데이” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.

이 콘텐츠를 공유하세요.

알림 문구가 한줄로 들어가는 영역입니다

이 콘텐츠를 공유하세요.