오픈AI 'GeneBench-Pro' 공개…최강 AI도 문제 3분의 1만 풀어
뒤로가기

3줄 요약

본문전체읽기

오픈AI 'GeneBench-Pro' 공개…최강 AI도 문제 3분의 1만 풀어

이 벤치마크는 129개 문제로 구성됐다.

두 수치 모두 129개 문제 중 3분의 1을 밑도는 수준이다.

공개 방식과 앞으로의 검증 오픈AI는 독립적인 평가를 유도하기 위해 대표 문제 10개를 허깅페이스(Hugging Face)에 오픈소스로 공개했다.

뉴스픽의 주요 문장 추출 기술을 사용하여 “위키트리” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.

이 콘텐츠를 공유하세요.

알림 문구가 한줄로 들어가는 영역입니다

이 콘텐츠를 공유하세요.