LLM 올인원 솔루션 기업 올거나이즈(대표 이창수)는 국내 최초로 LLM의 에이전트 역량을 평가하는 ‘All-in-One Benchmark(올인원 벤치마크)’를 공개한다고 3일 밝혔다.
에이전트 성능을 종합적으로 평가하는 데는 3가지 벤치마크가 활용된다.
올거나이즈는 올인원 벤치마크를 통해 최근 오픈소스로 공개된 딥시크의 ‘V3’ 에이전트 성능을 평가했으며, ‘GPT-4o mini’와 유사한 결과를 확인했다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “스타트업엔” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.