이에 대응해 LG CNS는 금융사들이 내부 환경에 적합한 모델을 사전에 검증할 수 있도록 지원하는 ‘금융 LLM 평가 도구’를 개발했다.
평가도구 개발에 참여한 강민수 선임은 “딥시크는 모델 크기와 무관하게 주요 항목에서 점수가 낮았고, 전체 리더보드에서도 하위권에 그쳤다”고 밝혔다.
강민수 AI센터 어드밴스드 젠AI랩 선임이 금융 맞춤형 거대언어모델(LLM) 평가도구를 소개하고 있다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “이데일리” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.