ㅣ데일리포스트=곽민구 기자ㅣ비큐AI가 자체 구축한 CoT(Chain-of-Thought) 데이터셋을 활용해 오픈소스 7B 기반 모델을 파라미터 효율적 미세 조정(Parameter-Efficient Fine Tuning, PEFT) 방식으로 학습한 초경량 소형언어모델(sLLM) ‘RDP-N1’을 개발했다.
비큐AI 관계자는 “CoT 데이터는 수작업 구축이 어려워 로우데이터를 기반으로 질의응답과 추론 과정을 생성하고, 상용 고성능 LLM으로 자동 평가해 오답·모순을 제거하는 단계적 검증 체계를 적용했다”며 “이 과정을 통해 고신뢰 데이터만 선별해 학습에 활용했다”고 설명했다.
이어 “이번 개발은 모델 자체 제작보다, 고품질 CoT 데이터가 성능 향상에 미치는 효과를 검증하는 데 초점을 맞췄다”며 “동일한 원리로 더 큰 파라미터 모델에도 적용이 가능하다”고 덧붙였다.
뉴스픽의 주요 문장 추출 기술을 사용하여 “데일리 포스트” 기사 내용을 3줄로 요약한 결과입니다. 일부 누락된 내용이 있어 전반적인 이해를 위해서는 본문 전체 읽기를 권장합니다.