두나무가 국제전산언어학술대회인 '콜링2025' 콘퍼런스에서 텍스트-SQL 변환 관련 논문을 발표했다. /사진=두나무
이동준 두나무 머신러닝팀장은 이번 콘퍼런스에서 두나무가 개발한 텍스트-SQL 변환 모델의 연구 성과를 직접 발표했다.
논문의 제목은 'MCS-SQL: 텍스트-SQL 변환에서 다중 프롬프트와 다지선다를 활용하는 방법'(원문 논문명: MCS-SQL: Leveraging Multiple Prompts and Multiple-Choice Selection For Text-to-SQL Generation)'이다. LLM(대규모 언어 모델) 기반으로 텍스트-SQL 변환 성능을 향상하는 방법이 담겼다.
기존 LLM은 질문 방식이나 문장 배치순서 등에 따라 다른 답변을 내놓는 한계가 있다. 예를 들어 "A와 B는 같은 뜻인가요?"와 "B와 A는 같은 뜻인가요?"라는 질문에 서로 다른 답변을 내놓을 수 있다.
두나무 머신러닝팀은 이 같은 문제를 해결하고자 다중 프롬프트 기법을 도입, 여러 SQL 후보를 생성해 최적의 SQL을 선택하는 방법을 제안했다. 기존 LLM의 정확도와 효율성을 동시에 향상할 수 있다. 지난해 1월에는 텍스트-SQL 변환 측정 벤치마크인 BIRD-SQL 글로벌 리더보드에서 1위를 차지하는 등 우수성을 증명하기도 했다.
이 팀장은 "생성형 AI와 함께 주목받는 텍스트-SQL 변환 분야에 대한 기술적 도전이 세계적으로 인정 받아 기쁘다"며 "이번 연구가 AI의 실질적 활용성을 넓히는 데 조금이나마 보탬이 됐으면 좋겠다"고 전했다.
Copyright ⓒ 머니S 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.