|
먼저, 두나무 머신러닝(ML)팀은 1월 아랍에미리트 아부다비에서 열린 국제전산언어학술대회 ‘콜링 2025(COLING 2025)’ 메인 콘퍼런스에서 텍스트-SQL 변환 관련 연구 논문을 발표했다. 콜링은 자연어 처리(NLP)와 전산언어학 분야에서 세계적으로 권위 있는 국제 학회로, 심사 기준이 엄격하다.
발표 논문 ‘MCS-SQL: 텍스트-SQL 변환에서 다중 프롬프트와 다지선다를 활용하는 방법(원문: MCS-SQL: Leveraging Multiple Prompts and Multiple-Choice Selection For Text-to-SQL Generation)’은 대규모 언어 모델(LLM) 기반 텍스트-SQL 변환 과정에서 발생하는 응답 비일관성 문제의 개선 방법을 제시했다. 다중 프롬프트를 활용해 여러 SQL 후보를 생성한 뒤 최적의 결과를 선택하는 방식으로, 정확도와 효율성을 동시에 높였다. 해당 모델은 텍스트-SQL 변환 벤치마크인 BIRD-SQL 글로벌 리더보드 1위를 기록하며 기술적 우수성을 입증한 바 있다.
이와 함께 두나무 ML팀은 지난 7월 이탈리아 파도바에서 열린 정보검색 분야 최고 권위 국제 학회 ‘SIGIR 2025(The 48th International ACM SIGIR Conference on Research and Development in Information Retrieval)’에서도 연구 성과를 발표했다. SIGIR는 올해 제출된 논문 중 약 27%만 채택될 정도로 경쟁이 치열한 학회로 꼽힌다.
SIGIR에서 발표한 논문 ‘LLM 기반 사용자 시뮬레이터: 실제 사용자 상호작용 없이 뉴스 추천 모델을 학습하기 위한 방법론(원문: LLM as User Simulator: Towards Training News Recommender without Real User Interactions)’은 실제 사용자 데이터 없이 LLM을 활용해 가상의 이용자를 생성하고 추천 모델을 학습하는 방식을 제안했다. 두나무 ML팀이 개발한 ‘LAUS(LLM As User Simulator)’ 프레임워크는 대규모 사용자 데이터 수집의 부담과 개인정보 보호 이슈를 동시에 해결한 점이 특징이다. 실험 결과 LAUS는 학습 데이터 없이 뉴스를 추천하는 제로샷(zero-shot) 방식 대비 우수한 성능을 보였으며, 응답 지연 시간도 단축했다.
두나무는 연구 성과를 넘어 실제 서비스에도 AI 기술 적용을 확대했다. 업비트 개발자센터는 전면 개편을 통해 AI 기반 ‘업비트 어시스턴트’를 선보였다. 이 서비스는 개발자센터 문서를 학습해 API 예시 제공, 문서 요약, 가이드 탐색 등을 지원하며 개발 편의성을 높였다. GPT, 클로드 등 주요 AI 도구에서 최신 업비트 API 문서를 활용할 수 있도록 llms.txt 포맷을 제공하고, 과거 시세 데이터를 다운로드할 수 있는 ‘Upbit Historical Market Data’ 서비스를 추가해 데이터 기반 개발 환경도 강화했다.
두나무의 투자정보 플랫폼 증권플러스 역시 AI 기능을 고도화했다. 최근 신설된 ‘뉴스룸’ 탭은 두나무가 자체 개발한 머신러닝 알고리즘을 활용해 뉴스의 중요도와 시장 영향력을 종합 분석하고 투자 판단에 필요한 정보를 우선순위로 배치한다. ‘속보’ 섹션에서는 헤드라인과 3줄 요약으로 핵심 내용을 빠르게 전달하고, ‘주요 뉴스’ 섹션에서는 하루 중 가장 영향력이 컸던 ‘24시간 핵심 뉴스 TOP5’를 선별해 제공한다. 각 뉴스에는 연관 종목명과 시세 변동률이 함께 표시돼 투자자들의 정보 활용도를 높였다.
이동준 두나무 ML팀장은 “올해 축적한 AI 연구 성과와 서비스 적용 경험을 바탕으로 내년에도 기술 경쟁력을 지속 강화해 사용자에게 더욱 신뢰할 수 있는 서비스를 제공하겠다”고 밝혔다.
Copyright ⓒ 이데일리 무단 전재 및 재배포 금지
