[이뉴스투데이 고선호 기자] 광주과학기술원(GIST)은 AI대학원 이현주 교수 연구팀이 단일세포 RNA 시퀀싱 기술의 근본적인 한계를 극복할 수 있는 자기 지도 학습(self-supervised learning) 방법론을 개발했다고 25일 밝혔다.
연구팀은 단일세포 RNA 시퀀싱 데이터에 적합한 대조 학습 방법론을 활용해 단 5% 미만의 유전자 정보만을 가지고도 각 단일세포의 보편적인 특징부터 세부적인 특징까지도 파악할 수 있는 기술, ‘scRobust’를 개발했다.
이를 통해 이전 방법론에서 활용되지 않았던 90%의 유전자 정보까지 사용할 수 있게 돼 세포 종류에 대한 예측 성능이 향상되었을 뿐만 아니라 동일한 세포 내에서도 더욱 정밀한 분석이 가능해졌다.
이 기술은 하나의 세포로부터 다양한 유전자 조합을 만들어 여러 개의 세포 표현 벡터(cell representation vector)를 생성할 수 있는 방법론을 기반으로 단일세포 RNA 시퀀싱 데이터에 적합한 데이터 증강(data augmentation)을 하는 것이다.
대조 학습을 통해 AI 모델을 학습시키면, 서로 다른 유전자 조합으로 생성된 세포 표현 벡터라도 같은 세포에서 나온 것인지, 다른 세포에서 나온 것인지 구분할 수 있으며, 이 과정을 통해 다양한 유전자 조합으로 만든 세포 표현 벡터(local cell representation vector)들이 하나의 통일된 세포 표현 벡터(global cell representation vector)로 수렴하게 된다.
결과적으로 소수의 유전자만 사용하더라도 모든 유전자를 활용한 것과 유사한 세포 표현 벡터를 얻을 수 있어 전체 유전자를 사용하는 효과를 기대할 수 있다.
이현주 교수는 “이번 연구에서 개발된 알고리즘은 AI 모델이 유전자 일부만 학습하는 것이 아니라 모든 유전자에 대해 학습하는 것이 가능하다”면서 “이를 통해 그동안 소수의 세포에서만 발현되는 유전자와 같은 세포 유형에서 발생하는 미세한 특징들까지도 비교, 분석할 수 있게 되었다”고 설명했다.
이번 연구는 정보통신기획평가원(IITP)의 지원을 받았으며, 생물정보학 분야 JCR 상위 4% 국제학술지 ‘Briefings in Bioinformatics’에 지난 16일자 게재됐다.
Copyright ⓒ 이뉴스투데이 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.