[이뉴스투데이 이승준 기자] KAIST는 산업및시스템공학과 박찬영 교수 연구팀이 한국화학연구원과 공동연구를 통해 물질 내의 중요한 하부 구조를 탐지해 두 물질의 상호작용에 의해 발생하는 물리적 성질 예측의 높은 정확도를 달성할 수 있는 새로운 그래프 신경망 기법을 개발했다고 18일 밝혔다.
기존 연구에서는 두 분자 쌍이 있을 때, 각 분자 내 존재하는 원자들 사이의 상호 작용만을 고려해 그래프 신경망 모델을 학습하였다. 예를 들어 특정 발색체의 물(H2O)에 대한 용해도를 예측하고자 할 때 발색체 내 각 원자들에 대해 물 분자의 원자들이 갖는 영향력을 고려하는 것이다.
이에 반해 연구팀이 착안한 점은 분자 구조의 화학적 특성을 결정하는 데 원자뿐만 아니라 작용기와 같은 분자 내 하부 구조들이 중요한 역할을 한다는 점이었다. 이를테면 알코올·포도당과 같이 하이드록실기를 포함하는 분자들은 일반적으로 물에 대한 용해도가 높은 것으로 알려져 있다. 즉 하이드록실기라는 작용기가 물에 대한 용해도를 결정하는 데 중요한 역할을 한다는 것이다.
연구팀은 분자의 특성을 결정하는 데 큰 영향을 끼치는 하부 구조를 추론하는 기술을 분자내의 중요한 정보를 최대한 압축해 보존하는 ‘정보 병목 이론’과 분자 내의 어떤 하부 구조가 분자의 고유한 특성을 결정 짓는데 큰 역할을 했는지 대한 인과 관계를 추론하는 ‘인과 추론 모형’을 활용해 개발했다.
이를 통해 분자의 고유한 특성에 가장 큰 영향을 미치는 하부 구조를 찾아냈다. 또 분자 간 관계를 추론하는 문제에서는 상대방 분자에 따라 대상 분자의 중요한 하부 구조가 달라질 수 있다는 점을 착안해 물질 간 관계를 예측하는 모델을 제안했다.
이번 새로운 그래프 신경망 기법을 의학에 적용해 정보 병목 현상을 기반으로 한 연구는 기존 연구에 비해 약물 용해도 예측에서 11%의 성능 향상, 다중약물요법 부작용 예측에서 4%의 정확도 향상을 이뤄냈다. 또 인과 추론 모형을 기반으로 한 연구는 약물 용해도 예측에서 17%의 성능 향상, 약물 부작용 예측에서 2%의 정확도 향상을 이뤄냈다.
연구팀은 정보 병목 이론을 기반으로 중요한 하부 구조를 탐지해 분자 구조 관계의 높은 예측 정확도를 달성할 수 있는 그래프 신경망 모델을 개발해 기계학습 분야 최고권위 국제학술대회 ‘국제 기계 학습 학회(ICML 2023)’에서 올 7월 발표할 예정이다.
또 인과 추론 모형을 기반으로 중요한 하부 구조를 탐지해 분포 변화에도 모델의 성능이 강건하게 유지되는 그래프 신경망 모델을 개발해 데이터마이닝 최고권위 국제학술 대회 ‘국제 데이터 마이닝 학회(KDD 2023)’에서 올 8월에 발표할 예정이다.
두 연구 모두 KAIST 산업및시스템공학과 대학원에 재학 중인 이남경 박사과정 학생이 제1 저자, 화학연구원의 나경석 연구원이 공동 저자, KAIST 산업및시스템공학과의 박찬영 교수가 교신저자로 참여했다.
두 연구의 제1 저자인 이남경 박사과정은 “제안한 기술은 분자의 성질을 결정하는 데 큰 영향을 미치는 하부 구조가 존재한다는 화학적 지식에 기반해 그래프 신경망을 학습할 수 있는 새로운 방법”이라면서 “상대편 분자를 고려해 대상 분자의 중요한 구조를 찾는 방법론은 이미지-텍스트 멀티 모달 학습 방법에서도 적용될 수 있어 심층 학습 전반적인 성능 개선에 기여할 수 있다”라고 밝혔다.
연구팀을 지도한 박 교수도 “제안한 기술은 화학적 지식에 기반해 분자 간의 관계를 예측해 화학과 생명과학을 포함한 다양한 분야에서 기계학습이 새로운 물질의 발견에 드는 시간·비용을 획기적으로 단축하는 데 도움이 될 것”이라고 말했다.
한편 이번 연구는 정보통신기획평가원의 지원을 받은 사람중심 인공지능 핵심원천기술개발 사업과 한국화학연구원 기본사업의 지원을 받아 수행됐다.
Copyright ⓒ 이뉴스투데이 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.
지금 쿠팡 방문하고
2시간동안 광고 제거하기!