한국과학기술원(KAIST)은 김현욱 생명화학공학과 교수 연구팀이 바이오 경로 이미지에서 유전자와 대사물질 정보를 자동 추출하는 ‘바이오 경로 정보 추출 프레임워크(EBPI)’를 개발했다고 28일 밝혔다.
|
EBPI는 문헌에서 추출한 이미지 속의 화살표와 글자를 인식하고, 바이오 경로를 편집 가능한 표 형태로 재구성한다. 객체 감지 모델 등의 기계학습을 사용해 경로 이미지 내 화살표의 위치와 방향을 감지하고, 이미지 속 텍스트를 유전자, 단백질, 대사물질로 분류한다. 추출된 정보는 통합해 경로 정보를 표 형식으로 제공한다.
연구팀은 7만 4853편의 논문에서 추출한 바이오 경로 이미지와 기존 수작업으로 작성된 경로 지도를 비교해 EBPI 성능을 검증했다. 그 결과, 높은 정확도로 바이오 경로 정보가 추출됐음을 확인했다.
또 EBPI를 사용해 대표적인 바이오 경로 데이터베이스에 포함되지 않은 생화학 반응 정보도 대량의 문헌 내 바이오 경로 이미지로부터 추출하는 데에도 성공했다.
김현욱 교수는 “EBPI는 대규모 문헌 데이터 분석에서 중요한 도구가 될 수 있다”며 “생명공학, 대사공학, 합성생물학 분야에서 바이오 경로 이미지를 AI로 분석해 관련 연구의 실험 설계와 분석 시 유용하게 활용될 수 있다”고 말했다.
연구결과는 대사공학·합성생물학 분야 국제학술지 ‘대사공학(Metabolic Engineering)’ 11월호에 게재됐다.
Copyright ⓒ 이데일리 무단 전재 및 재배포 금지
본 콘텐츠는 뉴스픽 파트너스에서 공유된 콘텐츠입니다.
지금 쿠팡 방문하고
2시간동안 광고 제거하기!