국제 학술지 미국화학회지 게재, 신소재 발굴 시간 단축 기대

개발된 소재 합성 가능성 예측 모델 모식도
개발된 소재 합성 가능성 예측 모델 모식도

KAIST는 생명화학공학과 정유성 교수 연구팀이 딥러닝을 활용해 소재의 합성 가능성을 높은 정확도로 예측하는 기술을 개발했다고 22일 밝혔다.

신소재 설계의 궁극적인 목표는 소재를 설계하고 그것을 실험적으로 합성하는 것이지만 현실적으로는 새롭게 설계된 대부분의 소재가 실제 합성 단계에서 성공하지 못하고 버려지는 경우가 많다.

이는 불필요한 시간과 자원의 낭비를 초래한다. 소재의 합성 여부는 반응 조건, 열역학, 반응 속도, 소재 구조 등 다양한 요인에 의해서 결정되기 때문에 소재의 합성 가능성을 예측하는 것은 매우 도전적인 과제로 여겨져 왔다.

이런 문제 해결을 위한 방안으로 간단한 열역학적 안정성만을 고려해 고체 소재의 합성 가능성을 추정하지만 정확도는 매우 떨어지는 편이다.

일례로 에너지적으로 안정된 물질이라 하더라도 합성이 안 되는 경우가 아주 빈번하고, 또 반대로 준안정(metastable) 상태의 물질들도 합성되는 경우가 많기 때문이다.

따라서, 합성 가능성에 대한 예측 정확도를 획기적으로 높일 수 있는 방법론의 개발이 시급한 과제로 여겨져 왔다.

개발된 소재 합성 가능성 예측 알고리즘 모식도. 무기화합물의 구조정보를 그래프 형태로 인코딩하여 학습하는 예측모델을 구축하고, 기존의 소재 데이터베이스를 학습하여 이를 바탕으로 새로운 결정구조를 입력하면 0~1 사이로 합성 가능성에 대한 점수를 매길 수 있다.
개발된 소재 합성 가능성 예측 알고리즘 모식도. 무기화합물의 구조정보를 그래프 형태로 인코딩해 학습하는 예측모델을 구축하고, 기존 소재 데이터베이스를 학습해 이를 바탕으로 새로운 결정구조를 입력하면 0~1 사이로 합성 가능성에 대한 점수를 매길 수 있다.

연구팀이 개발한 소재 합성 가능성 예측기술은 기존 합성이 보고된 고체 소재들의 구조적 유사성을 그래프 합성 곱 신경망(GCN)으로 학습해 새로운 소재의 합성 가능성을 예측할 수 있다.

특히 현재까지 합성이 안 된 물질이라 하더라도 합성이 성공할 가능성은 여전히 존재하기 때문에 참값(레이블)을 이미 알고 학습을 진행하는 일반적인 지도학습과는 달리 양의 레이블(+)을 가진 데이터와 레이블이 없는 데이터(Positive-Unlabeled, P-U)를 이용한 분류 모델 기반의 준 지도학습을 사용했다.

연구팀은 5만여 종에 달하는 이미 합성이 보고된 물질과 8만여 종의 가상 물질(hypothetical materials)로 이뤄진 `머터리얼스 프로젝트(MP)'라는 소재 관련 데이터베이스를 이용해 모델을 구축했다.

연구팀 관계자는 이 신기술을 활용한 결과, 소재들의 합성 가능성을 약 87% 정확하게 예측할 수 있다고 설명했다.

정 교수팀은 또 이미 합성된 소재들의 열역학적 특성을 분석한 결과, 열역학적 안정성만으로는 실제 소재의 합성 가능성을 예측할 수 없다는 사실도 알아냈다.

이와 함께 머터리얼스 프로젝트(MP) 데이터베이스 내에 합성 가능성 점수가 가장 높은 100개의 가상 물질에 대해 문헌조사를 실시한 결과, 이들 중 머터리얼스 프로젝트(MP) 데이터베이스에는 합성 여부가 아직 알려지지 않았지만 실제로 합성돼 논문에 보고된 소재만도 71개에 달하는 것을 확인했고 이를 통해 모델의 높은 정확도를 추가로 입증했다.

정유성 교수는 "빠른 신소재 발견을 위해 다양한 소재 설계 프레임워크가 존재하지만 정작 설계된 소재의 합성 가능성에 관한 판단은 전문가 직관의 영역으로 남아 있다ˮ면서 "이번에 개발한 합성 가능성 예측 모델은 새로운 소재를 설계할 때 실제로 합성 가능성을 실험 전에 미리 판단할 수 있어 새로운 소재의 개발시간을 단축하는 데 큰 도움이 될 것ˮ이라고 말했다.

이번 연구결과는 미국화학회가 발행하는 국제학술지 미국화학회지(Journal of the American Chemical Society) 온라인 10월 26일 字에 실렸다.

저작권자 © 테크데일리(TechDaily) 무단전재 및 재배포 금지