RNA 3차원 구조 예측 모델 trRosettaRNA2 개발
연구진이 딥러닝 기반의 RNA 3차원 구조 예측 모델인 trRosettaRNA2를 개발했습니다. 이 모델은 기존 방식보다 적은 자원으로 높은 정확도를 보이며 구조 생물학 난제 해결에 기여합니다. 관련 소스 코드와 데이터는 오픈 소스로 공개되었습니다.
주장RNA의 3차원 구조와 형태를 예측하는 작업은 구조 생물학의 난제로 꼽힙니다. 실험 데이터가 부족하고 RNA 분자 자체가 유연한 성질을 지녔기 때문입니다.
팩트연구진은 이러한 한계를 극복하고자 딥러닝 기반의 엔드투엔드 모델인 trRosettaRNA2를 개발했습니다. 이 모델은 방대한 2차원 구조 데이터를 사전 학습하여 염기쌍 정보를 생성하는 모듈을 포함합니다.
팩트trRosettaRNA2는 보조 모듈인 trRNA2-SS를 통해 독립적인 RNA 2차원 구조 예측에서도 최고 수준의 성능을 달성했습니다. 해당 모듈은 3차원 구조 예측을 위한 핵심 사전 정보를 제공합니다.
팩트모델은 SS-aware 어텐션 메커니즘을 사용하여 RNA의 3차원 구조와 형태를 생성합니다. 여기서 형태는 분자의 유연성으로 인해 발생하는 서로 다른 공간적 배치를 의미합니다.
교차검증기존 RNA 3차원 구조 예측 방식과 비교할 때 trRosettaRNA2는 훨씬 적은 파라미터와 계산 자원을 사용합니다. 그럼에도 벤치마크 테스트에서 우수한 성능을 입증했습니다.
팩트연구진이 운영하는 양 서버(Yang-Server)는 CASP16 블라인드 테스트 RNA 구조 예측 부문에서 1위를 차지했습니다. 이 과정에서 알파폴드 3(AlphaFold 3)의 성능을 상회하는 결과를 기록했습니다.
팩트리보뉴클레아제 P(RNase P) RNA에 이 모델을 적용한 결과, 실험 데이터 없이도 구조적 이질성을 성공적으로 포착했습니다. 이는 RNA의 구조적 앙상블을 예측할 수 있는 잠재력을 보여줍니다.
팩트연구진은 아카이브 투(ArchiveII), 피디비 투디(PDB2D), 티에스 이십팔(TS28), 캐스프 십오(CASP15), 캐스프 십육(CASP16) 등 모든 벤치마크 데이터셋을 웹사이트에 공개했습니다.
팩트모델의 소스 코드는 깃허브(GitHub)와 제노도(Zenodo)를 통해 오픈 소스로 제공됩니다. 웹 서버 역시 연구진의 공식 홈페이지에서 누구나 접근할 수 있습니다.
출처네이처(Nature) 학술지 논문 및 양 랩(Yang Lab) 공식 홈페이지를 통해 위 내용을 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.