유전자 섭동 예측 딥러닝 모델 TxPert 개발
연구진이 세포 전사체 변화를 예측하는 딥러닝 모델 TxPert를 개발했습니다. 이 모델은 다중 지식 그래프를 활용해 신약 개발의 효율성을 높입니다. 기존 모델의 한계를 극복하고 실험적 재현성에 근접한 성능을 보입니다.
주장TxPert는 유전자 섭동이 세포에 미치는 전사체 변화를 예측하기 위해 설계된 새로운 딥러닝 모델입니다. 이 모델은 다중 지식 그래프를 통합하여 생물학적 복잡성을 반영하며 미관찰 조건에서도 높은 예측 성능을 보입니다.
주장신약 개발 과정에서 모든 유전자 섭동을 실험으로 검증하는 작업은 비용과 시간 측면에서 한계가 있습니다. TxPert는 컴퓨터 시뮬레이션을 통해 표적화된 실험을 지원하며 신약 개발 성공률을 높이는 데 기여합니다.
팩트TxPert는 기존 모델 대비 미관찰 단일 섭동 예측에서 피어슨 상관계수를 8%에서 25%까지 향상했습니다. 또한 이 모델은 이중 유전자 섭동 및 세포주 간 교차 예측에서도 경쟁력 있는 성능을 입증했습니다.
팩트연구진은 생물학적 데이터베이스와 고처리량 섭동 스크리닝 데이터를 결합한 다중 지식 그래프를 활용했습니다. 서로 다른 지식 그래프는 상호 보완적인 정보를 제공하며 예측 정확도를 극대화합니다.
교차검증기존 딥러닝 모델은 전사체 섭동 예측 분야에서 단순 평균값 모델보다 낮은 성능을 보이는 사례가 많았습니다. TxPert는 데이터셋별 최적화 없이도 범용적으로 작동하도록 설계하여 이러한 한계를 극복합니다.
팩트실험 데이터의 배치 효과와 교란 변수를 해결하기 위해 배치 매칭 대조군 방식을 도입했습니다. 연구진은 배치 간 상관관계가 낮음을 확인하고 이를 모델 학습 및 평가 과정에 엄격하게 반영했습니다.
팩트연구진은 배치와 섭동 식별자 간의 연관성을 확인했습니다. 카이제곱 검정 결과 모든 데이터셋에서 배치와 섭동 간의 혼재 가능성이 통계적으로 유의미한 수준으로 나타났습니다.
교차검증필수 유전자의 섭동 시 나타나는 일반적인 세포 스트레스 반응은 예측 모델의 성능을 왜곡할 수 있습니다. 이러한 시스템적 효과를 고려하지 않으면 모델 성능이 과대평가될 위험이 존재합니다.
팩트TxPert는 단일 세포주 내 미관찰 섭동 예측에서 실험적 재현성 수준에 근접하는 성능을 달성했습니다. 이는 전사체 섭동 생물학 분야에서 딥러닝 모델의 실질적인 활용 가능성을 제시합니다.
출처https://www.nature.com/articles/s41587-026-03113-4를 교차 검증했습니다. 본 내용은 네이처 바이오테크놀로지에 게재된 TxPert 연구 논문을 바탕으로 작성했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.