감마프로테오박테리아 조절 서열 해독 모델 PromoterAtlas 개발
임페리얼 칼리지 런던 연구팀이 감마프로테오박테리아의 유전자 조절 서열을 해석하는 트랜스포머 기반 모델인 프로모터아틀라스를 개발했습니다. 이 모델은 3371종의 데이터를 학습해 전사 및 번역 수준을 정밀하게 예측합니다.
주장프로모터아틀라스(PromoterAtlas)는 기존 박테리아 프로모터 예측 모델이 가진 데이터 부족과 종 특이적 학습의 한계를 극복했습니다. 이 모델은 트랜스포머(Transformer) 아키텍처를 도입해 포괄적인 주석 프레임워크를 제공합니다.
팩트프로모터아틀라스는 180만 개의 파라미터를 갖춘 인공지능 모델입니다. 연구진은 3371종의 감마프로테오박테리아에서 추출한 900만 개의 조절 서열을 학습 데이터로 활용했습니다.
팩트학습을 마친 모델은 리보솜 결합 부위와 박테리아 프로모터, 전사 인자 결합 부위 및 종결자를 인식합니다. 연구진은 이를 바탕으로 감마프로테오박테리아 전장 유전체 프로모터 주석 도구를 구현했습니다.
팩트모델이 생성한 임베딩은 종 특이적 서열 특징보다 시그마 인자 정체성에 따라 프로모터를 군집화합니다. 이는 모델이 종 간의 진화적 관계를 효과적으로 반영한다는 사실을 입증합니다.
팩트프로모터아틀라스는 전사 및 번역 수준을 예측할 수 있는 조절 서열 정보를 인코딩합니다. 해당 정보는 유전자 발현 조절 기전을 이해하는 핵심 데이터를 제공합니다.
교차검증기존의 이진 분류 방식은 복잡한 조절 서열을 해석하는 데 한계가 뚜렷했습니다. 프로모터아틀라스는 단일 목적 모델에서 벗어나 다목적 주석 프레임워크로 전환했다는 차별점을 가집니다.
주장이번 연구는 박테리아 생물학과 합성 생물학, 비교 유전체학 분야에서 조절 서열을 설계하는 능력을 향상합니다. 이는 미생물 공학의 효율성을 높이는 핵심 역할을 수행합니다.
팩트이번 연구는 임페리얼 칼리지 런던의 루카스 코펜스와 로드리고 레데스마-아마로 연구팀이 수행했습니다. 연구 결과는 2026년 5월 15일 네이처 커뮤니케이션즈(Nature Communications)에 게재되었습니다.
팩트연구 자금은 영국 생명공학 및 생물과학 연구위원회(BBSRC)의 미생물 식품 공학 생물학 허브와 베조스 지속 가능한 단백질 센터가 지원했습니다. 저자들은 이해 상충이 없음을 명시했습니다.
출처해당 연구는 네이처 커뮤니케이션즈(https://www.nature.com/articles/s41467-026-72837-3)를 통해 교차 검증했습니다. 본 연구는 크리에이티브 커먼즈 저작자 표시 4.0 국제 라이선스에 따라 공개되었습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.