AI검증

Geneformer 기반 질병 치료 표적 발굴 방법론

Geneformer는 대규모 단일 세포 전사체 데이터를 학습하여 복잡한 유전자 네트워크를 분석하는 파운데이션 모델입니다. 이 모델은 인실리코 섭동 분석을 통해 효율적으로 치료 표적을 발굴합니다. 관련 코드와 튜토리얼은 허깅페이스 모델 허브에서 제공합니다.

2026년 4월 23일

주장Geneformer는 대규모 단일 세포 전사체 데이터를 사전 학습하여 데이터가 부족한 환경에서도 질병 관련 유전자 네트워크를 효과적으로 분석합니다. 이 모델은 문맥 이해 능력을 갖추어 복잡한 생물학적 네트워크 내부의 교란을 식별하는 데 최적화되어 있습니다.

팩트Geneformer는 초기 3000만 개의 단일 세포 전사체 데이터를 학습했으며, 현재는 1억 개 이상의 데이터를 학습한 파운데이션 모델입니다. 이 모델은 양방향 트랜스포머 구조를 채택하여 유전자 간의 공변 패턴을 학습합니다.

팩트모델의 입력 데이터는 원시 유전자 발현 수치를 사전 학습된 어휘와 정렬된 순위 값 인코딩으로 토큰화하는 과정을 거칩니다. 이후 제로샷 추론, 미세 조정, 인실리코 섭동 분석을 통해 치료 표적을 발굴합니다.

팩트미세 조정 단계에서는 특정 세포 유형 내 질병 예측과 같은 단일 작업이나, 세포 유형과 질병 상태를 동시에 학습하는 다중 작업 학습을 수행합니다. 성능 평가는 혼동 행렬, 매크로 F1 점수, 임베딩 분석으로 진행합니다.

팩트인실리코 섭동 분석은 유전자 억제나 활성화를 시뮬레이션하여 세포 상태 임베딩의 변화를 정량화합니다. 연구자는 이를 통해 통계적 및 생물학적 지표를 바탕으로 후보 치료 표적의 우선순위를 결정합니다.

팩트모델의 효율성을 높이기 위해 양자화된 모델을 사용한 섭동 분석도 지원합니다. 이는 계산 자원이 제한된 환경에서도 연구자가 유전자 네트워크 역학을 분석하도록 돕습니다.

팩트전체 분석 파이프라인은 표준 그래픽 처리 장치 워크스테이션에서 2일 이내에 완료됩니다. 사용자는 파이썬에 대한 중간 수준의 지식만 있으면 해당 프로토콜을 수행할 수 있습니다.

교차검증Geneformer는 scGen, scGPT, scFoundation, GeneCompass, UCE, Nicheformer, scSimilarity, TranscriptFormer 등 기존 파운데이션 모델과 경쟁하거나 보완하는 관계입니다. 연구 목적과 데이터 규모에 따라 최적의 모델을 선택하여 적용해야 합니다.

팩트관련 코드와 상세 문서는 허깅페이스 모델 허브와 Geneformer 공식 문서 사이트에서 확인할 수 있습니다. 구글 코랩을 통해 실습 가능한 예제 데이터셋과 튜토리얼도 제공합니다.

출처네이처(Nature) 학술지 논문(https://www.nature.com/articles/s41596-026-01364-8) 및 허깅페이스 리포지토리(https://huggingface.co/ctheodoris/Geneformer)를 교차 검증했습니다. 추가 데이터셋은 구글 드라이브(https://drive.google.com/uc?id=1VeMkFrUy43xEJZzYaFw0t7aVZRpXF-Yt)에서 내려받을 수 있습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Algeria’s President Tebboune on UAE's withdrawal from OPEC: It is a non-event. Among the Arab countries, the main pillar in OPEC is the sisterly Kingdom of Saudi Arabia. End of discussion, and the book is closed... with them... It's finished.

21분 전

TELEGRAM · Clash Report

WATCH: German Chancellor Merz snapped at a terminally ill woman who challenged health cuts and political pay. A woman with stage IV cancer said: I’ve already sent you an invitation to my funeral… I can’t afford it. Why are cuts hitting us citizens… but not politicians? Merz, visibly irritated, shot back: At no point… was it ever considered to raise government salaries. I would be grateful if you would not repeat that unchecked.

21분 전

TELEGRAM · Clash Report

US Secretary of State Marco Rubio DJing at a wedding in Florida.

21분 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

AI 받아쓰기 앱 8종 기능 및 요금 정책 비교

AI23시간 전

유럽의 기술 주권 이끄는 유망 스타트업 21선 선정

경제23시간 전

미국 정치 양극화와 정보 환경의 위기

국제23시간 전

예멘 해안 유조선 유레카호 피랍 및 소말리아 이동

국제23시간 전

음성·폐 신호 통합 분석 하이브리드 AI 모델 개발

AI23시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

10시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

1일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

1일 전

meta-llama/llama-stackv0.8.0

v0.8.0

이번 릴리즈에서는 Anthropic Messages API를 네이티브로 지원하며, 대화 압축 기능이 추가되었습니다. 또한, 기존 Eval API 및 관련 API가 제거되었고, 문서 전반에 걸쳐 UX 개선 및 최적화가 이루어졌습니다. 보안 취약점 수정 및 CI/CD 파이프라인 개선 작업도 포함되었습니다.

1일 전

LangChainlangchain==1.3.0a1

langchain v1.3.0a1

이번 릴리즈에서는 `create_agent`에 `stream_events` 기능이 추가되었으며, HITL 미들웨어에 `respond` 결정 기능이 포함되었습니다. 또한, 에이전트 상태를 도구 디스패치에 인라인하는 것을 중단하여 성능을 개선했습니다.

1일 전

PAPERS

cs.AI

좋은 터미널 에이전트 벤치마크 과제란 무엇인가: 적대적이고 어렵고 명확한 평가 설계를 위한 가이드라인

3일 전

cs.CV

PRISM: 멀티모달 강화 학습을 위한 블랙박스 온폴리시 증류 기반 사전 정렬

3일 전