오픈에이아이, 의료진용 챗지피티 출시 및 임상 성능 입증
오픈에이아이가 의료진 전용 챗지피티를 새롭게 선보였습니다. 해당 모델은 임상 평가에서 인간 의사를 상회하는 성적을 기록하며 의료 현장의 주목을 받고 있습니다.
팩트오픈에이아이는 의료진을 위한 인공지능 서비스인 의료진용 챗지피티를 출시했습니다. 이번 모델은 임상 작업 수행 능력에서 인간 의사를 능가하는 결과를 보였습니다.
팩트오픈에이아이가 공개한 헬스벤치 프로페셔널 벤치마크 결과에 따르면, 지피티-5.4 모델은 59.0점을 기록했습니다. 동일한 테스트에서 인간 의사는 43.7점을 기록하며 인공지능보다 낮은 성적을 보였습니다.
팩트헬스벤치 프로페셔널은 상담, 문서 작성, 의학 연구라는 세 가지 영역을 측정합니다. 전체 예제 중 약 3분의 1은 의사들이 직접 모델의 약점을 찾으려 시도한 레드 티밍 과정을 통해 구성되었습니다.
팩트지피티-5.4 기반의 의료진용 챗지피티는 59.0점을 기록했으나, 기본 지피티-5.4 모델은 48.1점을 기록했습니다. 경쟁 모델인 클로드 오퍼스 4.7은 47.0점, 제미나이 3.1 프로는 43.8점, 그록 4.2는 36.1점을 각각 기록했습니다.
팩트오픈에이아이 헬스 부문의 카란 싱할은 출시 전 의사들이 6,924건의 대화를 테스트한 결과 99.6퍼센트의 응답이 안전하고 정확했다고 밝혔습니다. 355건의 사례에서 챗지피티는 인간 의사보다 더 자주 정확한 출처를 인용했습니다.
주장오픈에이아이는 이 도구가 의료진의 판단을 대체하기 위한 것이 아니라 임상 업무를 지원하기 위해 개발되었다고 설명합니다. 수백 명의 의료 자문단과 협력하여 임상 현장의 실질적인 필요를 반영했습니다.
팩트의료진용 챗지피티는 실시간 임상 검색, 반복적인 워크플로우를 위한 템플릿 기능, 미국 내 보수교육 학점 인정 기능을 제공합니다. 사용자의 대화 내용은 모델 학습에 사용되지 않으며, 필요시 히파 규정 준수를 위한 계약이 가능합니다.
교차검증이번 벤치마크는 오픈에이아이가 직접 설계하고 자사 모델을 테스트했다는 점에서 방법론적 한계가 존재합니다. 벤치마크 점수가 실제 임상 현장에서의 진료 능력과 반드시 일치하는 것은 아니라는 점을 고려해야 합니다.
교차검증현재 이 서비스는 미국 내 검증된 의사, 간호사, 약사 등에게만 무료로 제공됩니다. 오픈에이아이는 향후 국제적인 확장을 계획하고 있으며, 이를 위해 해외 파일럿 프로젝트를 진행하고 있습니다.
팩트미국 의사협회의 2026년 조사에 따르면 미국 의사의 72퍼센트가 임상 현장에서 인공지능을 사용하고 있습니다. 이는 전년도 48퍼센트에서 증가한 수치로, 의료 분야의 인공지능 도입이 가속화되는 추세입니다.
출처https://the-decoder.com/openai-says-its-new-chatgpt-for-clinicians-outperforms-doctors-on-clinical-tasks-even-when-they-have-unlimited-time-and-web-access/ 을 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.