AI미검

오픈에이아이, 의료진용 챗지피티 출시 및 임상 성능 입증

오픈에이아이가 의료진 전용 챗지피티를 새롭게 선보였습니다. 해당 모델은 임상 평가에서 인간 의사를 상회하는 성적을 기록하며 의료 현장의 주목을 받고 있습니다.

2026년 4월 23일

팩트오픈에이아이는 의료진을 위한 인공지능 서비스인 의료진용 챗지피티를 출시했습니다. 이번 모델은 임상 작업 수행 능력에서 인간 의사를 능가하는 결과를 보였습니다.

팩트오픈에이아이가 공개한 헬스벤치 프로페셔널 벤치마크 결과에 따르면, 지피티-5.4 모델은 59.0점을 기록했습니다. 동일한 테스트에서 인간 의사는 43.7점을 기록하며 인공지능보다 낮은 성적을 보였습니다.

팩트헬스벤치 프로페셔널은 상담, 문서 작성, 의학 연구라는 세 가지 영역을 측정합니다. 전체 예제 중 약 3분의 1은 의사들이 직접 모델의 약점을 찾으려 시도한 레드 티밍 과정을 통해 구성되었습니다.

팩트지피티-5.4 기반의 의료진용 챗지피티는 59.0점을 기록했으나, 기본 지피티-5.4 모델은 48.1점을 기록했습니다. 경쟁 모델인 클로드 오퍼스 4.7은 47.0점, 제미나이 3.1 프로는 43.8점, 그록 4.2는 36.1점을 각각 기록했습니다.

팩트오픈에이아이 헬스 부문의 카란 싱할은 출시 전 의사들이 6,924건의 대화를 테스트한 결과 99.6퍼센트의 응답이 안전하고 정확했다고 밝혔습니다. 355건의 사례에서 챗지피티는 인간 의사보다 더 자주 정확한 출처를 인용했습니다.

주장오픈에이아이는 이 도구가 의료진의 판단을 대체하기 위한 것이 아니라 임상 업무를 지원하기 위해 개발되었다고 설명합니다. 수백 명의 의료 자문단과 협력하여 임상 현장의 실질적인 필요를 반영했습니다.

팩트의료진용 챗지피티는 실시간 임상 검색, 반복적인 워크플로우를 위한 템플릿 기능, 미국 내 보수교육 학점 인정 기능을 제공합니다. 사용자의 대화 내용은 모델 학습에 사용되지 않으며, 필요시 히파 규정 준수를 위한 계약이 가능합니다.

교차검증이번 벤치마크는 오픈에이아이가 직접 설계하고 자사 모델을 테스트했다는 점에서 방법론적 한계가 존재합니다. 벤치마크 점수가 실제 임상 현장에서의 진료 능력과 반드시 일치하는 것은 아니라는 점을 고려해야 합니다.

교차검증현재 이 서비스는 미국 내 검증된 의사, 간호사, 약사 등에게만 무료로 제공됩니다. 오픈에이아이는 향후 국제적인 확장을 계획하고 있으며, 이를 위해 해외 파일럿 프로젝트를 진행하고 있습니다.

팩트미국 의사협회의 2026년 조사에 따르면 미국 의사의 72퍼센트가 임상 현장에서 인공지능을 사용하고 있습니다. 이는 전년도 48퍼센트에서 증가한 수치로, 의료 분야의 인공지능 도입이 가속화되는 추세입니다.

출처https://the-decoder.com/openai-says-its-new-chatgpt-for-clinicians-outperforms-doctors-on-clinical-tasks-even-when-they-have-unlimited-time-and-web-access/ 을 교차 검증했습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Iranian President Masoud Pezeshkian: The United States has only one concern: that we do not possess a nuclear bomb. This is something that the late Leader repeatedly stated as well—that we do not want a nuclear bomb. The Americans said, “Just put that in writing and sign it,” and we signed it.

3시간 전

TELEGRAM · Clash Report

Russian-installed authorities in Crimea have suspended fuel sales to the public and businesses following a major Ukrainian drone attack. Fuel supplies are now restricted to government agencies providing essential and security services. Officials said the attacks disrupted key supply routes, caused power outages in several areas, halted ferry traffic across the Kerch Strait, and temporarily closed the bridge connecting Crimea to Russia. Source: Reuters

3시간 전

TELEGRAM · Clash Report

Iran's Fars: The Strait of Hormuz remains closed, and the IRGC Navy is not issuing any vessel transit permits until further notice.

3시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

콘텐츠 마케팅 성장을 저해하는 과거 프레임워크 탈피

마케팅21시간 전

시그널 메러디스 휘태커 대표의 인공지능 챗봇 위험성 경고

AI15시간 전

샘 올트먼의 AI 확장성 회의론 비판과 기술적 성취

AI3시간 전

인 더 웨이츠: AI 모델 기반 인물 인지도 측정 서비스

AI15시간 전

존 점퍼 노벨상 수상자의 앤스로픽 합류와 인공지능 인재 이동

AI21시간 전

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain==1.3.10

langchain==1.3.10

langchain 1.3.10 릴리즈에서는 cryptography, aiohttp, pyjwt 라이브러리 버전이 업데이트되었습니다. 또한, 요약 형식 변경 및 특정 스냅샷에 대한 프로바이더 전략 감지 기능이 수정되었습니다. README 설치 및 리소스 문서도 갱신되었습니다.

2일 전

LangChainlangchain-core==1.4.8

langchain-core==1.4.8

이번 릴리즈에서는 Python 3.10 미만 버전에 대한 코드가 제거되었으며, `BaseTool.tool_call_schema` 및 `model_json_schema`에 대한 성능 개선이 이루어졌습니다. 또한, v3 스트리밍 이벤트에서 사용 토큰 세부 정보가 보존되고, 명시적 역직렬화 허용 목록에 대한 테스트가 업데이트되었습니다.

2일 전

Anthropicv0.111.0

v0.111.0

이번 릴리즈에서는 refusal-fallback 미들웨어 요청에 fallback-refusal-middleware 태그를 추가하는 기능이 포함되었습니다. 자세한 변경 사항은 전체 변경 로그를 참조하시기 바랍니다.

2일 전

Anthropicv0.110.0

v0.110.0

이번 릴리즈에서는 새로운 code_execution_20260120 도구에 대한 지원이 추가되었습니다. 또한, 헤더 병합 시 x-stainless-helper가 덮어쓰이는 대신 추가되도록 수정되었으며, 스트림 이벤트 유형이 보존되도록 개선되었습니다.

2일 전

OpenAIv2.43.0

v2.43.0

OpenAI Python 라이브러리가 v2.43.0 버전으로 업데이트되었습니다. 이번 릴리즈에서는 API 관련 변경 사항으로 OpenAPI 사양 또는 Stainless 설정을 업데이트했습니다.