오픈에이아이, 무료 챗지피티 건강 답변 성능 개선
오픈에이아이가 자사 무료 모델의 건강 관련 답변 정확도를 높였습니다. 자체 평가 결과 이전 모델 대비 오류율이 71퍼센트 감소했습니다. 의사 패널 평가에서도 높은 점수를 기록했습니다.
주장오픈에이아이는 무료 챗지피티(ChatGPT)의 기본 모델인 지피티-5.5 인스턴트(GPT-5.5 Instant)가 건강 관련 질문에서 최상위 사고 모델과 유사한 성능을 보인다고 평가합니다. 이는 자체 건강 평가 지표를 통해 확인한 결과입니다.
팩트지피티-5.5 인스턴트는 헬스벤치(HealthBench) 및 임상용 평가인 헬스벤치 프로페셔널(HealthBench Professional)에서 이전 모델인 지피티-5.3 인스턴트보다 높은 점수를 기록했습니다.
팩트실제 서비스 트래픽을 분석한 결과, 건강 관련 답변의 사실 오류 발생률이 지난 두 달 동안 71퍼센트 감소했습니다.
팩트오픈에이아이는 3,500개의 응답을 대상으로 의사 패널 평가를 진행했습니다. 평가 결과, 지피티-5.5 인스턴트의 답변이 정확성, 의사소통, 완전성 측면에서 의사가 작성한 답변보다 높은 평가를 받았습니다.
교차검증이번 평가 결과는 모두 오픈에이아이 내부에서 수행했습니다. 외부 기관의 독립적인 검증을 거치지 않았기에 기업이 제시한 수치를 객관적인 외부 데이터로 간주하기에는 한계가 있습니다.
팩트오픈에이아이는 전 세계 60개국, 260명 이상의 의사 네트워크와 협력합니다. 이들은 현재까지 70만 건 이상의 예시 응답을 검토하며 모델의 학습과 평가를 지원했습니다.
팩트매주 2억3000만 명 이상의 사용자가 챗지피티를 통해 건강 및 웰니스 관련 질문을 합니다. 이는 챗지피티의 가장 흔한 사용 사례 중 하나입니다.
주장건강 정보는 인공지능이 생성하는 답변 중 가장 높은 수준의 정밀함과 신뢰도가 요구되는 분야입니다. 오픈에이아이의 이번 업데이트는 위험 관리와 성능 개선을 동시에 겨냥합니다.
교차검증건강 관련 질문이 챗지피티 무료 버전으로 이동함에 따라 사용자가 외부 의료 웹사이트를 방문하지 않는 제로 클릭(Zero-click) 현상이 심화될 가능성이 큽니다. 이는 의료 정보 제공자에게 트래픽 감소라는 실질적인 위협이 됩니다.
팩트오픈에이아이는 챗지피티 내 광고 도입을 테스트합니다. 건강, 정신 건강, 정치와 관련된 대화에는 광고를 노출하지 않겠다고 명시했습니다.
주장민감한 분야에 대한 이러한 정책은 기업의 보호 조치로 해석됩니다. 사용자의 안전을 최우선으로 고려하겠다는 의지를 보입니다.
출처서치 엔진 저널(Search Engine Journal)의 보도를 통해 해당 내용을 교차 검증했습니다. 자세한 사항은 오픈에이아이 공식 블로그 및 기술 문서를 참조하십시오.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

