챗GPT, 민감 대화 맥락 인식 및 안전 대응 기능 강화
오픈에이아이가 챗GPT의 대화 맥락 파악 능력을 개선해 위험 상황 대응력을 높였습니다. 정신 건강 전문가들과 협업하여 자살 및 타인 위해 방지 성능을 대폭 향상했습니다.
주장오픈에이아이(OpenAI)는 챗GPT가 민감한 대화 속 위험 신호를 정밀하게 인식하도록 시스템을 업데이트했습니다. 이번 개선은 단일 메시지 분석을 넘어 대화 전체의 맥락을 파악해 안전한 대응을 유도하는 데 목적이 있습니다.
팩트이번 업데이트는 자살, 자해, 타인에 대한 위해 등 급박한 위험 상황에 집중합니다. 모델은 대화 중 나타나는 미묘한 징후를 식별해 위험을 낮추거나 유해한 정보 제공을 거부합니다.
팩트오픈에이아이는 안전 요약(Safety Summaries) 기능을 도입해 이전 대화의 핵심적인 안전 관련 맥락을 기록합니다. 이 요약은 안전 추론을 위해 훈련된 모델이 생성하며, 제한된 시간 동안만 엄격하게 관리합니다.
교차검증안전 요약 기능은 일반적인 개인화나 장기 기억을 위한 도구가 아닙니다. 심각한 안전 문제가 발생할 가능성이 있는 경우에만 관련 맥락을 파악하는 용도로 사용합니다.
팩트오픈에이아이는 정신 건강 전문가들과 협업해 시스템 정책과 훈련 방식을 개선했습니다. 글로벌 의사 네트워크(Global Physicians Network) 소속 정신과 의사와 심리학자들이 위험 상황 판단 기준 수립에 참여했습니다.
팩트내부 평가 결과, 자살 및 자해 관련 시나리오에서 안전한 대응 성능이 50% 향상되었습니다. 타인에게 위해를 가하는 상황에 대한 대응 성능 또한 16% 개선되었습니다.
팩트최신 모델인 지피티-5.5 인스턴트(GPT-5.5 Instant)를 기준으로 테스트한 결과, 타인 위해 방지 성능은 52%, 자살 및 자해 방지 성능은 39% 증가했습니다. 이는 모델이 진화함에 따라 안전 기능도 함께 강화되고 있음을 의미합니다.
팩트생성된 안전 요약의 품질 평가에서 관련성 점수는 5점 만점에 4.93점을 기록했습니다. 사실성 점수는 4.34점으로 나타나 모델이 중요한 안전 맥락을 정확하게 포착하고 있음을 입증했습니다.
교차검증안전 맥락을 추가하는 과정이 일반적인 대화 품질을 저해하지 않는지 확인했습니다. 내부 테스트 결과, 일상적인 대화에서는 안전 요약 기능 유무에 따른 사용자 선호도 차이가 거의 없었습니다.
주장오픈에이아이는 앞으로 생물학적 위험이나 사이버 보안 등 다른 고위험 분야로 이 기술을 확장할 계획입니다. 인공지능이 시간이 지나며 드러나는 미묘한 위험 신호를 포착하는 것은 지속적인 기술적 과제입니다.
출처오픈에이아이 공식 웹사이트(https://openai.com/index/chatgpt-recognize-context-in-sensitive-conversations)를 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.