AI검증

챗GPT, 민감 대화 맥락 인식 및 안전 대응 기능 강화

오픈에이아이가 챗GPT의 대화 맥락 파악 능력을 개선해 위험 상황 대응력을 높였습니다. 정신 건강 전문가들과 협업하여 자살 및 타인 위해 방지 성능을 대폭 향상했습니다.

2026년 5월 15일

주장오픈에이아이(OpenAI)는 챗GPT가 민감한 대화 속 위험 신호를 정밀하게 인식하도록 시스템을 업데이트했습니다. 이번 개선은 단일 메시지 분석을 넘어 대화 전체의 맥락을 파악해 안전한 대응을 유도하는 데 목적이 있습니다.

팩트이번 업데이트는 자살, 자해, 타인에 대한 위해 등 급박한 위험 상황에 집중합니다. 모델은 대화 중 나타나는 미묘한 징후를 식별해 위험을 낮추거나 유해한 정보 제공을 거부합니다.

팩트오픈에이아이는 안전 요약(Safety Summaries) 기능을 도입해 이전 대화의 핵심적인 안전 관련 맥락을 기록합니다. 이 요약은 안전 추론을 위해 훈련된 모델이 생성하며, 제한된 시간 동안만 엄격하게 관리합니다.

교차검증안전 요약 기능은 일반적인 개인화나 장기 기억을 위한 도구가 아닙니다. 심각한 안전 문제가 발생할 가능성이 있는 경우에만 관련 맥락을 파악하는 용도로 사용합니다.

팩트오픈에이아이는 정신 건강 전문가들과 협업해 시스템 정책과 훈련 방식을 개선했습니다. 글로벌 의사 네트워크(Global Physicians Network) 소속 정신과 의사와 심리학자들이 위험 상황 판단 기준 수립에 참여했습니다.

팩트내부 평가 결과, 자살 및 자해 관련 시나리오에서 안전한 대응 성능이 50% 향상되었습니다. 타인에게 위해를 가하는 상황에 대한 대응 성능 또한 16% 개선되었습니다.

팩트최신 모델인 지피티-5.5 인스턴트(GPT-5.5 Instant)를 기준으로 테스트한 결과, 타인 위해 방지 성능은 52%, 자살 및 자해 방지 성능은 39% 증가했습니다. 이는 모델이 진화함에 따라 안전 기능도 함께 강화되고 있음을 의미합니다.

팩트생성된 안전 요약의 품질 평가에서 관련성 점수는 5점 만점에 4.93점을 기록했습니다. 사실성 점수는 4.34점으로 나타나 모델이 중요한 안전 맥락을 정확하게 포착하고 있음을 입증했습니다.

교차검증안전 맥락을 추가하는 과정이 일반적인 대화 품질을 저해하지 않는지 확인했습니다. 내부 테스트 결과, 일상적인 대화에서는 안전 요약 기능 유무에 따른 사용자 선호도 차이가 거의 없었습니다.

주장오픈에이아이는 앞으로 생물학적 위험이나 사이버 보안 등 다른 고위험 분야로 이 기술을 확장할 계획입니다. 인공지능이 시간이 지나며 드러나는 미묘한 위험 신호를 포착하는 것은 지속적인 기술적 과제입니다.

출처오픈에이아이 공식 웹사이트(https://openai.com/index/chatgpt-recognize-context-in-sensitive-conversations)를 교차 검증했습니다.

주제

OpenAI

관련 콘텐츠

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Ukrainian Foreign Minister Andrii Sybiha: Iran’s threats are unjustified and groundless. The regime in Teheran is a direct accomplice to Russian aggression against Ukraine, fuelling Moscow’s criminal war with weapons that have killed Ukrainians since 2022. Iran has no standing to pretend to be a victim, let alone justify its threats with absurd references to the UN Charter. With its statements, Iran also tries to shift attention away from Russia’s terror against civilian shipping in the Black Se

2시간 전

TELEGRAM · Clash Report

Germany's Chancellor Merz: I must say that, to this day, I still do not understand—though perhaps there are reasons I do not yet know—how a man who was under constant surveillance could approach the Christopher Street Day event unnoticed. My question is: could this have been prevented? That is not a rhetorical question; it is a serious one. And if the current legal framework is not sufficient to prevent such a situation, then we must consider changing the law. I simply cannot understand that

2시간 전

TELEGRAM · Clash Report

Germany's Chancellor Merz: We are thinking of and praying for the victim who lost their life, for their loved ones, and for those who were injured. They had all gathered on Saturday at a celebration of openness, diversity, and freedom. People celebrating peacefully were attacked by an Islamist who wanted to destroy these values.

2시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

루마니아의 러시아 드론 격추 및 외교적 항의

국제20시간 전

오픈에이아이의 허깅페이스 시스템 침해와 투명성 요구

AI20시간 전

런던 창업자 주거 공간 리프트 하우스의 새로운 생태계 모델

경제20시간 전

중국 AI 모델 확산에 따른 미국 내 기술 경쟁과 규제 논란

AI12시간 전

오픈 시큐어 AI 얼라이언스 출범과 보안 생태계 개방

AI6시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.26.0

v0.26.0 릴리즈

이번 릴리즈에서는 Inkling 모델 제품군 지원, DeepSeek-V4 성능 향상, fp32 `lm_head` 지원 추가, 유연한 어텐션 백엔드, KV 오프로딩 및 계층형 보조 스토리지 기능 강화 등 다양한 업데이트가 포함되었습니다. 또한 Rust 프론트엔드 기능 확장 및 Transformers 5.13.0 지원이 추가되었습니다.

2일 전

LangChainlangchain-anthropic==1.5.2

langchain-anthropic==1.5.2

Claude Opus 5 모델 지원이 추가되었습니다. 이번 릴리즈는 이전 버전인 langchain-anthropic==1.5.1 이후의 변경 사항을 포함합니다.

2일 전

Anthropicv0.120.0

v0.120.0

이번 릴리즈에서는 claude-opus-5 모델이 추가되었습니다. 또한, 도구 추가/제거 블록 및 tool_change 이벤트가 지원되며, 클라이언트 측 대체 크레딧 토큰 유형이 확장되고 서버 측 대체 기본 옵션이 추가되었습니다.

2일 전

LangChainlangchain-openai==1.4.1

langchain-openai==1.4.1

이번 릴리즈에서는 LangSmith 게이트웨이를 환경 변수를 통해 지원하도록 기능이 추가되었습니다. 또한 `gpt-5.3-chat-latest` 프로필이 수정되었습니다.