AI미검

"지어내지 마"라고 하면 AI가 더 틀리는 이유

"지어내지 마"라고 요구할수록 AI의 답변이 더 부정확해질 수 있다는 연구 결과가 나왔다. 정답이 문서 안에 있어도 AI가 확신하지 못하면 답변을 포기했다. 연구진은 이를 안전해지기 위해 정확성을 희생하는 Safety Tax라고 설명한다.

2026년 1월 7일

팩트연구진은 긴 글을 준비한 뒤 여러 사실을 문서 곳곳에 흩어 놓고 AI에게 "지어내지 마"라는 조건을 붙인 경우와 붙이지 않은 경우를 비교했습니다. 환각 방지 프롬프트는 없는 내용을 만들어내는 비율을 줄였습니다. 그러나 AI가 스스로 확신하지 못하면 정답이 문서에 있어도 "모르겠다"고 답했습니다. 특히 긴 문서일수록 이 현상이 심해졌습니다. 연구진은 이를 Safety Tax라고 설명합니다.

팩트모델이 입력을 받을 수 있는 길이와 실제로 활용하는 길이는 달랐습니다. 광고되는 최대 컨텍스트와 실제 활용 가능 길이는 다르고, 문서 중간에 위치한 정보는 무시되는 경향이 강하며, 정보가 조밀하거나 특정 구간에 몰리면 성능이 급락했습니다. 같은 조건에서도 모델 간 차이는 컸습니다. Gemini, DeepSeek 계열은 비교적 안정적인 반면 ChatGPT-5-mini, Claude는 특정 조건에서 급격히 붕괴하는 모습을 보였습니다.

주장AI는 자료를 많이 준다고 똑똑해지지 않았습니다. "지어내지 마"는 만능 해결책이 아닙니다. 문서를 통째로 붙여 넣고 틀리면 안 된다고 말하는 방식은 생각보다 위험합니다. 긴 문서는 나눠서 입력하고, 중요한 정보는 앞쪽에 명확히 써야 합니다. AI는 정리된 자료에서 더 정확해집니다.

교차검증프롬프트보다 모델 아키텍처 차이가 더 큰 영향을 미쳤습니다. 본 논문은 arXiv 사전공개(preprint) 상태로 동료심사를 거치지 않았습니다. 해석과 결론에는 오류 가능성이 있습니다.

출처Ebrahimzadeh, A., Salili, S. M. (2026). Not All Needles Are Found: How Fact Distribution and "Don't Make It Up" Prompts Shape LLM Reliability. arXiv. https://arxiv.org/abs/2601.02023

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

글로벌 인텔리전스

전체보기 →

SCMP

Why Hong Kong subsidies should go towards food, not fuel — Hong Kong should not renew the HK$3 per litre diesel subsidy when it expires at the end of June. Instead, it should use the funds to launch a crash programme to accelerate electrification of public transport, starting with the minibus fleet. The crisis in the Middle East has had a serious impact on

58분 전

SCMP

Gaza flotilla activists detained by Israel face ‘extreme brutality’ — Two foreign activists from a Gaza-bound flotilla who were brought to Israel for interrogation appeared before an Israeli court on Sunday, according to the rights group defending them. The flotilla of more than 50 vessels had set sail from France, Spain and Italy with the aim of breaking an Israeli b

58분 전

SCMP

60% of Hong Kong’s homeless plan to cut medical visits amid higher fees: survey — Nearly 60 per cent of homeless residents in Hong Kong plan to reduce medical visits in response to higher public medical fees introduced this year, a non-governmental organisation survey has found, with advocates urging authorities to introduce automatic waivers and simplify subsidy application proc

58분 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

AI 받아쓰기 앱 8종 기능 및 요금 정책 비교

AI15시간 전

예멘 해안 유조선 유레카호 피랍 및 소말리아 이동

국제15시간 전

미국 정치 양극화와 정보 환경의 위기

국제15시간 전

유럽의 기술 주권 이끄는 유망 스타트업 21선 선정

경제15시간 전

음성·폐 신호 통합 분석 하이브리드 AI 모델 개발

AI15시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

2시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

1일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

1일 전

meta-llama/llama-stackv0.8.0

v0.8.0

이번 릴리즈에서는 Anthropic Messages API를 네이티브로 지원하며, 대화 압축 기능이 추가되었습니다. 또한, 기존 Eval API 및 관련 API가 제거되었고, 문서 전반에 걸쳐 UX 개선 및 최적화가 이루어졌습니다. 보안 취약점 수정 및 CI/CD 파이프라인 개선 작업도 포함되었습니다.

1일 전

LangChainlangchain==1.3.0a1

langchain v1.3.0a1

이번 릴리즈에서는 `create_agent`에 `stream_events` 기능이 추가되었으며, HITL 미들웨어에 `respond` 결정 기능이 포함되었습니다. 또한, 에이전트 상태를 도구 디스패치에 인라인하는 것을 중단하여 성능을 개선했습니다.

1일 전

PAPERS

cs.AI

좋은 터미널 에이전트 벤치마크 과제란 무엇인가: 적대적이고 어렵고 명확한 평가 설계를 위한 가이드라인

3일 전

cs.CV

PRISM: 멀티모달 강화 학습을 위한 블랙박스 온폴리시 증류 기반 사전 정렬

3일 전