AI검증

AI 모델, 정보 부족 시 질문 대신 무작위 추측한다

다중 모달 언어 모델은 시각 정보가 불완전할 때 도움을 요청하기보다 무작위로 추측하거나 환각 현상을 보입니다. 연구진은 모델의 능동적 정보 요청 능력을 개선하기 위해 강화 학습을 활용한 대안을 제시했습니다.

2026년 4월 11일

주장다중 모달 언어 모델은 시각 정보가 불완전한 상황에서 사용자에게 도움을 요청하기보다 무작위로 추측하거나 환각 현상을 일으킵니다. 이는 인공지능이 자신의 지식 한계를 인지하고 능동적으로 정보를 요구하는 능력이 부족함을 나타냅니다.

팩트연구진은 22개의 다중 모달 모델을 대상으로 '프로액티브벤치(ProactiveBench)'를 통해 성능을 측정했습니다. 해당 벤치마크는 1만 8,000개의 샘플과 10만 8,000개의 이미지를 포함하며, 인간의 입력 없이는 해결이 불가능한 시나리오로 구성했습니다.

팩트일반적인 환경에서 79.8%의 정확도를 보였던 모델들은 정보가 가려진 환경에서 정확도가 60% 이상 하락했습니다. 특히 '알오디(ROD)' 데이터셋에서는 물체가 가려져 있을 때 정확도가 98.3%에서 8.2%로 급감했습니다.

교차검증모델의 규모가 크다고 해서 반드시 더 나은 질문을 하는 것은 아닙니다. 오히려 작은 모델이 큰 모델보다 높은 성능을 보이기도 하며, 이는 모델의 규모보다 학습 방식과 구조가 성능을 결정하는 핵심 요소임을 시사합니다.

팩트일부 모델은 능동적으로 질문하는 것처럼 행동했으나, 무의미한 선택지를 제시했을 때도 이를 선택했습니다. 이는 모델이 상황을 이해하고 질문하는 것이 아니라, 단순히 추측의 범위를 넓힌 것에 불과합니다.

교차검증프롬프트에 힌트를 제공하거나 대화 기록을 활용하는 방식도 근본적인 해결책이 되지 못합니다. 대화 기록을 활용하면 모델이 이전의 행동을 단순히 모방하여 오히려 성능이 저하되는 현상이 발생합니다.

주장강화 학습의 일종인 '그룹 상대 정책 최적화(GRPO)'를 적용하면 모델이 언제 도움을 요청해야 하는지 학습할 수 있습니다. 보상 함수를 정교하게 설계하여 정답을 맞히는 것과 적절한 질문을 하는 것 사이의 균형을 맞추는 작업이 필요합니다.

팩트훈련을 마친 모델들은 기존 22개 모델의 성능을 모두 상회하는 결과를 보였습니다. 다만 보상 체계를 잘못 설정할 경우 모델이 무분별하게 도움을 요청하는 등 성능이 급격히 하락하는 부작용도 확인했습니다.

교차검증스탠퍼드 대학의 최근 연구에 따르면, 인공지능 모델은 이미지가 제공되지 않아도 시각 정보를 설명하거나 진단을 내리는 '신기루 효과'를 보입니다. 이는 모델이 자신의 지식 한계를 인지하지 못하고 과도한 자신감을 보이는 고질적인 문제입니다.

출처더 디코더(The Decoder)의 보도와 프로액티브벤치 연구 보고서를 교차 검증했습니다. 본 내용은 인공지능 모델의 환각 현상과 능동적 정보 요청 능력에 관한 기술적 분석을 담고 있습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Greek Foreign Minister George Gerapetritis: The Greek economy is truly a success story within the European Union.

11분 전

TELEGRAM · Clash Report

German Foreign Minister Wadephul: Germany fully supports the American negotiating position. There is no justification for Iran blocking the Strait of Hormuz. It must reopen it.

11분 전

TELEGRAM · Clash Report

Greece's Foreign Minister George Gerapetritis on Türkiye's Eurofighter fighter jet purchase: Greece cannot demand from any country how it will operate on issues that have to do with the procurement of their defense systems. However, what we consider to be absolutely necessary is to ensure that these systems, for which procurement is made to third countries, will not be utilized against an allied country.

11분 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

리눅스 제로데이 취약점 'Copy Fail' 공개…"루트 권한 획득까지 가능, 즉각 조치해야"

AI7시간 전

인도 마니푸르주 민족 갈등 3주년 대규모 시위 발생

국제12시간 전

TDK 벤처스의 AI 인프라 투자 전략과 물리적 AI 전망

경제5시간 전

생성형 AI 시대의 핵심 경쟁력인 문제 정의

마케팅5시간 전

하버드 연구진의 응급실 AI 진단 정확도 검증 결과

AI21시간 전

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-anthropic==1.4.3

langchain-anthropic==1.4.3

이번 릴리즈에서는 Anthropic 관련 기능이 1.4.3 버전으로 업데이트되었습니다. 또한, `create_agent`로의 이전 경고 대상 재지정 및 기타 내부 정리 작업이 포함되었습니다. 문서의 X 핸들 참조 업데이트와 Anthropic 관련 HTTPX 최종 처리기 보호 기능도 개선되었습니다.

23시간 전

LangChainlangchain-classic==1.0.5

langchain-classic==1.0.5

langchain-classic 1.0.5 릴리즈에서는 `create_agent`로의 마이그레이션을 위한 경고 메시지 수정 및 기타 정리 작업이 포함되었습니다. 또한, 일부 의존성 버전이 업데이트되었으며, 코어 라이브러리의 최소 버전이 상향 조정되었습니다.

23시간 전

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

1일 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

2일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

2일 전

PAPERS

cs.LG

AdaMeZO: 모멘텀 유지 없이 LLM 파인튜닝을 수행하는 Adam 스타일의 0차 최적화 기법

3일 전

cs.CL

A11y-Compressor: 시각적 맥락 재구성 및 중복 제거를 통한 GUI 에이전트 관찰 효율성 향상 프레임워크

3일 전

cs.LG

대규모 모바일 네트워크의 비지도 이상 탐지를 위한 확장 가능한 맥락 인식 그래프 어텐션

3일 전

cs.AI