AI미검

'CLAUDE.md' 파일, 성능을 더 하락시킨다?

스위스 취리히 연방 공과대학교 연구진이 코딩 에이전트의 작업 성공률에 'AGENTS.md' 등 컨텍스트 파일이 미치는 영향을 분석했습니다. LLM이 생성한 컨텍스트 파일은 모델 성능을 저하하고 추론 비용을 20% 이상 증가시키는 것으로 나타났습니다. 개발자가 직접 작성한 파일도 성능 향상폭이 미미해 사용 시 최소한의 요구사항만 담아야 한다고 했습니다.

2026년 3월 25일

팩트코딩 에이전트를 특정 목적에 맞추기 위해 컨텍스트 파일을 제공하는 관행이 널리 퍼져 있습니다. 연구진은 기존 'SWE-BENCH LITE'와 실제 깃허브 이슈를 기반으로 새롭게 구축한 'AGENTBENCH'를 활용해 이를 평가했습니다.

주장연구에 따르면, 개발자가 제공한 md 파일은 파일이 없을 때보다 평균 4%의 미미한 성능 향상을 보였습니다. 반면 LLM이 생성한 md 파일(컨텍스트 파일)은 에이전트의 성능을 평균 3% 감소시켰습니다.

주장컨텍스트 파일이 주어지면 에이전트는 테스트와 탐색 범위를 넓혀 작업 단계를 증가시킵니다. 이는 평균 20% 이상의 불필요한 추론 비용 상승을 초래합니다.

주장컨텍스트 파일 내부의 추가 지시를 처리하기 위해 더 많은 추론 토큰을 소비하므로 작업 난이도가 높아집니다. 에이전트 개발사의 권장 사항과 달리 LLM 생성 파일은 생략하는 것이 유리합니다.

주장연구는 인간이 작성하는 컨텍스트 파일은 도구 사용법 등 최소한의 필수 요건만 명시해야 한다고 주장합니다. LLM이 생성한 파일은 기존 문서 내용과 중복되는 경향이 강합니다.

주장기존 문서를 모두 제거한 통제 환경에서만 LLM 생성 파일이 성능을 2.7% 향상시켰습니다. 이는 잘 알려지지 않은 저장소에 문서가 전혀 없을 때만 파일이 제한적으로 유용함을 시사합니다.

교차검증에이전트가 지시를 무시해서 성능이 저하되는 것은 아닙니다. 에이전트는 컨텍스트 파일에 언급된 도구를 실제로 더 많이 사용합니다.

교차검증그러나 저장소 구조를 파악하는 용도로는 컨텍스트 파일이 효과적이지 않습니다. 파일이 존재해도 에이전트가 관련 파일을 찾는 데 걸리는 탐색 단계 수는 유의미하게 줄어들지 않습니다.

교차검증해당 연구는 주로 파이썬 언어 환경에 집중했습니다. 파이썬은 모델 훈련 데이터에 풍부하게 포함되어 있어 컨텍스트 파일이 주는 추가 정보의 효과가 무효화되었을 가능성이 있습니다. 훈련 데이터 비중이 낮은 비주류 프로그래밍 언어나 도구 체인에서는 다른 결과가 나타날 여지가 있습니다.

출처Thibaud Gloaguen, Niels Mündler, Mark Müller, Veselin Raychev, Martin Vechev. (2026). Evaluating AGENTS.md: Are Repository-Level Context Files Helpful for Coding Agents? arXiv:2602.11988v1.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Israel continues to bomb Lebanon despite the statements Trump and Vance made yesterday.

4시간 전

TELEGRAM · Clash Report

Vance Cancels Switzerland Trip, US-Iran Talks Called Off Planned US-Iran technical talks in Switzerland were called off after VP Vance cancelled his trip as Israel carried out strikes in Lebanon, killing 15. READ MORE

4시간 전

TELEGRAM · Clash Report

NEW: Iran has requested assurances that hostilities in Lebanon will end, in line with the existing agreement, before resuming talks with the US in Switzerland.

4시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

의료용 거대언어모델의 데이터 암기 현상과 환자 정보 유출 위험

AI9시간 전

오픈에이아이, 기업공개 앞둔 핵심 인재 영입 전략

AI18시간 전

구글 검색의 진화: 개인화된 정보 제공 시스템으로의 전환

마케팅22시간 전

뇌-컴퓨터 인터페이스(BCI) 임상 시험의 급격한 증가와 기술적 도약

AI3시간 전

구글 딥마인드, AI 에이전트 보안 로드맵 공개

AI23시간 전

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain==1.3.10

langchain==1.3.10

langchain 1.3.10 릴리즈에서는 cryptography, aiohttp, pyjwt 라이브러리 버전이 업데이트되었습니다. 또한, 요약 형식 변경 및 특정 스냅샷에 대한 프로바이더 전략 감지 기능이 수정되었습니다. README 설치 및 리소스 문서도 갱신되었습니다.

19시간 전

LangChainlangchain-core==1.4.8

langchain-core==1.4.8

이번 릴리즈에서는 Python 3.10 미만 버전에 대한 코드가 제거되었으며, `BaseTool.tool_call_schema` 및 `model_json_schema`에 대한 성능 개선이 이루어졌습니다. 또한, v3 스트리밍 이벤트에서 사용 토큰 세부 정보가 보존되고, 명시적 역직렬화 허용 목록에 대한 테스트가 업데이트되었습니다.

19시간 전

Anthropicv0.111.0

v0.111.0

이번 릴리즈에서는 refusal-fallback 미들웨어 요청에 fallback-refusal-middleware 태그를 추가하는 기능이 포함되었습니다. 자세한 변경 사항은 전체 변경 로그를 참조하시기 바랍니다.

21시간 전

Anthropicv0.110.0

v0.110.0

이번 릴리즈에서는 새로운 code_execution_20260120 도구에 대한 지원이 추가되었습니다. 또한, 헤더 병합 시 x-stainless-helper가 덮어쓰이는 대신 추가되도록 수정되었으며, 스트림 이벤트 유형이 보존되도록 개선되었습니다.

21시간 전

OpenAIv2.43.0

v2.43.0

OpenAI Python 라이브러리가 v2.43.0 버전으로 업데이트되었습니다. 이번 릴리즈에서는 API 관련 변경 사항으로 OpenAPI 사양 또는 Stainless 설정을 업데이트했습니다.