AI검증

AI 에이전트의 핵심 기술인 코드와 하니스 구조

인공지능 에이전트가 추론하고 행동하는 본질은 코드와 이를 뒷받침하는 하니스 환경에 있습니다. 연구진은 모델 성능을 넘어 소프트웨어 인프라가 에이전트의 경쟁력을 결정한다고 분석합니다.

2026년 5월 29일

주장일리노이 대학교 어바나-샴페인과 메타, 스탠퍼드 연구진은 인공지능(AI) 에이전트의 본질이 코드에 있다고 분석합니다. 코드는 에이전트가 추론하고 행동하며 협업하는 기초가 됩니다.

팩트연구진은 모델을 둘러싼 소프트웨어 계층을 하니스(Harness)라고 정의합니다. 하니스는 도구, 인터페이스, 샌드박스 환경, 메모리, 실행 루프 등을 포함하여 모델이 연속적인 작업을 수행하도록 돕습니다.

팩트코드는 실행 가능하고 추적 가능하며 지속성을 가집니다. 모델의 출력물이 실제 연산으로 이어지고, 중간 계산 과정이 기록되어 에이전트가 작업을 이어갑니다.

팩트에이전트 시스템은 모델의 능력과 인프라, 그리고 에이전트가 즉석에서 생성하는 코드로 구성됩니다. 특히 에이전트가 스스로 생성하는 테스트 스크립트나 도구에 대한 연구가 중요해집니다.

주장하니스는 모델과 환경을 연결하는 가교 역할을 합니다. 프로그램 오브 소츠(Program-of-Thoughts)나 체인 오브 코드(Chain of Code) 같은 방법론은 언어적 묘사 대신 실행 가능한 프로그램으로 연산을 수행합니다.

팩트클로드 코드(Claude Code), 오픈에이아이(OpenAI)의 코덱스(Codex), 깃허브 코파일럿(GitHub Copilot) 등 상용 제품은 이미 하니스 원리를 따릅니다. 이들은 로컬 터미널과 개발 환경을 통합하여 에이전트가 파일을 수정하고 명령을 실행하게 합니다.

교차검증연구진은 현재의 소프트웨어 테스트가 불완전할 수 있다고 경고합니다. 테스트 통과가 곧 안전을 의미하지 않으며, 잘못된 신뢰를 줄 위험이 있으므로 투명한 평가 메커니즘이 필요합니다.

팩트딥시크(Deepseek)는 자체적인 하니스 팀을 베이징에 구성하여 모델과 하니스를 결합한 에이전트 개발에 집중합니다. 이는 모델 성능뿐만 아니라 주변 인프라가 에이전트의 핵심 경쟁력임을 보여줍니다.

주장자율 코딩 에이전트의 신뢰성은 더 나은 프롬프트가 아니라 엄격하게 규제된 상태 전환 루프에서 나옵니다. 에이전트가 스스로 환경을 최적화하는 메타 하니스(Meta-Harness) 연구가 진행 중입니다.

주장소프트웨어 인프라가 고도화될수록 에이전트의 자율성은 강화됩니다. 하니스는 단순한 도구를 넘어 에이전트의 사고 과정을 구체화하는 필수 요소입니다.

주장앞으로 AI 에이전트 개발은 모델의 매개변수 경쟁을 넘어 하니스 설계 능력으로 이동합니다. 시스템의 안정성과 투명성을 확보하는 기술이 시장의 주도권을 결정합니다.

출처디코더(The Decoder)와 아카이브(Arxiv) 연구 논문을 교차 검증했습니다.

주제

AI 에이전트 AI 연구

관련 콘텐츠

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

SCMP

UK PM Burnham to welcome Ukraine’s Zelensky in first foreign leader visit — Britain’s Prime Minister Andy Burnham will on Monday host Ukrainian President Volodymyr Zelensky as his first foreign leader since taking office a week ago, to underline London’s “unwavering support” for Kyiv. The pair are set to visit a British naval base and hear from both countries’ armed forces

3시간 전

SCMP

Nobel laureate Simon Johnson on the AI race and China’s ‘over-automation’ problem — Simon Johnson is a professor of entrepreneurship at the Massachusetts Institute of Technology (MIT). A former chief economist of the International Monetary Fund (IMF), he won a joint Nobel Prize for economics in 2024 for his research into how institutions shape national prosperity. On June 8, the Br

3시간 전

SCMP

US border tsar says vetting of ICE officer is under internal review after Maine shooting — US President Donald Trump’s border tsar said on Sunday that the vetting of an immigration officer involved in the deadly shooting of a Colombian native in Maine is under internal review after relatives revealed to Associated Press that he had a history of serious mental health struggles and violent

3시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

루마니아의 러시아 드론 격추 및 외교적 항의

국제6시간 전

먼데이닷컴 등 기술 기업의 인공지능 전환에 따른 대규모 인력 감축

경제22시간 전

오픈에이아이의 허깅페이스 시스템 침해와 투명성 요구

AI6시간 전

앤스로픽 클로드 오퍼스 5의 ARC-AGI-3 벤치마크 신기록 달성

AI12시간 전

오픈에이아이 지피티-5 모델의 생화학 무기 정보 제공 논란

AI12시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.26.0

v0.26.0 릴리즈

이번 릴리즈에서는 Inkling 모델 제품군 지원, DeepSeek-V4 성능 향상, fp32 `lm_head` 지원 추가, 유연한 어텐션 백엔드, KV 오프로딩 및 계층형 보조 스토리지 기능 강화 등 다양한 업데이트가 포함되었습니다. 또한 Rust 프론트엔드 기능 확장 및 Transformers 5.13.0 지원이 추가되었습니다.

1일 전

LangChainlangchain-anthropic==1.5.2

langchain-anthropic==1.5.2

Claude Opus 5 모델 지원이 추가되었습니다. 이번 릴리즈는 이전 버전인 langchain-anthropic==1.5.1 이후의 변경 사항을 포함합니다.

2일 전

Anthropicv0.120.0

v0.120.0

이번 릴리즈에서는 claude-opus-5 모델이 추가되었습니다. 또한, 도구 추가/제거 블록 및 tool_change 이벤트가 지원되며, 클라이언트 측 대체 크레딧 토큰 유형이 확장되고 서버 측 대체 기본 옵션이 추가되었습니다.

2일 전

LangChainlangchain-openai==1.4.1

langchain-openai==1.4.1

이번 릴리즈에서는 LangSmith 게이트웨이를 환경 변수를 통해 지원하도록 기능이 추가되었습니다. 또한 `gpt-5.3-chat-latest` 프로필이 수정되었습니다.