MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 5월 30일 토요일

AI 시대, 당신을 더욱 스마트하게

AI검증

AI 에이전트의 핵심 기술인 코드와 하니스 구조

인공지능 에이전트가 추론하고 행동하는 본질은 코드와 이를 뒷받침하는 하니스 환경에 있습니다. 연구진은 모델 성능을 넘어 소프트웨어 인프라가 에이전트의 경쟁력을 결정한다고 분석합니다.

2026년 5월 29일

주장일리노이 대학교 어바나-샴페인과 메타, 스탠퍼드 연구진은 인공지능(AI) 에이전트의 본질이 코드에 있다고 분석합니다. 코드는 에이전트가 추론하고 행동하며 협업하는 기초가 됩니다.

팩트연구진은 모델을 둘러싼 소프트웨어 계층을 하니스(Harness)라고 정의합니다. 하니스는 도구, 인터페이스, 샌드박스 환경, 메모리, 실행 루프 등을 포함하여 모델이 연속적인 작업을 수행하도록 돕습니다.

팩트코드는 실행 가능하고 추적 가능하며 지속성을 가집니다. 모델의 출력물이 실제 연산으로 이어지고, 중간 계산 과정이 기록되어 에이전트가 작업을 이어갑니다.

팩트에이전트 시스템은 모델의 능력과 인프라, 그리고 에이전트가 즉석에서 생성하는 코드로 구성됩니다. 특히 에이전트가 스스로 생성하는 테스트 스크립트나 도구에 대한 연구가 중요해집니다.

주장하니스는 모델과 환경을 연결하는 가교 역할을 합니다. 프로그램 오브 소츠(Program-of-Thoughts)나 체인 오브 코드(Chain of Code) 같은 방법론은 언어적 묘사 대신 실행 가능한 프로그램으로 연산을 수행합니다.

팩트클로드 코드(Claude Code), 오픈에이아이(OpenAI)의 코덱스(Codex), 깃허브 코파일럿(GitHub Copilot) 등 상용 제품은 이미 하니스 원리를 따릅니다. 이들은 로컬 터미널과 개발 환경을 통합하여 에이전트가 파일을 수정하고 명령을 실행하게 합니다.

교차검증연구진은 현재의 소프트웨어 테스트가 불완전할 수 있다고 경고합니다. 테스트 통과가 곧 안전을 의미하지 않으며, 잘못된 신뢰를 줄 위험이 있으므로 투명한 평가 메커니즘이 필요합니다.

팩트딥시크(Deepseek)는 자체적인 하니스 팀을 베이징에 구성하여 모델과 하니스를 결합한 에이전트 개발에 집중합니다. 이는 모델 성능뿐만 아니라 주변 인프라가 에이전트의 핵심 경쟁력임을 보여줍니다.

주장자율 코딩 에이전트의 신뢰성은 더 나은 프롬프트가 아니라 엄격하게 규제된 상태 전환 루프에서 나옵니다. 에이전트가 스스로 환경을 최적화하는 메타 하니스(Meta-Harness) 연구가 진행 중입니다.

주장소프트웨어 인프라가 고도화될수록 에이전트의 자율성은 강화됩니다. 하니스는 단순한 도구를 넘어 에이전트의 사고 과정을 구체화하는 필수 요소입니다.

주장앞으로 AI 에이전트 개발은 모델의 매개변수 경쟁을 넘어 하니스 설계 능력으로 이동합니다. 시스템의 안정성과 투명성을 확보하는 기술이 시장의 주도권을 결정합니다.

출처디코더(The Decoder)와 아카이브(Arxiv) 연구 논문을 교차 검증했습니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

meta-llama/llama-stackv0.4.6

v0.4.6

이번 릴리즈에서는 llama-stack-client를 0.4.5 버전으로 업데이트하고, pyjwt, pyasn1, pypdf, nltk 등 여러 라이브러리의 보안 취약점(CVE)을 수정했습니다. 또한 NLTK Zip Slip 취약점과 starlette의 보안 문제를 해결하고 릴리즈 자동화 워크플로우를 추가했습니다.

1일 전

vLLMv0.22.0

v0.22.0

이번 릴리즈에서는 DeepSeek V4 모델의 안정성이 크게 향상되었으며, Model Runner V2가 기본값으로 전환되는 과정에서 여러 기능이 추가되었습니다. 또한, 실험적인 Rust 프론트엔드 통합과 배치 불변 추론의 성능 개선, 그리고 CPU 메모리를 넘어선 다계층 KV 캐시 오프로딩 기능이 도입되었습니다.

1일 전

Anthropicv0.105.2

v0.105.2

이번 릴리즈는 이전 버전인 v0.105.1 이후의 변경 사항을 포함합니다. 전체 변경 로그는 제공된 링크에서 확인할 수 있습니다.

1일 전

Anthropicv0.105.1

v0.105.1

이번 릴리즈는 PyPI 릴리즈에 Trusted Publishing을 사용하는 내부 변경 사항을 포함합니다. 전체 변경 사항은 제공된 링크에서 확인할 수 있습니다.

1일 전

NVIDIA/Megatron-LMcore_v0.17.1

NVIDIA Megatron Core 0.17.1

NVIDIA Megatron Core 0.17.1 릴리즈는 NVFP4 네이티브 가중치, NVRx 비동기 체크포인트 호환성, 하이브리드 EP를 위한 퍼뮤트 퓨전 추가 등 다양한 개선 사항을 포함합니다. 또한, 체크포인트 무결성 검증 기능이 추가되었으며, SHA-256을 사용한 프리픽스 캐싱으로 변경되었습니다. Transformers 라이브러리 호환성이 완화되고, TE(Tensor Engine)가 최신 버전 2.14로 업데이트되었습니다.

1일 전

PAPERS