AI 에이전트의 핵심 기술인 코드와 하니스 구조
인공지능 에이전트가 추론하고 행동하는 본질은 코드와 이를 뒷받침하는 하니스 환경에 있습니다. 연구진은 모델 성능을 넘어 소프트웨어 인프라가 에이전트의 경쟁력을 결정한다고 분석합니다.
주장일리노이 대학교 어바나-샴페인과 메타, 스탠퍼드 연구진은 인공지능(AI) 에이전트의 본질이 코드에 있다고 분석합니다. 코드는 에이전트가 추론하고 행동하며 협업하는 기초가 됩니다.
팩트연구진은 모델을 둘러싼 소프트웨어 계층을 하니스(Harness)라고 정의합니다. 하니스는 도구, 인터페이스, 샌드박스 환경, 메모리, 실행 루프 등을 포함하여 모델이 연속적인 작업을 수행하도록 돕습니다.
팩트코드는 실행 가능하고 추적 가능하며 지속성을 가집니다. 모델의 출력물이 실제 연산으로 이어지고, 중간 계산 과정이 기록되어 에이전트가 작업을 이어갑니다.
팩트에이전트 시스템은 모델의 능력과 인프라, 그리고 에이전트가 즉석에서 생성하는 코드로 구성됩니다. 특히 에이전트가 스스로 생성하는 테스트 스크립트나 도구에 대한 연구가 중요해집니다.
주장하니스는 모델과 환경을 연결하는 가교 역할을 합니다. 프로그램 오브 소츠(Program-of-Thoughts)나 체인 오브 코드(Chain of Code) 같은 방법론은 언어적 묘사 대신 실행 가능한 프로그램으로 연산을 수행합니다.
팩트클로드 코드(Claude Code), 오픈에이아이(OpenAI)의 코덱스(Codex), 깃허브 코파일럿(GitHub Copilot) 등 상용 제품은 이미 하니스 원리를 따릅니다. 이들은 로컬 터미널과 개발 환경을 통합하여 에이전트가 파일을 수정하고 명령을 실행하게 합니다.
교차검증연구진은 현재의 소프트웨어 테스트가 불완전할 수 있다고 경고합니다. 테스트 통과가 곧 안전을 의미하지 않으며, 잘못된 신뢰를 줄 위험이 있으므로 투명한 평가 메커니즘이 필요합니다.
팩트딥시크(Deepseek)는 자체적인 하니스 팀을 베이징에 구성하여 모델과 하니스를 결합한 에이전트 개발에 집중합니다. 이는 모델 성능뿐만 아니라 주변 인프라가 에이전트의 핵심 경쟁력임을 보여줍니다.
주장자율 코딩 에이전트의 신뢰성은 더 나은 프롬프트가 아니라 엄격하게 규제된 상태 전환 루프에서 나옵니다. 에이전트가 스스로 환경을 최적화하는 메타 하니스(Meta-Harness) 연구가 진행 중입니다.
주장소프트웨어 인프라가 고도화될수록 에이전트의 자율성은 강화됩니다. 하니스는 단순한 도구를 넘어 에이전트의 사고 과정을 구체화하는 필수 요소입니다.
주장앞으로 AI 에이전트 개발은 모델의 매개변수 경쟁을 넘어 하니스 설계 능력으로 이동합니다. 시스템의 안정성과 투명성을 확보하는 기술이 시장의 주도권을 결정합니다.
출처디코더(The Decoder)와 아카이브(Arxiv) 연구 논문을 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

