MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 6월 12일 금요일

AI 시대, 당신을 더욱 스마트하게

AI미검

AI 에이전트 루프 설계와 자동화 시스템 구축 전략

인공지능 에이전트의 효율성을 극대화하기 위해 인간의 개입을 최소화하는 자율 루프 설계가 필요합니다. 모델 의존도를 낮추는 기술적 대응과 함께 최신 연구 자동화 시스템의 성과를 분석합니다.

2026년 6월 12일

주장피터 스타인버거와 안드레이 카파시는 인공지능 에이전트에게 직접 명령어를 입력하는 방식을 지양해야 한다고 주장합니다. 사용자는 에이전트가 스스로 작업을 수행하도록 루프를 설계하는 역할에 집중해야 합니다.

주장안드레이 카파시는 인간이 시스템의 병목 현상이 되지 않도록 자율적인 배치 환경을 조성해야 한다고 강조합니다. 연구자가 루프 안에 머물며 결과를 확인하는 기존 방식은 시스템의 레버리지를 제한합니다.

팩트2026년 6월 10일부터 11일까지 진행된 인공지능 뉴스 분석 결과, 12개의 서브레딧과 544개의 트위터 계정을 조사했습니다. 해당 내용은 레이턴트 스페이스의 인공지능 뉴스 섹션을 통해 발행되었습니다.

교차검증앤스로픽의 클로드 페이블 5 모델은 연구용 사용 사례에서 성능을 의도적으로 저하시켰다는 비판을 받았습니다. 이후 사용자들의 반발로 인해 해당 정책은 하루 만에 철회되었습니다.

팩트클로드 페이블 5는 위어드ML 벤치마크에서 87.8%의 점수를 기록하며 모든 작업에서 70%를 넘긴 첫 모델이 되었습니다. 다만 실제 사용 환경에서는 높은 비용과 모델의 거부 반응, 내부 코드네임 생성 등의 문제가 보고되었습니다.

주장게르겔리 오로즈는 특정 모델에 의존하지 않도록 공급자 중립적인 라우터나 하네스를 사용할 것을 권장합니다. 이는 모델의 정책이나 행동이 부적절해질 경우 즉시 다른 벤더로 전환하기 위함입니다.

팩트리처드 소처와 리커시브 SI는 인공지능 연구를 위한 자동화된 발견 시스템을 공개했습니다. 이 시스템은 엔비디아 SOL-ExecBench와 나노GPT 스피드런 등에서 최신 기술 수준의 성과를 달성했습니다.

팩트마이크로소프트 리서치의 아버는 가설 트리 정제 방식을 사용하는 자율 연구 에이전트입니다. 이 에이전트는 MLE-벤치 라이트에서 86%의 성과를 기록하며 기존 모델들보다 뛰어난 성능을 보였습니다.

교차검증에이전트의 성능이 특정 루프 내에서는 유용하지만, 전문가 수준의 종합적인 판단이나 장기적인 작업에서는 여전히 취약하다는 평가가 나옵니다. 에이전트 라스트 이그잼 벤치마크의 가장 어려운 단계에서는 모든 시스템이 0점을 기록했습니다.

팩트매크로데이터 랩스는 로봇 공학을 위한 데이터 루프 구축을 목표로 리파이너를 출시했습니다. 이는 원시 데이터를 학습 가능한 데이터셋으로 변환하는 오픈소스 프레임워크로, 데이터 파이프라인의 가시성을 확보하는 데 중점을 둡니다.

주장자동화된 발견 시스템과 자율 연구 에이전트의 발전은 연구 효율성을 높이는 핵심 동력이 됩니다. 다만 시스템의 신뢰성을 확보하기 위한 정교한 루프 설계와 모델 중립적 인프라 구축이 병행되어야 합니다.

출처레이턴트 스페이스의 인공지능 뉴스 섹션(https://www.latent.space/p/ainews-loopcraft-the-art-of-stacking)을 교차 검증했습니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain==1.3.8

langchain==1.3.8

langchain 1.3.8 릴리즈에서는 문서 문자열 내 이중 백틱을 제거하고, `create_agent`에 오버로드를 추가했습니다. 또한, 비동기 미들웨어 데코레이터 타이핑을 지원하고 구조화된 출력 모델의 폴백을 개선했습니다.

9시간 전

meta-llama/llama-stackv1.1.0

v1.1.0

이번 릴리즈에서는 라이브러리 클라이언트의 요청 빌드 전 헤더 정리, CI 환경에서 테스트 픽스처가 메인 서버 로그를 덮어쓰는 문제 수정, OpenAI 응답 스키마 드리프트 검사기 추가 등 다양한 수정 사항이 포함되었습니다. 또한, 라우터의 헬스 체크 및 벡터 스토어 팬아웃 병렬 처리, 비-OpenAI 모델을 위한 5단계 토크나이저 해석 체인 추가, pgvector에서 psycopg2를 asyncpg로 마이그레이션하는 등의 성능 개선 및 기능 추가가 이루어졌습니다. Anthropic Message Batches API가 추가되었으며, 여러 프로바이더의 비동기 안전성 개선 및 비밀 처리 강화 등 전반적인 안정성 향상에 초점을 맞추었습니다.

1일 전

LangChainlangchain-core==1.4.6

langchain-core==1.4.6

이번 릴리즈에서는 추적 메타데이터에 패키지 버전 추적 기능이 추가되었습니다. 또한, v1 스트리밍 도구 호출이 정규화되었으며, 타입 체크 설정이 통합되었습니다.

1일 전

LangChainlangchain-model-profiles==0.0.6

langchain-model-profiles 0.0.6

langchain-model-profiles 0.0.6 버전이 릴리즈되었습니다. 이번 업데이트에서는 모델 프로필에 `text_inputs` 및 `text_outputs` 필드가 추가되었으며, 프로필 생성을 위한 도구가 개선되었습니다. 또한, 여러 종속성이 업데이트되었습니다.

1일 전

LangChainlangchain-core==1.4.5

langchain-core==1.4.5

langchain-core 1.4.5 릴리즈에서는 스트리밍 시 툴 호출 청크 유효성 검사 기능이 추가되었습니다. 또한, 비동기 트레이서의 동기 컨텍스트에서의 대체 동작 및 구조화된 출력 모델의 대체 동작이 개선되었습니다.

1일 전

PAPERS