MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 5월 3일 일요일

전문가의 AI 하이브리드 리서치 랩

AI미검

말은 잘하는데 일은 아직: AI 노동 자동화 실험 결과

Center for AI Safety와 Scale AI 연구진이 실제 프리랜서 프로젝트를 기반으로 AI 자동화율을 측정했다. 최고 성능 AI의 자동화율은 2.5%에 그쳤다. AI는 문제를 푸는 능력은 빠르게 발전했으나 돈을 받고 끝까지 책임지는 능력은 아직 인간의 영역이었다.

2026년 1월 13일

팩트연구진은 Remote Labor Index(RLI)라는 새로운 벤치마크를 만들어 실제 프리랜서 시장에서 돈을 받고 수행된 진짜 프로젝트 240개를 사용했습니다. 사람 기준 평균 작업 시간은 29시간, 총 노동 가치는 약 14만 달러입니다. 최고 성능 AI인 Manus의 자동화율은 2.5%, Grok-4는 2.1%, Claude Sonnet 4.5는 2.1%, GPT-5는 1.7%, ChatGPT Agent는 1.3%에 그쳤습니다.

팩트영상·애니메이션, 건축·CAD, 게임 개발, 멀티파일 프로젝트에서 AI 성능이 붕괴했습니다. 파일이 깨지고 결과물이 누락되며 형식이 요구사항과 달랐습니다. 반면 간단한 웹 시각화, 보고서 작성, 이미지·오디오 생성에서는 일부 성공했습니다.

주장AI는 똑똑해졌지만 아직 일꾼은 아닙니다. 말 잘하는 비서이지 프리랜서 대체재는 아니었습니다. AI 생산성 논쟁은 실제보다 과장됐으며, 실제 노동 자동화는 아직 시작 단계입니다. 화이트칼라 대량 대체는 단기간에 오기 어렵습니다.

교차검증AI는 부분적으로 개선되고 있으며 Elo 점수는 모델 세대가 바뀔수록 상승했습니다. 끝까지 책임지는 일은 아직 불가능하나 개선 속도는 빠릅니다. 본 논문은 arXiv 사전공개(preprint) 상태로 동료심사를 거치지 않았습니다.

출처Mazeika, M. et al. (2025). Remote Labor Index: Measuring AI Automation of Remote Work. arXiv. https://arxiv.org/abs/2510.26787

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

2시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

1일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

1일 전

meta-llama/llama-stackv0.8.0

v0.8.0

이번 릴리즈에서는 Anthropic Messages API를 네이티브로 지원하며, 대화 압축 기능이 추가되었습니다. 또한, 기존 Eval API 및 관련 API가 제거되었고, 문서 전반에 걸쳐 UX 개선 및 최적화가 이루어졌습니다. 보안 취약점 수정 및 CI/CD 파이프라인 개선 작업도 포함되었습니다.

1일 전

LangChainlangchain==1.3.0a1

langchain v1.3.0a1

이번 릴리즈에서는 `create_agent`에 `stream_events` 기능이 추가되었으며, HITL 미들웨어에 `respond` 결정 기능이 포함되었습니다. 또한, 에이전트 상태를 도구 디스패치에 인라인하는 것을 중단하여 성능을 개선했습니다.

1일 전

PAPERS