MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 5월 30일 토요일

AI 시대, 당신을 더욱 스마트하게

AI검증

앤스로픽, 클로드 오퍼스 4.8 출시 및 성능 향상

앤스로픽이 차세대 인공지능 모델 클로드 오퍼스 4.8을 공개했습니다. 주요 벤치마크에서 경쟁 모델을 앞서는 성능을 보이며, 작업 효율성과 정직성을 대폭 개선했습니다.

2026년 5월 29일

주장앤스로픽은 신규 모델 클로드 오퍼스 4.8이 주요 벤치마크에서 오픈에이아이의 지피티-5.5와 구글의 제미나이 3.1 프로를 앞선다고 발표했습니다. 이번 모델은 단순한 성능 수치 향상을 넘어 모델 스스로 자신의 불확실성을 인정하는 정직함이 크게 개선되었습니다.

팩트클로드 오퍼스 4.8은 에이전트 코딩 벤치마크인 에스더블유이-벤치 프로에서 69.2퍼센트의 점수를 기록했습니다. 이는 이전 모델인 오퍼스 4.7의 64.3퍼센트와 지피티-5.5의 58.6퍼센트를 상회하는 수치입니다.

팩트다학제적 추론 능력을 평가하는 휴머니티스 라스트 이그잼에서 오퍼스 4.8은 도구 사용 없이 49.8퍼센트, 도구 사용 시 57.9퍼센트를 달성했습니다. 해당 분야에서 가장 높은 점수를 기록하며 추론 성능을 입증했습니다.

주장앤스로픽은 이번 모델의 핵심 특징으로 동적 워크플로우 기능을 제시합니다. 이 기능으로 모델은 스스로 작업을 계획하고 수백 개의 병렬 하이에이전트를 실행하여 복잡한 코딩 마이그레이션을 수행합니다.

팩트사용자는 새로운 노력 제어 기능을 통해 인공지능이 응답 생성에 투입할 노력을 직접 설정합니다. 높은 설정을 선택하면 더 깊은 사고를 통한 결과물을 얻고, 낮은 설정을 선택하면 속도를 높일 수 있습니다.

교차검증오퍼스 4.8은 이전 모델인 4.7보다 작업당 필요한 패스 횟수가 15퍼센트 적고 출력 토큰 사용량도 35퍼센트 적습니다. 다만 오픈에이아이의 지피티-5.5와 비교하면 여전히 약 30퍼센트 더 많은 패스를 사용합니다.

팩트에이피아이 가격은 이전 모델인 오퍼스 4.7과 동일하게 유지합니다. 입력 토큰은 백만 개당 5달러, 출력 토큰은 백만 개당 25달러로 책정되었습니다.

팩트패스트 모드의 가격은 이전 모델 대비 3분의 1 수준으로 인하되었습니다. 패스트 모드는 오퍼스 4.8을 2.5배 빠른 속도로 실행할 수 있도록 지원합니다.

주장인공지능 업계는 이번 업데이트가 단순한 성능 수치 경쟁을 넘어 실질적인 업무 효율성을 개선하는 방향으로 나아간다고 평가합니다. 모델의 정직성 향상은 인공지능의 환각 현상을 줄이는 데 중요한 역할을 할 것으로 기대됩니다.

주장앤스로픽의 이번 행보는 인공지능 모델이 복잡한 업무를 스스로 처리하는 에이전트 환경으로 진화하고 있음을 보여줍니다. 정직한 응답 체계는 기업용 인공지능 도입의 신뢰도를 높이는 핵심 요소가 됩니다.

교차검증모델의 성능 향상에도 불구하고 경쟁 모델 대비 높은 패스 횟수와 토큰 사용량은 향후 최적화 과정에서 해결해야 할 과제로 남습니다.

출처더 디코더(The Decoder)의 보도 내용을 교차 검증했습니다. (https://the-decoder.com/anthropic-ships-claude-opus-4-8-as-a-modest-but-tangible-improvement-that-tops-gpt-5-5-in-most-benchmarks/)

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

meta-llama/llama-stackv0.4.6

v0.4.6

이번 릴리즈에서는 llama-stack-client를 0.4.5 버전으로 업데이트하고, pyjwt, pyasn1, pypdf, nltk 등 여러 라이브러리의 보안 취약점(CVE)을 수정했습니다. 또한 NLTK Zip Slip 취약점과 starlette의 보안 문제를 해결하고 릴리즈 자동화 워크플로우를 추가했습니다.

1일 전

vLLMv0.22.0

v0.22.0

이번 릴리즈에서는 DeepSeek V4 모델의 안정성이 크게 향상되었으며, Model Runner V2가 기본값으로 전환되는 과정에서 여러 기능이 추가되었습니다. 또한, 실험적인 Rust 프론트엔드 통합과 배치 불변 추론의 성능 개선, 그리고 CPU 메모리를 넘어선 다계층 KV 캐시 오프로딩 기능이 도입되었습니다.

1일 전

Anthropicv0.105.2

v0.105.2

이번 릴리즈는 이전 버전인 v0.105.1 이후의 변경 사항을 포함합니다. 전체 변경 로그는 제공된 링크에서 확인할 수 있습니다.

1일 전

Anthropicv0.105.1

v0.105.1

이번 릴리즈는 PyPI 릴리즈에 Trusted Publishing을 사용하는 내부 변경 사항을 포함합니다. 전체 변경 사항은 제공된 링크에서 확인할 수 있습니다.

1일 전

NVIDIA/Megatron-LMcore_v0.17.1

NVIDIA Megatron Core 0.17.1

NVIDIA Megatron Core 0.17.1 릴리즈는 NVFP4 네이티브 가중치, NVRx 비동기 체크포인트 호환성, 하이브리드 EP를 위한 퍼뮤트 퓨전 추가 등 다양한 개선 사항을 포함합니다. 또한, 체크포인트 무결성 검증 기능이 추가되었으며, SHA-256을 사용한 프리픽스 캐싱으로 변경되었습니다. Transformers 라이브러리 호환성이 완화되고, TE(Tensor Engine)가 최신 버전 2.14로 업데이트되었습니다.

1일 전

PAPERS