앤스로픽, 클로드 오퍼스 4.8 출시 및 성능 향상
앤스로픽이 차세대 인공지능 모델 클로드 오퍼스 4.8을 공개했습니다. 주요 벤치마크에서 경쟁 모델을 앞서는 성능을 보이며, 작업 효율성과 정직성을 대폭 개선했습니다.
주장앤스로픽은 신규 모델 클로드 오퍼스 4.8이 주요 벤치마크에서 오픈에이아이의 지피티-5.5와 구글의 제미나이 3.1 프로를 앞선다고 발표했습니다. 이번 모델은 단순한 성능 수치 향상을 넘어 모델 스스로 자신의 불확실성을 인정하는 정직함이 크게 개선되었습니다.
팩트클로드 오퍼스 4.8은 에이전트 코딩 벤치마크인 에스더블유이-벤치 프로에서 69.2퍼센트의 점수를 기록했습니다. 이는 이전 모델인 오퍼스 4.7의 64.3퍼센트와 지피티-5.5의 58.6퍼센트를 상회하는 수치입니다.
팩트다학제적 추론 능력을 평가하는 휴머니티스 라스트 이그잼에서 오퍼스 4.8은 도구 사용 없이 49.8퍼센트, 도구 사용 시 57.9퍼센트를 달성했습니다. 해당 분야에서 가장 높은 점수를 기록하며 추론 성능을 입증했습니다.
주장앤스로픽은 이번 모델의 핵심 특징으로 동적 워크플로우 기능을 제시합니다. 이 기능으로 모델은 스스로 작업을 계획하고 수백 개의 병렬 하이에이전트를 실행하여 복잡한 코딩 마이그레이션을 수행합니다.
팩트사용자는 새로운 노력 제어 기능을 통해 인공지능이 응답 생성에 투입할 노력을 직접 설정합니다. 높은 설정을 선택하면 더 깊은 사고를 통한 결과물을 얻고, 낮은 설정을 선택하면 속도를 높일 수 있습니다.
교차검증오퍼스 4.8은 이전 모델인 4.7보다 작업당 필요한 패스 횟수가 15퍼센트 적고 출력 토큰 사용량도 35퍼센트 적습니다. 다만 오픈에이아이의 지피티-5.5와 비교하면 여전히 약 30퍼센트 더 많은 패스를 사용합니다.
팩트에이피아이 가격은 이전 모델인 오퍼스 4.7과 동일하게 유지합니다. 입력 토큰은 백만 개당 5달러, 출력 토큰은 백만 개당 25달러로 책정되었습니다.
팩트패스트 모드의 가격은 이전 모델 대비 3분의 1 수준으로 인하되었습니다. 패스트 모드는 오퍼스 4.8을 2.5배 빠른 속도로 실행할 수 있도록 지원합니다.
주장인공지능 업계는 이번 업데이트가 단순한 성능 수치 경쟁을 넘어 실질적인 업무 효율성을 개선하는 방향으로 나아간다고 평가합니다. 모델의 정직성 향상은 인공지능의 환각 현상을 줄이는 데 중요한 역할을 할 것으로 기대됩니다.
주장앤스로픽의 이번 행보는 인공지능 모델이 복잡한 업무를 스스로 처리하는 에이전트 환경으로 진화하고 있음을 보여줍니다. 정직한 응답 체계는 기업용 인공지능 도입의 신뢰도를 높이는 핵심 요소가 됩니다.
교차검증모델의 성능 향상에도 불구하고 경쟁 모델 대비 높은 패스 횟수와 토큰 사용량은 향후 최적화 과정에서 해결해야 할 과제로 남습니다.
출처더 디코더(The Decoder)의 보도 내용을 교차 검증했습니다. (https://the-decoder.com/anthropic-ships-claude-opus-4-8-as-a-modest-but-tangible-improvement-that-tops-gpt-5-5-in-most-benchmarks/)
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

