앤스로픽, 신규 AI 모델 클로드 페이블 5 및 미토스 5 공개
앤스로픽이 코딩과 과학 연구에 특화된 차세대 인공지능 모델인 클로드 페이블 5와 미토스 5를 새롭게 선보였습니다. 이전 모델 대비 성능은 비약적으로 향상되었으나, 이용 가격 상승과 보안 필터의 과도한 통제는 해결해야 할 과제로 남았습니다.
주장앤스로픽은 신규 모델인 클로드 페이블 5가 코딩과 이미지 처리, 복잡한 데이터 분석 등 거의 모든 벤치마크에서 기존 모델을 능가하는 최고 성능을 보인다고 발표했습니다. 이 모델은 특히 장기적이고 복잡한 작업 수행에서 이전 버전과의 격차를 크게 벌리고 있습니다.
팩트소프트웨어 엔지니어링 작업 능력을 평가하는 SWE-벤치 프로에서 페이블 5는 80.3%의 점수를 기록했습니다. 이는 클로드 오퍼스 4.8의 69.2%와 GPT 5.5의 58.6%를 상회하는 수치입니다.
팩트코딩 전문 벤치마크인 프론티어코드에서 페이블 5는 29.3%를 획득하여 13.4%를 기록한 클로드 오퍼스 4.8을 앞섰습니다. 결제 플랫폼 기업 스트라이프는 페이블 5를 활용해 5개월 분량의 엔지니어링 작업을 단 며칠 만에 완료했습니다.
주장페이블 5의 성과를 이어받은 클로드 미토스 5는 신약 설계와 유전체학 연구 분야에서 자율적인 문제 해결 능력을 증명하며 과학적 가설 생성의 새로운 가능성을 제시합니다. 앤스로픽은 이 모델이 인간 전문가의 개입 없이도 복잡한 생물학적 연구 단계를 스스로 수행한다고 설명합니다.
팩트미토스 5는 138개 동물 종의 단일 세포 데이터를 분석하여 자체 머신러닝 모델을 설계하고 훈련했습니다. 해당 결과물은 최근 사이언스지에 발표된 모델보다 100배 작으면서도 더 뛰어난 성능을 보였습니다.
팩트클로드 미토스 5는 사이버 보안 분야에서 익스플로잇벤치 78%의 점수를 기록하며 높은 평가를 받았습니다. 현재 이 모델은 미국 정부와의 파트너십을 통해 제한된 파트너에게만 제공됩니다.
교차검증신규 모델의 가격은 입력 토큰 100만 개당 10달러로 책정되어 기존 클로드 오퍼스 4.8 대비 2배 높습니다. 일반 구독 플랜의 경우 사용량 차감 방식이 변경되어 이용자의 비용 부담이 증가할 것으로 보입니다.
주장앤스로픽은 모델의 위험성을 통제하고자 페이블 5에 새로운 인공지능 분류기를 도입했습니다. 위험한 요청이 감지되면 자동으로 성능이 낮은 클로드 오퍼스 4.8 모델로 전환하여 보안 사고를 방지합니다.
교차검증앤스로픽은 현재 적용된 보안 필터가 다소 과도하게 설정되어 무해한 요청까지 차단할 가능성이 있음을 인정했습니다. 이러한 엄격한 통제는 모델의 전반적인 활용성을 저해할 수 있다는 우려를 낳습니다.
팩트앤스로픽은 페이블 5와 미토스 5를 통해 인공지능의 전문 영역 활용도를 극대화하겠다는 계획입니다. 모델의 성능 향상과 더불어 보안 및 비용 효율성을 확보하는 것이 향후 서비스 운영의 핵심이 될 전망입니다.
주장이번 신규 모델 공개는 인공지능이 단순한 정보 처리를 넘어 과학적 발견과 고도화된 엔지니어링 영역에서 실질적인 도구로 자리 잡고 있음을 보여줍니다. 앤스로픽은 앞으로도 연구 및 개발 분야에 최적화된 모델을 지속적으로 고도화할 예정입니다.
출처앤스로픽의 신규 모델 발표 내용은 더 디코더(The Decoder)의 보도 자료를 통해 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

