AI미검

AI 모델의 브라우저 보안 취약점 공격 능력 검증

앤스로픽의 클로드 미토스 모델이 브라우저 취약점 공격 수행 능력에서 오픈AI의 GPT-5.5를 큰 폭으로 앞섰습니다. 연구진은 이번 결과가 향후 보안 시스템 설계와 방어 전략의 변화를 요구한다고 분석했습니다.

2026년 5월 16일

주장앤스로픽의 클로드 미토스 모델이 실제 브라우저 취약점을 공격하는 능력에서 오픈AI의 GPT-5.5를 크게 앞섰습니다. 연구진은 해당 모델이 숙련된 보안 연구원과 대등한 수준의 공격 수행 능력을 갖췄다고 평가했습니다.

팩트카네기멜론 대학 연구진은 구글의 자바스크립트 엔진인 브이에이트(V8)의 취약점을 활용해 인공지능 에이전트의 공격 능력을 측정하는 벤치마크를 구축했습니다. 브이에이트 엔진은 크롬, 엣지, 노드 제이에스 등 주요 시스템의 핵심 구성 요소로 사용됩니다.

팩트클로드 미토스는 41개의 취약점 중 21개에서 최고 단계인 임의 코드 실행에 성공했습니다. 반면 지피티-5.5는 동일한 테스트에서 단 2개의 취약점만을 최고 단계까지 공략하는 데 그쳤습니다.

팩트클로드 미토스는 인간의 도움 없이 완전 자율 모드에서도 9.55점이라는 높은 점수를 기록했습니다. 지피티-5.5는 동일한 조건에서 4.30점을 기록했습니다.

팩트보안 연구원 이승현 씨는 클로드 미토스가 인간 연구원들이 1년 넘게 해결하지 못한 취약점을 재현했다고 밝혔습니다. 해당 모델은 인간 연구원들이 너무 복잡하다고 판단했던 공격 기법을 스스로 개발하기도 했습니다.

팩트현재 벤치마크는 새로운 취약점을 발견하거나 실제 공격을 위한 무기화 능력을 측정하는 단계까지는 도달하지 못했습니다. 이 연구는 인공지능이 기존에 알려진 보안 결함을 얼마나 효과적으로 활용할 수 있는지에 초점을 맞췄습니다.

교차검증클로드 미토스의 테스트 비용은 약 3만 6,428달러로 지피티-5.5의 약 3,075달러보다 12배가량 높습니다. 이러한 비용 격차는 앞으로 인공지능 모델의 경제성과 상용화 가능성에 대한 의문을 제기합니다.

교차검증연구진은 테스트에 사용된 버그들이 이미 공개된 정보라는 점을 인정했습니다. 따라서 모델이 학습 데이터를 통해 정보를 습득했을 가능성을 완전히 배제할 수는 없습니다.

주장이번 연구는 인공지능이 사이버 보안 분야에서 실질적인 위협이 될 수 있음을 시사합니다. 특히 자율적인 코드 실행 능력은 앞으로 보안 시스템 설계와 방어 전략에 큰 변화를 요구합니다.

출처더 디코더(The Decoder)의 보도와 관련 아카이브(arXiv) 논문, 깃허브(GitHub) 저장소를 교차 검증했습니다. 모든 분석은 연구진에 의해 독립적으로 수행되었습니다.

주제

Anthropic 사이버보안 OpenAI

관련 콘텐츠

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Syrian President Ahmad al-Sharaa: We should never be forced to choose between Israeli ambitions and Iranian ambitions in the region. The region itself must have its own independent policy and its own independent identity.

50분 전

TELEGRAM · Clash Report

Syrian President Ahmad al-Sharaa: In its natural course, a national renaissance takes about 20 to 25 years before its full results become visible. When we talk about Singapore, Rwanda today, Türkiye, or even the Gulf Cooperation Council countries—every country that has achieved this kind of success took time. It took around 20 to 25 years. But that doesn't mean we have to wait 20 years before we see change in Syria. What matters is that the trajectory is upward. Progress should become visibl

50분 전

TELEGRAM · Clash Report

Syrian President Ahmad al-Sharaa: Let's distinguish between the SDF and the Kurdish people. The Kurdish community is a large community spread across Syria; it is not confined to one specific area. A segment of the Kurdish population had been denied Syrian citizenship under the previous regime. This is an old issue that we inherited, but we were determined to resolve it. We issued a decree granting citizenship and nationality rights, and many have already received them. Their cultural rights

50분 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

루마니아의 러시아 드론 격추 및 외교적 항의

국제7시간 전

먼데이닷컴 등 기술 기업의 인공지능 전환에 따른 대규모 인력 감축

경제23시간 전

오픈에이아이의 허깅페이스 시스템 침해와 투명성 요구

AI7시간 전

앤스로픽 클로드 오퍼스 5의 ARC-AGI-3 벤치마크 신기록 달성

AI13시간 전

오픈에이아이 지피티-5 모델의 생화학 무기 정보 제공 논란

AI13시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.26.0

v0.26.0 릴리즈

이번 릴리즈에서는 Inkling 모델 제품군 지원, DeepSeek-V4 성능 향상, fp32 `lm_head` 지원 추가, 유연한 어텐션 백엔드, KV 오프로딩 및 계층형 보조 스토리지 기능 강화 등 다양한 업데이트가 포함되었습니다. 또한 Rust 프론트엔드 기능 확장 및 Transformers 5.13.0 지원이 추가되었습니다.

1일 전

LangChainlangchain-anthropic==1.5.2

langchain-anthropic==1.5.2

Claude Opus 5 모델 지원이 추가되었습니다. 이번 릴리즈는 이전 버전인 langchain-anthropic==1.5.1 이후의 변경 사항을 포함합니다.

2일 전

Anthropicv0.120.0

v0.120.0

이번 릴리즈에서는 claude-opus-5 모델이 추가되었습니다. 또한, 도구 추가/제거 블록 및 tool_change 이벤트가 지원되며, 클라이언트 측 대체 크레딧 토큰 유형이 확장되고 서버 측 대체 기본 옵션이 추가되었습니다.

2일 전

LangChainlangchain-openai==1.4.1

langchain-openai==1.4.1

이번 릴리즈에서는 LangSmith 게이트웨이를 환경 변수를 통해 지원하도록 기능이 추가되었습니다. 또한 `gpt-5.3-chat-latest` 프로필이 수정되었습니다.