오픈AI 코덱스 기능 확장과 AI 에이전트 시장 경쟁
오픈AI가 코덱스를 지식 노동 전반을 지원하는 슈퍼앱으로 전환하며 업무 효율을 높이고 있습니다. 동시에 앤스로픽과 xAI 등 주요 기업은 보안과 에이전트 성능을 강화하며 시장 경쟁을 가속화합니다.
주장오픈AI는 코덱스(Codex)를 단순한 코딩 보조 도구를 넘어 지식 노동 전반을 지원하는 슈퍼앱으로 전환합니다. 코덱스는 이제 코딩 지식이 없는 사용자도 컴퓨터상의 모든 업무를 수행하도록 설계되었습니다.
팩트최신 코덱스 업데이트는 컴퓨터 사용 속도를 42% 향상했습니다. 반응형 브라우저 기능과 마이크로소프트, 구글, 세일즈포스 제품군과의 연동 기능을 포함합니다. 사용자의 업무 흐름에 따라 사용자 인터페이스(UI)가 동적으로 변하는 기능도 도입했습니다.
교차검증앤스로픽(Anthropic)은 클로드(Claude) 보안 도구를 출시하며 코드 리뷰 기능을 강화했습니다. 이는 오픈AI의 코덱스 확장과 더불어 인공지능(AI) 에이전트가 보안 취약점을 해결하는 데 중요한 역할을 수행함을 시사합니다.
팩트영국 AI 보안 연구소의 평가 결과, 지피티-5.5(GPT-5.5)는 다단계 사이버 공격 시뮬레이션을 완수한 두 번째 모델이 되었습니다. 이는 앤스로픽의 클로드 미소스 프리뷰와 대등한 수준의 사이버 보안 성능을 입증합니다.
팩트사이버 공격 평가 벤치마크 데이터에서 지피티-5.5는 71.4%의 통과율을 기록했습니다. 클로드 미소스는 68.6%를 기록했습니다. 1억 토큰 이상의 추론 예산을 투입한 이후에도 성능 향상은 지속적으로 나타납니다.
주장오픈AI의 최신 모델은 지능의 비약적 도약보다 높은 신뢰성과 효율적인 고가치 업무 수행에 초점을 맞춥니다. 지피티-5.5 프로 모델은 이전 버전 대비 약 60% 낮은 비용과 토큰 사용량으로 더 나은 성능을 달성합니다.
팩트오픈 소스 모델 분야에서는 큐웬3.6(Qwen3.6) 27B 모델이 150B 파라미터 이하 모델 중 가장 뛰어난 성능을 보입니다. 해당 모델은 아파치 2.0 라이선스를 따르며 262K 컨텍스트와 네이티브 멀티모달 입력을 지원합니다.
교차검증텐센트의 에이치와이3(Hy3)-프리뷰 모델은 295B 파라미터 규모의 전문가 혼합(MoE) 모델로 출시되었습니다. 그러나 큐웬3.6이나 딥시크 V4 플래시와 같은 경쟁 모델 대비 성능은 다소 뒤처진다는 평가를 받습니다.
팩트엑스에이아이(xAI)의 그록(Grok) 4.3은 이전 버전 대비 에이전트 벤치마크에서 4점 상승한 53점을 기록했습니다. 입력 비용은 40%, 출력 비용은 60% 절감하여 시스템 및 사후 학습 측면에서 실질적인 개선을 이루었습니다.
출처래이턴트 스페이스(Latent Space)의 에이아이 뉴스(AINews) 보고서를 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.