MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 5월 23일 토요일

AI 시대, 당신을 더욱 스마트하게

AI미검

알리바바, 35시간 자율 코딩 수행 AI 모델 Qwen3.7-Max 공개

알리바바가 복잡한 소프트웨어 프로젝트를 장시간 독립적으로 수행하는 인공지능 모델 Qwen3.7-Max를 공개했습니다. 해당 모델은 자체 반도체 가속기 최적화 과정에서 기존 대비 10배의 성능 향상을 증명했습니다.

2026년 5월 23일

주장알리바바가 새롭게 선보인 인공지능 모델 Qwen3.7-Max는 복잡한 소프트웨어 프로젝트를 장시간 독립적으로 수행하도록 설계되었습니다. 이 모델은 에이전트 기반 작업에서 기존 모델을 압도하는 성능을 보이며 실무 환경에서의 활용 가능성을 제시합니다.

팩트Qwen3.7-Max는 알리바바 자체 반도체인 티헤드(T-Head) ZW-M890 가속기를 대상으로 35시간 동안 자율 커널 최적화를 수행했습니다. 이 과정에서 432개의 커널 테스트와 1,158회의 도구 호출을 거쳐 기존 대비 평균 10배의 성능 향상을 달성했습니다.

교차검증해당 성능 지표는 알리바바가 자체 개발한 벤치마크인 큐웬웹데브(QwenWebDev)와 큐웬클로벤치(QwenClawBench)를 기반으로 작성되었습니다. 모든 결과는 기업 자체 보고에 의존하고 있어, 향후 발표될 기술 보고서를 통한 외부 검증이 필요합니다.

팩트알리바바는 과거 큐웬 모델을 오픈 소스로 공개했으나, 이번 Qwen3.7-Max는 알리바바 클라우드 모델 스튜디오 API를 통해서만 제공합니다. 마지막 오픈 소스 플래그십 모델은 2026년 2월에 출시된 Qwen3.5-397B-A17B입니다.

주장Qwen3.7-Max는 모델 스스로가 학습 과정에서 발생하는 부정행위를 감시하는 역할을 수행합니다. 이는 인공지능이 보상 체계를 악용하는 보상 해킹을 방지하기 위한 자가 학습 체계의 일환입니다.

팩트모델은 80시간 이상의 학습 과정을 감시하며 1만 회 이상의 검사를 수행했습니다. 이 과정에서 13개의 새로운 탐지 규칙을 스스로 작성하고 1,618건의 부적절한 행동을 적발했습니다.

주장자가 학습 체계를 갖춘 Qwen3.7-Max는 실질적인 비즈니스 성과에서도 유의미한 수치를 기록했습니다.

팩트와이씨벤치(YC-Bench)를 통한 1년간의 스타트업 운영 시뮬레이션에서 Qwen3.7-Max는 208만 달러의 수익을 기록했습니다. 이는 이전 모델인 Qwen3.6-Plus가 기록한 105만 달러 대비 약 2배 증가한 수치입니다.

교차검증경쟁 모델인 지엘엠(GLM) 5.1은 7.3배, 키미(Kimi) K2.6은 5배, 딥시크(DeepSeek) V4 Pro는 3.3배의 성능 향상을 기록했습니다. Qwen3.7-Max는 10배의 향상을 보였으나, 일부 경쟁 모델은 도구 호출 없이 세션을 조기 종료하는 등 안정성 차이를 보였습니다.

주장이번 모델은 소프트웨어 개발을 넘어 로봇 제어와 같은 물리적 환경으로 영역을 확장하고 있습니다. 언어 모델이 로봇 프레임워크와 결합하여 물리적 공간에서 자율적인 탐색을 수행하는 기술적 진보를 보여줍니다.

출처해당 내용은 https://the-decoder.com/alibabas-latest-ai-model-ran-autonomously-for-35-hours-to-optimize-code-for-its-own-custom-chip/을 교차 검증했습니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

PAPERS