마이크로소프트, MAI 모델 7종 및 상세 기술 보고서 공개
마이크로소프트가 연례 개발자 행사 빌드(Build)에서 추론과 코딩에 특화된 MAI 모델 7종을 발표했습니다. 특히 핵심 모델인 MAI-Thinking-1의 기술 보고서를 공개하며 모델 학습 과정의 투명성을 강화했습니다.
주장마이크로소프트는 이번 빌드 행사를 통해 단순한 인공지능 플랫폼 기업을 넘어 프론티어 모델 연구소로서의 입지를 강화했습니다. 무스타파 술레이만 마이크로소프트 인공지능 부문 최고경영자는 이번 성과를 내부 기술 혁신을 이끄는 핵심 동력으로 평가했습니다.
팩트마이크로소프트는 MAI-Thinking-1을 포함한 7개의 새로운 MAI 모델을 발표했습니다. 해당 모델들은 추론과 코드 생성, 이미지 처리, 음성 변환 등 다양한 영역을 포괄합니다.
팩트핵심 모델인 MAI-Thinking-1은 35B 활성 파라미터를 가진 전문가 혼합(MoE) 구조이며 256K 컨텍스트 윈도우를 지원합니다. 이 모델은 30T 토큰으로 사전 학습되었으며 8192개의 GB200 그래픽 처리 장치(GPU)를 사용하여 훈련했습니다.
팩트마이크로소프트는 MAI-Thinking-1에 관해 109페이지 분량의 기술 보고서를 공개했습니다. 해당 보고서는 데이터 계보와 확장 방법론, 인프라 지표 등을 상세히 담고 있습니다.
교차검증MAI-Thinking-1의 파라미터 규모에 관해 일부 소식통은 45B 활성 파라미터라고 언급했으나, 공식 발표된 35B 활성 파라미터가 더 권위 있는 수치입니다. 모델의 총 파라미터와 활성 파라미터 간의 차이에 관한 기술적 해석은 여전히 업계의 논의 대상입니다.
팩트MAI-Code-1-Flash 모델은 5B 파라미터 규모로 소프트웨어 엔지니어링 벤치마크인 SWE-Bench Pro에서 51%의 성능을 기록했습니다. 이 모델은 소규모임에도 높은 효율성을 보이며 비주얼 스튜디오 코드 및 깃허브 코파일럿에 최적화되어 있습니다.
팩트MAI-Image-2.5는 이미지 편집 분야에서 1401점을 기록하며 리더보드 2위에 올랐습니다. 이는 기존 경쟁 모델인 나노 바나나 2를 상회하는 성과입니다.
팩트MAI-Transcribe-1.5는 276배의 실시간 처리 속도와 2.4%의 단어 오류율을 기록했습니다. 이 모델은 43개 언어를 지원하며 의료 용어 등 특정 키워드에 대한 정확도를 높이는 기능을 포함합니다.
주장마이크로소프트는 타사 모델의 데이터를 증류하지 않는 클린 데이터 계보를 강조합니다. 이는 기업 고객이 안심하고 사용할 수 있는 도메인 특화 미세 조정 환경을 제공하려는 전략입니다.
팩트마이크로소프트는 자체 개발한 MAIA 200 칩셋으로 MAI 모델을 구동할 때 GB200 대비 달러당 성능은 30%, 전력당 성능은 1.4배 향상된다고 밝혔습니다. 이는 자체 하드웨어 최적화를 통해 비용 효율성을 확보하려는 조치입니다.
교차검증이번에 공개된 성능 수치는 마이크로소프트가 자체 테스트 환경에서 측정한 결과이며, 실제 운영 환경에서의 성능은 인프라 구성에 따라 달라질 수 있습니다.
출처마이크로소프트의 공식 발표 자료와 Latent Space의 보도 내용을 교차 검증했습니다. (https://www.latent.space/p/ainews-microsoft-build-mai-thinking)
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

