엔비디아·AMD·인텔, MLPerf 6.0 벤치마크 결과 발표
인공지능 반도체 제조사들이 MLPerf 6.0 벤치마크 결과를 공개했습니다. 각 기업은 서로 다른 모델과 시스템 구성을 활용해 자사 기술의 강점을 증명했습니다.
주장MLPerf 6.0 결과는 각 제조사가 서로 다른 모델과 시스템 구성을 사용함에 따라 단순한 순위 산정이 불가능합니다. 엔비디아와 AMD, 인텔은 각자의 강점을 부각하는 지표를 선택해 발표하고 있습니다.
팩트2026년 4월 1일 발표된 MLPerf 6.0에는 DeepSeek-R1, Qwen3-VL-235B, GPT-OSS-120B, WAN-2.2-T2V, DLRMv3 등 5개의 새로운 벤치마크가 추가되었습니다. 이 모든 모델과 시나리오에 대해 결과를 제출한 기업은 엔비디아가 유일합니다.
팩트엔비디아는 288개의 그래픽처리장치(GPU)를 연결한 GB300-NVL72 시스템을 통해 DeepSeek-R1에서 초당 약 249만 토큰의 처리량을 기록했습니다. 이는 기존 하드웨어에서 소프트웨어 최적화만으로 6개월 전 대비 2.7배의 성능 향상을 달성한 결과입니다.
팩트엔비디아는 2018년 이후 총 291회의 MLPerf 벤치마크 우승을 차지했으며, 이는 다른 모든 제출 기업의 기록을 합친 것보다 9배 많은 수치입니다. 이번 6.0 버전에서도 14개의 파트너사가 엔비디아 플랫폼을 기반으로 결과를 제출했습니다.
주장현재의 벤치마크는 개별 칩의 처리량은 측정하지만 실제 응용프로그램 인터페이스(API) 환경에서의 서비스 성능을 반영하지 못한다는 지적이 있습니다. 엔비디아는 이를 보완하기 위해 실제 API 트래픽 성능을 측정하는 'MLPerf 엔드포인트' 벤치마크 도입을 추진합니다.
교차검증AMD는 DeepSeek-R1과 같은 대규모 모델에 대한 결과를 제출하지 않았으며, 일부 모델은 공식 카테고리가 아닌 오픈 카테고리로 제출했습니다. 따라서 엔비디아의 대규모 클러스터 성능과 AMD의 단일 노드 성능을 직접 대조하기에는 한계가 있습니다.
팩트AMD의 Instinct MI355X는 단일 노드 8개 GPU 구성에서 엔비디아 B200과 대등하거나 일부 시나리오에서 앞서는 성능을 보였습니다. 특히 Llama 2 70B 모델에서 이전 세대 대비 3.1배의 처리량 향상을 기록하며 단일 노드 격차를 크게 좁혔습니다.
교차검증AMD는 델 및 망고부스트와 협력하여 미국과 한국에 분산된 GPU를 연결하는 이기종 환경에서의 성능을 입증했습니다. 이는 단일 데이터센터를 넘어선 분산 컴퓨팅 환경에서의 실질적인 성능을 보여주려는 시도로 풀이됩니다.
팩트인텔은 데이터센터 중심의 경쟁에서 벗어나 워크스테이션 및 엣지 컴퓨팅 시장에 집중합니다. 인텔은 Arc Pro B70 GPU를 활용해 1,200억 개의 파라미터를 가진 모델을 구동하는 플랫폼으로서의 입지를 강조합니다.
출처더 디코더(The Decoder)의 보도 내용과 MLCommons 공식 발표 자료를 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.