엔비디아의 코스모스 3 및 네모트론 3 울트라 공개와 AI 생태계 전략
엔비디아가 물리 AI와 대규모 언어 모델을 결합한 새로운 모델들을 발표했습니다. 이번 공개는 단순한 모델 제공을 넘어 풀스택 전략을 통해 AI 에이전트 시장을 선점하려는 의도로 풀이됩니다.
주장엔비디아는 코스모스 3를 통해 언어와 이미지, 비디오, 오디오, 행동을 통합한 물리 인공지능 생태계를 구축합니다. 이번 발표는 가중치와 코드, 데이터셋, 미세 조정 레시피를 모두 포함한 풀스택 전략을 지향합니다.
팩트코스모스 3는 16B 나노 모델과 64B 슈퍼 모델로 구성됩니다. 이 모델은 추론 타워와 생성 타워를 결합한 혼합 트랜스포머 구조를 채택했습니다. 현재 텍스트-이미지 및 이미지-비디오 오픈 모델 리더보드에서 1위를 기록했습니다.
팩트대만 컴퓨텍스에서 공개된 네모트론 3 울트라는 550B 파라미터를 갖춘 오픈 가중치 대규모 언어 모델입니다. 해당 모델은 초당 300토큰 이상의 추론 속도를 보이며 미국 내 오픈 모델 중 가장 높은 성능을 보입니다.
주장엔비디아는 RTX 스파크 슈퍼칩을 통해 개인용 컴퓨터 시장에서 인공지능 에이전트 구동을 가속화합니다. 마이크로소프트 등 협력사와 함께 슬림 노트북 환경에서도 고성능 인공지능을 구현하는 새로운 기기 분류를 제시합니다.
교차검증네모트론 3 울트라는 딥시크나 키미 모델보다 활성 파라미터 비율이 약 10% 높습니다. 이는 모델의 경제성과 동작 방식에서 차별점을 보이며, 성능과 효율성 사이의 균형을 맞추려는 기술적 선택으로 분석됩니다.
팩트미니맥스 M3 모델은 100만 토큰의 컨텍스트 윈도우와 네이티브 멀티모달 기능을 갖추고 출시되었습니다. 이 모델은 에스더블유이-벤치 프로에서 59.0%의 성능을 기록하며 에이전트 모델 분야에서 생태계 채택을 확대합니다.
교차검증미니맥스 M3는 벤치마크 성능은 우수하지만, 실제 사용 환경에서 높은 토큰 소비량과 반복적인 자기 점검 루프 문제가 보고되었습니다. 이는 현재 모델들이 효율성보다 품질을 우선시한다는 점을 시사합니다.
팩트알리바바의 큐웬 3.7-플러스는 그래픽 사용자 인터페이스와 명령 줄 인터페이스를 통합한 하이브리드 에이전트입니다. 이 모델은 시각적 추론과 코딩, 검색 증강 질의응답을 지원합니다.
팩트제트브레인의 멜룸 2는 12B 혼합 전문가 구조로 개발자 워크플로우를 위한 초저지연 추론에 최적화되었습니다.
주장인공지능 산업의 중심이 단순 모델 호출에서 에이전트 런타임으로 이동합니다. 퍼플렉시티의 검색 코드화 사례처럼 모델이 직접 소프트웨어 개발 키트를 활용해 파이프라인을 구성하는 방식이 엔지니어링의 핵심으로 부상했습니다.
교차검증거대한 컨텍스트 윈도우에도 불구하고 세션 간 기억력 문제는 여전히 해결되지 않은 과제로 남았습니다. 검색 증강 생성과 수동 컨텍스트 주입만으로는 지속적인 세션 지식을 관리하는 데 한계가 있다는 지적이 이어집니다.
출처레이턴트 스페이스의 인공지능 뉴스 보도를 교차 검증했습니다. (https://www.latent.space/p/ainews-nvidia-cosmos-3-nemotron-3)
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

