AI미검

엔비디아의 코스모스 3 및 네모트론 3 울트라 공개와 AI 생태계 전략

엔비디아가 물리 AI와 대규모 언어 모델을 결합한 새로운 모델들을 발표했습니다. 이번 공개는 단순한 모델 제공을 넘어 풀스택 전략을 통해 AI 에이전트 시장을 선점하려는 의도로 풀이됩니다.

2026년 6월 2일

주장엔비디아는 코스모스 3를 통해 언어와 이미지, 비디오, 오디오, 행동을 통합한 물리 인공지능 생태계를 구축합니다. 이번 발표는 가중치와 코드, 데이터셋, 미세 조정 레시피를 모두 포함한 풀스택 전략을 지향합니다.

팩트코스모스 3는 16B 나노 모델과 64B 슈퍼 모델로 구성됩니다. 이 모델은 추론 타워와 생성 타워를 결합한 혼합 트랜스포머 구조를 채택했습니다. 현재 텍스트-이미지 및 이미지-비디오 오픈 모델 리더보드에서 1위를 기록했습니다.

팩트대만 컴퓨텍스에서 공개된 네모트론 3 울트라는 550B 파라미터를 갖춘 오픈 가중치 대규모 언어 모델입니다. 해당 모델은 초당 300토큰 이상의 추론 속도를 보이며 미국 내 오픈 모델 중 가장 높은 성능을 보입니다.

주장엔비디아는 RTX 스파크 슈퍼칩을 통해 개인용 컴퓨터 시장에서 인공지능 에이전트 구동을 가속화합니다. 마이크로소프트 등 협력사와 함께 슬림 노트북 환경에서도 고성능 인공지능을 구현하는 새로운 기기 분류를 제시합니다.

교차검증네모트론 3 울트라는 딥시크나 키미 모델보다 활성 파라미터 비율이 약 10% 높습니다. 이는 모델의 경제성과 동작 방식에서 차별점을 보이며, 성능과 효율성 사이의 균형을 맞추려는 기술적 선택으로 분석됩니다.

팩트미니맥스 M3 모델은 100만 토큰의 컨텍스트 윈도우와 네이티브 멀티모달 기능을 갖추고 출시되었습니다. 이 모델은 에스더블유이-벤치 프로에서 59.0%의 성능을 기록하며 에이전트 모델 분야에서 생태계 채택을 확대합니다.

교차검증미니맥스 M3는 벤치마크 성능은 우수하지만, 실제 사용 환경에서 높은 토큰 소비량과 반복적인 자기 점검 루프 문제가 보고되었습니다. 이는 현재 모델들이 효율성보다 품질을 우선시한다는 점을 시사합니다.

팩트알리바바의 큐웬 3.7-플러스는 그래픽 사용자 인터페이스와 명령 줄 인터페이스를 통합한 하이브리드 에이전트입니다. 이 모델은 시각적 추론과 코딩, 검색 증강 질의응답을 지원합니다.

팩트제트브레인의 멜룸 2는 12B 혼합 전문가 구조로 개발자 워크플로우를 위한 초저지연 추론에 최적화되었습니다.

주장인공지능 산업의 중심이 단순 모델 호출에서 에이전트 런타임으로 이동합니다. 퍼플렉시티의 검색 코드화 사례처럼 모델이 직접 소프트웨어 개발 키트를 활용해 파이프라인을 구성하는 방식이 엔지니어링의 핵심으로 부상했습니다.

교차검증거대한 컨텍스트 윈도우에도 불구하고 세션 간 기억력 문제는 여전히 해결되지 않은 과제로 남았습니다. 검색 증강 생성과 수동 컨텍스트 주입만으로는 지속적인 세션 지식을 관리하는 데 한계가 있다는 지적이 이어집니다.

출처레이턴트 스페이스의 인공지능 뉴스 보도를 교차 검증했습니다. (https://www.latent.space/p/ainews-nvidia-cosmos-3-nemotron-3)

주제

AI 에이전트 LLM 엔비디아

관련 콘텐츠

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

SCMP

UK PM Burnham to welcome Ukraine’s Zelensky in first foreign leader visit — Britain’s Prime Minister Andy Burnham will on Monday host Ukrainian President Volodymyr Zelensky as his first foreign leader since taking office a week ago, to underline London’s “unwavering support” for Kyiv. The pair are set to visit a British naval base and hear from both countries’ armed forces

3시간 전

SCMP

Nobel laureate Simon Johnson on the AI race and China’s ‘over-automation’ problem — Simon Johnson is a professor of entrepreneurship at the Massachusetts Institute of Technology (MIT). A former chief economist of the International Monetary Fund (IMF), he won a joint Nobel Prize for economics in 2024 for his research into how institutions shape national prosperity. On June 8, the Br

3시간 전

SCMP

US border tsar says vetting of ICE officer is under internal review after Maine shooting — US President Donald Trump’s border tsar said on Sunday that the vetting of an immigration officer involved in the deadly shooting of a Colombian native in Maine is under internal review after relatives revealed to Associated Press that he had a history of serious mental health struggles and violent

3시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

루마니아의 러시아 드론 격추 및 외교적 항의

국제6시간 전

먼데이닷컴 등 기술 기업의 인공지능 전환에 따른 대규모 인력 감축

경제22시간 전

오픈에이아이의 허깅페이스 시스템 침해와 투명성 요구

AI6시간 전

앤스로픽 클로드 오퍼스 5의 ARC-AGI-3 벤치마크 신기록 달성

AI12시간 전

오픈에이아이 지피티-5 모델의 생화학 무기 정보 제공 논란

AI12시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.26.0

v0.26.0 릴리즈

이번 릴리즈에서는 Inkling 모델 제품군 지원, DeepSeek-V4 성능 향상, fp32 `lm_head` 지원 추가, 유연한 어텐션 백엔드, KV 오프로딩 및 계층형 보조 스토리지 기능 강화 등 다양한 업데이트가 포함되었습니다. 또한 Rust 프론트엔드 기능 확장 및 Transformers 5.13.0 지원이 추가되었습니다.

1일 전

LangChainlangchain-anthropic==1.5.2

langchain-anthropic==1.5.2

Claude Opus 5 모델 지원이 추가되었습니다. 이번 릴리즈는 이전 버전인 langchain-anthropic==1.5.1 이후의 변경 사항을 포함합니다.

2일 전

Anthropicv0.120.0

v0.120.0

이번 릴리즈에서는 claude-opus-5 모델이 추가되었습니다. 또한, 도구 추가/제거 블록 및 tool_change 이벤트가 지원되며, 클라이언트 측 대체 크레딧 토큰 유형이 확장되고 서버 측 대체 기본 옵션이 추가되었습니다.

2일 전

LangChainlangchain-openai==1.4.1

langchain-openai==1.4.1

이번 릴리즈에서는 LangSmith 게이트웨이를 환경 변수를 통해 지원하도록 기능이 추가되었습니다. 또한 `gpt-5.3-chat-latest` 프로필이 수정되었습니다.