AI검증

엔비디아, 네모트론 확산 언어 모델 공개 및 추론 효율 개선

엔비디아가 기존 자기회귀 방식의 한계를 극복한 네모트론 확산 언어 모델을 공개했습니다. 이 모델은 추론 속도를 최대 6.4배까지 높이고 정확도를 개선했습니다. 개발자는 배포 시점에 원하는 추론 모드를 선택해 사용할 수 있습니다.

2026년 5월 23일

주장기존 자기회귀 방식 언어 모델은 토큰을 하나씩 순차적으로 생성하므로 그래픽 처리 장치 성능을 온전히 활용하기 어렵습니다. 엔비디아는 이러한 병목 현상을 해결하고자 여러 토큰을 동시에 생성하고 다단계로 정제하는 확산 언어 모델을 제안합니다.

팩트네모트론 확산 모델은 3B, 8B, 14B 규모의 텍스트 모델과 8B 규모의 시각-언어 모델로 구성됩니다. 해당 모델들은 엔비디아 네모트론 오픈 모델 라이선스 및 소스 코드 라이선스 아래 공개되었습니다.

교차검증과거 확산 언어 모델은 자기회귀 모델보다 정확도가 낮고 학습이 어렵다는 한계가 있었습니다. 엔비디아는 기존 자기회귀 모델을 기반으로 추가 학습을 진행하여 이러한 기술적 장벽을 극복했습니다.

팩트네모트론 확산 8B 모델은 기존 큐웬3 8B 모델 대비 평균 정확도가 1.2% 향상되었습니다. 추론 속도 면에서 확산 모드는 기존 자기회귀 모델보다 2.6배 높은 효율을 보이며, 자기 추측 모드에서는 최대 6.4배까지 속도가 빨라집니다.

주장이 모델은 자기회귀와 확산 생성 방식을 하나의 모델에서 통합적으로 지원합니다. 개발자는 애플리케이션 수준의 큰 변경 없이 배포 시점에 원하는 추론 모드를 선택하여 사용합니다.

팩트모델은 1조 3000억 개의 토큰으로 구성된 네모트론 사전 학습 데이터셋으로 학습되었습니다. 이후 450억 개의 토큰을 포함한 사후 학습 데이터셋을 사용하여 지도 미세 조정 과정을 거쳤습니다.

팩트네모트론 확산 모델은 자기회귀 모드, 확산 모드, 자기 추측 모드라는 세 가지 생성 방식을 제공합니다. 특히 자기 추측 모드는 확산 방식으로 초안을 작성하고 자기회귀 방식으로 검증하여 속도와 신뢰성을 동시에 확보합니다.

교차검증확산 모델은 토큰을 블록 단위로 생성하고 반복적으로 정제하는 과정을 거칩니다. 사용자는 정제 단계 횟수를 조절함으로써 추론 비용과 연산 자원을 유연하게 제어합니다.

팩트엔비디아는 모델 학습을 위한 코드와 레시피를 메가트론 브리지 프레임워크를 통해 공개했습니다. 또한 에스지랭을 통해 해당 모델들을 쉽게 배포하고 서비스할 수 있도록 지원합니다.

출처엔비디아 네모트론 기술 보고서 및 허깅페이스 공식 블로그를 교차 검증했습니다.

주제

엔비디아

관련 콘텐츠

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Syrian President Ahmad al-Sharaa: We should never be forced to choose between Israeli ambitions and Iranian ambitions in the region. The region itself must have its own independent policy and its own independent identity.

7시간 전

TELEGRAM · Clash Report

Syrian President Ahmad al-Sharaa: In its natural course, a national renaissance takes about 20 to 25 years before its full results become visible. When we talk about Singapore, Rwanda today, Türkiye, or even the Gulf Cooperation Council countries—every country that has achieved this kind of success took time. It took around 20 to 25 years. But that doesn't mean we have to wait 20 years before we see change in Syria. What matters is that the trajectory is upward. Progress should become visibl

7시간 전

TELEGRAM · Clash Report

Syrian President Ahmad al-Sharaa: Let's distinguish between the SDF and the Kurdish people. The Kurdish community is a large community spread across Syria; it is not confined to one specific area. A segment of the Kurdish population had been denied Syrian citizenship under the previous regime. This is an old issue that we inherited, but we were determined to resolve it. We issued a decree granting citizenship and nationality rights, and many have already received them. Their cultural rights

7시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

루마니아의 러시아 드론 격추 및 외교적 항의

국제13시간 전

오픈에이아이의 허깅페이스 시스템 침해와 투명성 요구

AI13시간 전

오픈에이아이 지피티-5 모델의 생화학 무기 정보 제공 논란

AI19시간 전

런던 창업자 주거 공간 리프트 하우스의 새로운 생태계 모델

경제13시간 전

앤스로픽 클로드 오퍼스 5의 ARC-AGI-3 벤치마크 신기록 달성

AI19시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.26.0

v0.26.0 릴리즈

이번 릴리즈에서는 Inkling 모델 제품군 지원, DeepSeek-V4 성능 향상, fp32 `lm_head` 지원 추가, 유연한 어텐션 백엔드, KV 오프로딩 및 계층형 보조 스토리지 기능 강화 등 다양한 업데이트가 포함되었습니다. 또한 Rust 프론트엔드 기능 확장 및 Transformers 5.13.0 지원이 추가되었습니다.

1일 전

LangChainlangchain-anthropic==1.5.2

langchain-anthropic==1.5.2

Claude Opus 5 모델 지원이 추가되었습니다. 이번 릴리즈는 이전 버전인 langchain-anthropic==1.5.1 이후의 변경 사항을 포함합니다.

2일 전

Anthropicv0.120.0

v0.120.0

이번 릴리즈에서는 claude-opus-5 모델이 추가되었습니다. 또한, 도구 추가/제거 블록 및 tool_change 이벤트가 지원되며, 클라이언트 측 대체 크레딧 토큰 유형이 확장되고 서버 측 대체 기본 옵션이 추가되었습니다.

2일 전

LangChainlangchain-openai==1.4.1

langchain-openai==1.4.1

이번 릴리즈에서는 LangSmith 게이트웨이를 환경 변수를 통해 지원하도록 기능이 추가되었습니다. 또한 `gpt-5.3-chat-latest` 프로필이 수정되었습니다.