AI검증

vLLM, v0.18.1 릴리즈: 성능 및 안정성 개선

vLLM 프로젝트가 v0.18.1 패치 릴리즈를 통해 성능 최적화와 버그 수정을 완료했습니다. 이번 업데이트는 특히 SM100 MLA 프리필 백엔드 변경 및 딥젬(DeepGemm) 정확도 문제 해결에 중점을 두었습니다.

2026년 4월 6일

팩트vLLM 프로젝트가 v0.18.1 버전을 출시했습니다. 이번 릴리즈는 이전 버전인 v0.18.0에 대한 패치로, 몇 가지 중요한 이슈를 해결하는 데 초점을 맞추었습니다.

주장이번 v0.18.1 릴리즈는 vLLM의 성능과 안정성을 한 단계 끌어올릴 것으로 기대됩니다. 특히 SM100 MLA 프리필 백엔드를 TRT-LLM으로 되돌린 결정은 특정 하드웨어 환경에서의 성능 최적화를 위한 전략적인 선택으로 분석됩니다.

팩트주요 변경 사항으로는 SM100 MLA 프리필 백엔드를 TRT-LLM으로 재변경(이슈 #38562)했으며, Python 3.10 이하 버전에서 standalone_compile.FakeTensorMode의 mock.patch 해상도 실패 문제를 수정(이슈 #37158)했습니다.

팩트또한, Renormalize 라우팅을 위한 모놀리식 TRTLLM MoE 기능을 비활성화(이슈 #37605)했으며, 도커 빌드 시 누락된 FlashInfer 헤더를 사전 다운로드하도록 개선(이슈 #38391)했습니다.

팩트마지막으로, 블랙웰(Blackwell) 아키텍처에서 Qwen3.5 FP8에 대한 딥젬(DeepGemm) E8M0 정확도 저하 문제를 해결(이슈 #38083)하여 모델의 신뢰성을 높였습니다.

교차검증이번 릴리즈는 특정 하드웨어 및 소프트웨어 환경에서의 문제를 해결하는 데 집중하고 있어, 모든 사용자에게 동일한 수준의 성능 향상을 제공하지는 않을 수 있습니다. 특히 Python 버전 호환성 문제는 이전 버전 사용자에게 영향을 줄 수 있습니다.

출처프로젝트 GitHub 저장소: https://github.com/vllm-project/vLLM/releases/tag/v0.18.1

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · World News

Ship allegedly carrying stolen Ukrainian grain seen sailing away from Israel, after importer refuses to unload cargo [Read Full Article] @WorldNews #UkraineGrain #IsraelNews #ShippingControversy

2시간 전

TELEGRAM · World News

Trump says US will reduce number of troops in Germany 'a lot further' than withdrawal of 5,000 [Read Full Article] @WorldNews #USNews #TrumpGermany #Geopolitics

2시간 전

TELEGRAM · World News

Canada is weighing a social media ban for under-16s. Here is how that experiment is playing out in the first country to try it [Read Full Article] @WorldNews #CanadaNews #SocialMediaBan #Under16s

2시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

이스라엘의 레바논 남부 강제 이주 명령 확대와 작전 범위 확장

국제18시간 전

이스라엘, 미국산 F-35 및 F-15IA 전투기 추가 도입 승인

국제14시간 전

자석 부착형 초소형 전자책 단말기 Xteink X3의 특징과 한계

AI14시간 전

미국 인공지능 표준 혁신 센터의 중국 AI 기술 격차 평가

AI18시간 전

루이스 데 귄도스 ECB 부총재의 유럽 경제 전략적 자립 강조

경제20시간 전

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-anthropic==1.4.3

langchain-anthropic==1.4.3

이번 릴리즈에서는 Anthropic 관련 기능이 1.4.3 버전으로 업데이트되었습니다. 또한, `create_agent`로의 이전 경고 대상 재지정 및 기타 내부 정리 작업이 포함되었습니다. 문서의 X 핸들 참조 업데이트와 Anthropic 관련 HTTPX 최종 처리기 보호 기능도 개선되었습니다.

11시간 전

LangChainlangchain-classic==1.0.5

langchain-classic==1.0.5

langchain-classic 1.0.5 릴리즈에서는 `create_agent`로의 마이그레이션을 위한 경고 메시지 수정 및 기타 정리 작업이 포함되었습니다. 또한, 일부 의존성 버전이 업데이트되었으며, 코어 라이브러리의 최소 버전이 상향 조정되었습니다.

11시간 전

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

20시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

2일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

2일 전

PAPERS

cs.AI

좋은 터미널 에이전트 벤치마크 과제란 무엇인가: 적대적이고 어렵고 명확한 평가 설계를 위한 가이드라인

4일 전

cs.CV

PRISM: 멀티모달 강화 학습을 위한 블랙박스 온폴리시 증류 기반 사전 정렬

4일 전

cs.AI

발현된 정렬 불량 페르소나의 일관성 특성화

4일 전

cs.AI