MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 6월 10일 수요일

AI 시대, 당신을 더욱 스마트하게

AI검증

DeepSpeed v0.18.9, AutoTP 기능 강화

Microsoft DeepSpeed가 v0.18.9 버전을 출시하며 AutoTP 기능과 최적화 지원을 강화했습니다. 이번 업데이트는 대규모 언어 모델 학습 효율성을 높이는 데 기여할 것으로 기대됩니다.

2026년 4월 6일

팩트Microsoft DeepSpeed가 최신 버전 v0.18.9를 출시했습니다. 이번 릴리즈는 Universal Checkpoint for AutoTP 기능 추가, HuggingFace tp_plan 지원, Muon Optimizer의 ZeRO Stage 3 확장 지원 등 다양한 기능 개선을 포함하고 있습니다.

주장이번 v0.18.9 버전은 특히 AutoTP(Automatic Tensor Parallelism) 기능의 성숙도를 높이는 데 중점을 두었습니다. Universal Checkpoint 기능은 학습 중단 및 재개 시 체크포인트 관리의 유연성을 제공하며, HuggingFace 모델과의 호환성 증대는 사용자 편의성을 크게 향상시킬 것으로 보입니다.

팩트또한, PyTorch 버전 < 2.4 환경에서의 `torch.amp.custom_fwd` 호환성 문제가 해결되었으며, ROCm GPU 아키텍처 감지 시 불필요한 `shell=True` 옵션이 제거되었습니다. `$DS_IGNORE_CUDA_DETECTION` 환경 변수를 통해 로컬 GPU 감지를 무시할 수 있는 기능도 추가되었습니다.

주장ZeRO Stage 3와 Muon Optimizer의 통합은 메모리 효율성을 극대화하는 데 중요한 역할을 할 것입니다. 이는 더 큰 모델을 더 적은 GPU 자원으로 학습시킬 수 있는 가능성을 열어주며, 연구 및 개발 비용 절감에 기여할 수 있습니다.

교차검증다만, 이번 릴리즈 노트에는 새로운 기능의 성능 향상에 대한 구체적인 수치적 데이터가 명시되어 있지 않아, 실제 적용 시 어느 정도의 효율성 증대가 있을지는 추가적인 벤치마크 결과가 필요합니다. 또한, `AGENTS.md` 및 `CLAUDE.md` 파일에서 Microsoft Corporation 저작권 표시가 제거된 것은 라이선스 정책 변경과 관련된 부분으로, 관련 문서의 라이선스 조항을 면밀히 검토할 필요가 있습니다.

팩트이번 업데이트에는 AutoSP(Automatic System Parallelism)가 DeepSpeed 프로젝트로 병합되는 중요한 변화도 포함되었습니다. 이는 시스템 수준의 병렬화 전략을 DeepSpeed 프레임워크 내에서 통합 관리하려는 Microsoft의 의지를 보여줍니다.

출처자세한 변경 사항은 DeepSpeed GitHub 저장소의 릴리즈 노트 및 관련 Pull Request를 통해 확인할 수 있습니다. - 릴리즈 노트: https://github.com/deepspeedai/DeepSpeed/compare/v0.18.8...v0.18.9 - Universal Checkpoint for AutoTP: https://github.com/deepspeedai/DeepSpeed/pull/7908 - HuggingFace tp_plan support for AutoTP: https://github.com/deepspeedai/DeepSpeed/pull/7901 - Extending Muon Optimizer Support for ZeRO Stage 3: https://github.com/deepspeedai/DeepSpeed/pull/7919 - Merging AutoSP into DeepSpeed: https://github.com/deepspeedai/DeepSpeed/pull/7860

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-groq==1.1.3

langchain-groq==1.1.3

이번 릴리즈에서는 Groq 통합에 대한 Strict Mode 기능이 추가되었습니다. 또한, 모델 프로필에 새로운 필드가 추가되고, 사용량 메타데이터 토큰 추출 시 is-not-None 검사가 사용되는 등 다양한 개선 및 버그 수정이 이루어졌습니다. 일부 종속성 버전도 업데이트되었습니다.

12시간 전

LangChainlangchain==1.3.6

langchain==1.3.6

langchain 1.3.6 릴리즈에서는 요약 트리거 호환성을 유지하는 수정 사항이 포함되었습니다. 이전 버전과의 호환성을 보장하기 위한 업데이트입니다.

15시간 전

LangChainlangchain==1.3.5

langchain==1.3.5

`SummarizationMiddleware`에 AND 조건 트리거 기능이 추가되었습니다. OpenAI 관련하여 core 의존성 최소 버전이 업데이트되었고, `apply_patch` 내장 도구가 지원됩니다. 또한, pyarrow, aiohttp 등 여러 라이브러리 의존성이 업데이트되었습니다.

16시간 전

TensorRTv1.3.0rc18

v1.3.0rc18

이번 릴리즈에서는 Nemotron-H NVFP4, Qwen 이미지, Step-3.7-Flash, Cosmos3, AFMoE Trinity 등 다양한 모델 지원이 추가되었습니다. 또한, logprobs_simple_format 옵션 추가, CLI 플래그 우선순위 변경 등 API 개선이 이루어졌습니다. NIXL 및 UCX 업그레이드, DWDP 리팩토링, FlashInfer GDN 디코딩 커널 활성화, per-expert LoRA 지원 등 다양한 기능이 추가되었으며, 여러 버그 수정 및 문서 업데이트도 포함되었습니다.

16시간 전

Anthropicv0.109.1

v0.109.1

이번 릴리즈에서는 API 관련 버그 수정이 포함되었습니다. `frontier_llm`에 거부 카테고리가 추가되었습니다.

16시간 전

PAPERS