MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 5월 4일 월요일

전문가의 AI 하이브리드 리서치 랩

AI검증

DeepSpeed v0.18.9, AutoTP 기능 강화

Microsoft DeepSpeed가 v0.18.9 버전을 출시하며 AutoTP 기능과 최적화 지원을 강화했습니다. 이번 업데이트는 대규모 언어 모델 학습 효율성을 높이는 데 기여할 것으로 기대됩니다.

2026년 4월 6일

팩트Microsoft DeepSpeed가 최신 버전 v0.18.9를 출시했습니다. 이번 릴리즈는 Universal Checkpoint for AutoTP 기능 추가, HuggingFace tp_plan 지원, Muon Optimizer의 ZeRO Stage 3 확장 지원 등 다양한 기능 개선을 포함하고 있습니다.

주장이번 v0.18.9 버전은 특히 AutoTP(Automatic Tensor Parallelism) 기능의 성숙도를 높이는 데 중점을 두었습니다. Universal Checkpoint 기능은 학습 중단 및 재개 시 체크포인트 관리의 유연성을 제공하며, HuggingFace 모델과의 호환성 증대는 사용자 편의성을 크게 향상시킬 것으로 보입니다.

팩트또한, PyTorch 버전 < 2.4 환경에서의 `torch.amp.custom_fwd` 호환성 문제가 해결되었으며, ROCm GPU 아키텍처 감지 시 불필요한 `shell=True` 옵션이 제거되었습니다. `$DS_IGNORE_CUDA_DETECTION` 환경 변수를 통해 로컬 GPU 감지를 무시할 수 있는 기능도 추가되었습니다.

주장ZeRO Stage 3와 Muon Optimizer의 통합은 메모리 효율성을 극대화하는 데 중요한 역할을 할 것입니다. 이는 더 큰 모델을 더 적은 GPU 자원으로 학습시킬 수 있는 가능성을 열어주며, 연구 및 개발 비용 절감에 기여할 수 있습니다.

교차검증다만, 이번 릴리즈 노트에는 새로운 기능의 성능 향상에 대한 구체적인 수치적 데이터가 명시되어 있지 않아, 실제 적용 시 어느 정도의 효율성 증대가 있을지는 추가적인 벤치마크 결과가 필요합니다. 또한, `AGENTS.md` 및 `CLAUDE.md` 파일에서 Microsoft Corporation 저작권 표시가 제거된 것은 라이선스 정책 변경과 관련된 부분으로, 관련 문서의 라이선스 조항을 면밀히 검토할 필요가 있습니다.

팩트이번 업데이트에는 AutoSP(Automatic System Parallelism)가 DeepSpeed 프로젝트로 병합되는 중요한 변화도 포함되었습니다. 이는 시스템 수준의 병렬화 전략을 DeepSpeed 프레임워크 내에서 통합 관리하려는 Microsoft의 의지를 보여줍니다.

출처자세한 변경 사항은 DeepSpeed GitHub 저장소의 릴리즈 노트 및 관련 Pull Request를 통해 확인할 수 있습니다. - 릴리즈 노트: https://github.com/deepspeedai/DeepSpeed/compare/v0.18.8...v0.18.9 - Universal Checkpoint for AutoTP: https://github.com/deepspeedai/DeepSpeed/pull/7908 - HuggingFace tp_plan support for AutoTP: https://github.com/deepspeedai/DeepSpeed/pull/7901 - Extending Muon Optimizer Support for ZeRO Stage 3: https://github.com/deepspeedai/DeepSpeed/pull/7919 - Merging AutoSP into DeepSpeed: https://github.com/deepspeedai/DeepSpeed/pull/7860

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-anthropic==1.4.3

langchain-anthropic==1.4.3

이번 릴리즈에서는 Anthropic 관련 기능이 1.4.3 버전으로 업데이트되었습니다. 또한, `create_agent`로의 이전 경고 대상 재지정 및 기타 내부 정리 작업이 포함되었습니다. 문서의 X 핸들 참조 업데이트와 Anthropic 관련 HTTPX 최종 처리기 보호 기능도 개선되었습니다.

11시간 전

LangChainlangchain-classic==1.0.5

langchain-classic==1.0.5

langchain-classic 1.0.5 릴리즈에서는 `create_agent`로의 마이그레이션을 위한 경고 메시지 수정 및 기타 정리 작업이 포함되었습니다. 또한, 일부 의존성 버전이 업데이트되었으며, 코어 라이브러리의 최소 버전이 상향 조정되었습니다.

11시간 전

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

20시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

2일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

2일 전

PAPERS