AI미검

바이두 어니 5.1 출시와 사전 학습 비용 94% 절감

바이두가 새로운 대규모 언어 모델인 어니 5.1을 공개하며 사전 학습 비용을 이전 모델 대비 94% 낮췄습니다. 모델 구조 최적화와 효율적인 학습 파이프라인을 통해 성능과 경제성을 동시에 확보했습니다.

2026년 5월 11일

주장바이두는 어니 5.1을 통해 대규모 언어 모델의 사전 학습 비용을 기존 대비 94% 절감했습니다. 이는 모델 크기를 최적화하고 효율적인 학습 파이프라인을 구축한 결과입니다.

팩트어니 5.1은 이전 버전인 어니 5.0과 비교해 파라미터 수를 약 3분의 1 수준으로 설계했습니다. 쿼리당 활성 파라미터 역시 절반으로 줄어들어 연산 효율성이 크게 향상되었습니다.

팩트2026년 5월 9일 기준, 어니 5.1은 아레나 검색 리더보드에서 1,223점을 기록했습니다. 이는 전 세계 4위이자 중국 내 모델 중에서는 1위에 해당하는 성적입니다.

팩트바이두는 어니 5.1이 자율 인공지능 에이전트 작업에서 딥시크-V4-프로를 앞선다고 밝혔습니다. 또한 지식 및 추론 벤치마크에서는 구글의 제미나이 3.1 프로와 유사한 성능을 보입니다.

주장바이두는 원스-포-올 탄력적 학습 프레임워크를 도입하여 모델 크기별로 매번 사전 학습을 수행하는 비용을 제거했습니다. 하나의 학습 과정에서 다양한 크기의 모델군을 동시에 최적화하는 방식을 채택했습니다.

팩트강화 학습 인프라를 재설계하여 모델 업데이트, 응답 생성, 평가 단계를 독립적인 하위 시스템으로 분리했습니다. 이를 통해 병목 현상을 방지하고 각 단계에 최적화된 하드웨어를 할당합니다.

주장바이두는 코드, 논리, 창의성 등 여러 능력을 동시에 학습할 때 발생하는 시소 효과를 해결하기 위해 4단계 파이프라인을 도입했습니다. 각 분야별 전문가 모델을 활용하여 특정 능력이 다른 능력을 저해하지 않도록 설계했습니다.

팩트4단계 학습 과정은 일반 지도 학습으로 시작하여 전문가 모델 학습, 학생 모델의 지식 증류, 그리고 최종적인 일반 강화 학습 순으로 진행됩니다. 이 과정은 모델의 답변이 지나치게 정형화되는 현상을 방지합니다.

교차검증어니 5.1은 바이두의 플랫폼을 통해 접근 가능하지만, 모델 가중치는 공개되지 않았습니다. 따라서 외부 기관을 통한 성능 및 효율성 수치의 독립적인 검증은 불가능합니다.

출처더 디코더(The Decoder)의 보도 내용을 교차 검증했습니다. https://the-decoder.com/baidus-ernie-5-1-cuts-94-percent-of-pre-training-costs-while-competing-with-top-models/

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Trump on Iran: I deal with them. I say it to them: “You people are crazy. You are crazy. You are nuts.”

1시간 전

TELEGRAM · Clash Report

Trump on Hantavirus: This one is much harder to catch, and it’s been around for a long time. I hope it’s fine.

1시간 전

TELEGRAM · Clash Report

Trump on Iran: They are very dishonorable people, the leadership.

1시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

기업의 인공지능 도입과 성공적인 확장 전략

AI13시간 전

MRI 기반 인공지능 치매 진단 모델 개발

AI3시간 전

구글 AI 기술 고도화와 검색 사용자 행동 변화의 상관관계

마케팅7시간 전

인공지능 기반의 90일 마케팅 성장 감사 전략

마케팅7시간 전

단백질 언어 모델의 설명 가능성 확보 방안---

AI7시간 전

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-core==1.4.0

langchain-core==1.4.0

이번 릴리즈에서는 content-block-centric 스트리밍(v2) 기능이 추가되었으며, 채팅 모델 및 LLM 호출 파라미터를 추적 가능한 메타데이터에 포함시켰습니다. 또한, Pydantic v1 임포트를 최적화하고, 도구 실행 시 구조화된 입력을 보존하며, 배치 크기 유효성 검사를 강화하는 등의 다양한 버그 수정 및 개선 사항이 포함되었습니다.

5시간 전

Anthropicv0.101.0

v0.101.0

이번 릴리즈에서는 Claude Platform on AWS를 위한 AWS 클라이언트가 추가되었습니다. 또한 파일 타입 오류 메시지에 누락된 f-string 접두사가 수정되었으며, 예제 코드의 도구 실행기가 업데이트되었습니다.

7시간 전

microsoft/semantic-kerneldotnet-1.76.0

dotnet-1.76.0

이번 릴리즈에서는 .Net 버전을 1.76.0으로 업데이트하고, CloudDrivePlugin 및 OpenAPI 플러그인의 입력 유효성 검사를 강화했습니다. 또한, 도구/함수 결과에 ImageContent 지원이 추가되었으며, Kiota 패키지 및 Snappier 라이브러리의 보안 취약점을 수정했습니다.

14시간 전

vLLMv0.20.2

vLLM v0.20.2

이번 릴리즈는 DeepSeek V4, gpt-oss, Qwen3-VL에 대한 버그 수정 사항을 포함하는 작은 패치 릴리즈입니다. DeepSeek V4의 Sparse Attention 및 KV 캐시 관련 문제, gpt-oss의 MXFP4와 torch.compile 호환성 문제, Qwen3-VL의 잘못된 경계 검사 오류가 수정되었습니다.

1일 전

LangChainlangchain==1.2.18

langchain==1.2.18

langchain 1.2.18 릴리즈에서는 `create_agent` 호출 시 `ls_agent_type` 태그가 롤백되었습니다. 또한, `langchain-classic`의 `hub`, `limit loads/dumps` 기능이 사용 중단 처리되었으며, 선택적 종속성이 다시 활성화되었습니다.

3일 전

PAPERS

cs.LG

KL for a KL: 제어 변량 베이스라인을 활용한 온폴리시 증류

3일 전

cs.CV

CADTests를 활용한 Text-to-CAD 평가

3일 전

cs.CL

문법 오류 교정을 위한 LLM의 다차원적 평가

3일 전

cs.CL