AI검증

IBM Granite 4.1 모델의 데이터 큐레이션 기반 성능 최적화

IBM이 데이터 품질을 높여 소형 모델의 효율성을 극대화한 Granite 4.1을 공개했습니다. 15조 개의 토큰을 활용한 다단계 학습과 엄격한 품질 관리를 통해 기업용 인공지능 환경에 최적화했습니다.

2026년 5월 1일

주장IBM의 Granite 4.1 모델은 매개변수 규모를 무작정 늘리는 대신 데이터 큐레이션의 질적 향상에 집중합니다. 이는 기업용 인공지능 환경에서 효율성과 성능을 동시에 확보하려는 전략적 선택입니다.

팩트Granite 4.1은 3B, 8B, 30B 크기의 디코더 전용 밀집 모델로 구성됩니다. 이 모델들은 약 15조 개의 토큰을 학습하며 5단계의 다단계 사전 학습 과정을 거칩니다.

팩트모델 아키텍처는 GQA, RoPE, SwiGLU 활성화 함수, RMSNorm을 채택하여 설계되었습니다. 8B 인스트럭트 모델은 이전 버전인 32B MoE 모델과 대등하거나 더 뛰어난 성능을 보입니다.

팩트사전 학습은 5단계로 나뉘며 1~2단계는 기초 학습, 3~4단계는 고품질 데이터 어닐링, 5단계는 긴 문맥 학습으로 진행됩니다. 1단계에서는 일반 웹 데이터가 59%를 차지하지만, 이후 단계로 갈수록 수학, 코드, 합성 데이터의 비중이 증가합니다.

교차검증512K 토큰에 달하는 긴 문맥 처리 능력을 확보하기 위해 단계별 확장 과정을 거칩니다. 이 과정에서 짧은 문맥 성능 저하를 막고자 각 단계마다 모델 병합을 수행하는 기술적 보완책을 적용합니다.

주장지도 미세 조정 단계에서는 LLM-as-Judge 프레임워크를 도입하여 데이터 품질을 엄격하게 관리합니다. 이는 모델이 환각 현상을 일으키거나 잘못된 정보를 생성하는 것을 방지하는 핵심 품질 통제 과정입니다.

팩트지도 미세 조정 데이터는 구조적, 의미적, 행동적 기준에 따라 평가됩니다. 환각이나 잘못된 계산이 포함된 데이터는 점수와 관계없이 즉시 제거하며 검색 증강 생성 환경에서의 답변이 검색된 문맥에 근거하는지 확인하는 검증 절차도 포함합니다.

팩트모든 Granite 4.1 모델은 아파치 2.0 라이선스로 배포되어 기업이 자유롭게 활용할 수 있습니다. 이는 오픈 소스 생태계 내에서 IBM의 영향력을 확대하려는 의도입니다.

교차검증모델 성능은 RULER 벤치마크를 통해 검증되었으며 30B 모델의 경우 128K 문맥에서 76.7점을 기록했습니다. 다만 모델 크기가 작을수록 긴 문맥 처리 시 성능 하락폭이 존재하므로 용도에 맞는 모델 선택이 필요합니다.

출처허깅페이스 공식 블로그 및 IBM Granite 팀 기술 문서를 교차 검증했습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

글로벌 인텔리전스

전체보기 →

SCMP

Why Hong Kong subsidies should go towards food, not fuel — Hong Kong should not renew the HK$3 per litre diesel subsidy when it expires at the end of June. Instead, it should use the funds to launch a crash programme to accelerate electrification of public transport, starting with the minibus fleet. The crisis in the Middle East has had a serious impact on

56분 전

SCMP

Gaza flotilla activists detained by Israel face ‘extreme brutality’ — Two foreign activists from a Gaza-bound flotilla who were brought to Israel for interrogation appeared before an Israeli court on Sunday, according to the rights group defending them. The flotilla of more than 50 vessels had set sail from France, Spain and Italy with the aim of breaking an Israeli b

56분 전

SCMP

60% of Hong Kong’s homeless plan to cut medical visits amid higher fees: survey — Nearly 60 per cent of homeless residents in Hong Kong plan to reduce medical visits in response to higher public medical fees introduced this year, a non-governmental organisation survey has found, with advocates urging authorities to introduce automatic waivers and simplify subsidy application proc

56분 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

AI 받아쓰기 앱 8종 기능 및 요금 정책 비교

AI15시간 전

예멘 해안 유조선 유레카호 피랍 및 소말리아 이동

국제15시간 전

미국 정치 양극화와 정보 환경의 위기

국제15시간 전

유럽의 기술 주권 이끄는 유망 스타트업 21선 선정

경제15시간 전

음성·폐 신호 통합 분석 하이브리드 AI 모델 개발

AI15시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

2시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

1일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

1일 전

meta-llama/llama-stackv0.8.0

v0.8.0

이번 릴리즈에서는 Anthropic Messages API를 네이티브로 지원하며, 대화 압축 기능이 추가되었습니다. 또한, 기존 Eval API 및 관련 API가 제거되었고, 문서 전반에 걸쳐 UX 개선 및 최적화가 이루어졌습니다. 보안 취약점 수정 및 CI/CD 파이프라인 개선 작업도 포함되었습니다.

1일 전

LangChainlangchain==1.3.0a1

langchain v1.3.0a1

이번 릴리즈에서는 `create_agent`에 `stream_events` 기능이 추가되었으며, HITL 미들웨어에 `respond` 결정 기능이 포함되었습니다. 또한, 에이전트 상태를 도구 디스패치에 인라인하는 것을 중단하여 성능을 개선했습니다.

1일 전

PAPERS

cs.AI

좋은 터미널 에이전트 벤치마크 과제란 무엇인가: 적대적이고 어렵고 명확한 평가 설계를 위한 가이드라인

3일 전

cs.CV

PRISM: 멀티모달 강화 학습을 위한 블랙박스 온폴리시 증류 기반 사전 정렬

3일 전