AI검증

IBM, 32K 컨텍스트 Granite 임베딩 R2 출시

IBM은 다국어 임베딩 모델의 고질적인 문제인 모델 크기와 언어 커버리지 사이의 균형을 해결하고자 Granite Embedding Multilingual R2를 출시했습니다. 이 모델은 기업 환경에서 즉시 사용 가능한 성능과 효율성을 제공하며, 최대 32,768 토큰의 컨텍스트 길이를 지원합니다. Apache 2.0 라이선스로 배포되어 상업적 이용이 가능합니다.

2026년 5월 14일

팩트IBM은 기업용 다국어 임베딩 모델인 Granite Embedding Multilingual R2를 공개했습니다. 이 모델은 311M 파라미터의 풀사이즈 모델과 97M 파라미터의 경량 모델 두 가지로 구성됩니다. 두 모델 모두 200개 이상의 언어를 지원하며, 최대 32,768 토큰의 컨텍스트 길이를 처리할 수 있습니다.

팩트97M 파라미터 경량 모델은 MTEB 다국어 검색 벤치마크에서 60.3점을 기록했습니다. 이 점수는 100M 이하의 오픈소스 다국어 임베딩 모델 중 가장 높은 수치입니다. 기존 모델 대비 9.4점 향상된 성능을 보였습니다.

팩트311M 파라미터 모델은 MTEB 다국어 검색 벤치마크에서 65.2점을 기록했습니다. 이 성적은 500M 이하 파라미터 모델 중 전체 2위에 해당합니다.

교차검증기존 R1 모델은 XLM-RoBERTa 인코더를 기반으로 512 토큰의 제한된 컨텍스트 윈도우를 가졌습니다. 반면 R2 모델은 ModernBERT 아키텍처로 완전히 재설계하여 긴 문맥 처리와 연산 효율성을 대폭 개선했습니다.

주장IBM은 Granite Embedding Multilingual R2 모델을 기업 환경에서 즉시 사용 가능한 수준의 성능과 효율성을 제공하고자 개발했습니다. 이 모델은 Apache 2.0 라이선스로 배포되어 상업적 이용이 가능합니다.

주장기업용 배포를 위해 IBM은 데이터 거버넌스를 엄격히 적용했습니다. MS-MARCO와 같은 비상업적 라이선스 제한이 있는 데이터셋을 배제했습니다. IBM이 직접 큐레이션한 GneissWeb 데이터를 사용하여 법적 리스크를 최소화했습니다.

팩트이 모델은 LangChain, LlamaIndex, Haystack 등 주요 프레임워크와 호환됩니다. 따라서 코드 수정 없이 즉시 교체하여 사용할 수 있습니다.

팩트모델은 한국어를 포함한 52개 언어에 대해 집중적인 검색 쌍 및 교차 언어 학습을 수행했습니다. 또한 파이썬, 자바, SQL 등 9개 프로그래밍 언어에 대한 코드 검색 기능도 포함합니다.

팩트311M 모델은 22개 층의 ModernBERT 인코더와 262K 토큰의 어휘 사전을 사용합니다. 지식 증류 기법을 통해 Granite 3.3 Instruct 및 Mistral v0.2 모델로부터 검색 관련 지식을 성공적으로 전수받았습니다.

출처IBM의 공식 블로그 게시물(https://huggingface.co/blog/ibm-granite/granite-embedding-multilingual-r2)을 교차 검증했습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Trump leaves Beijing after two days of summit talks with Xi.

1시간 전

TELEGRAM · Clash Report

Boeing shares fell 4% after Trump said China agreed to buy 200 Boeing jets — far below expectations of a possible 500-plane deal discussed before his meeting with Xi Jinping. Investors reacted negatively as details of the order remain unclear. Source: Reuters

1시간 전

TELEGRAM · Clash Report

Putin is expected to visit Beijing on May 20, just days after Xi Jinping’s summit with Trump. The one-day trip will be a routine visit without major ceremonies. Source: SCMP

1시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

오픈AI, 오픈소스 공급망 공격으로 인한 내부 데이터 일부 유출

AI18시간 전

구글 애널리틱스 4, 생성형 AI 트래픽 자동 분류 도입

마케팅18시간 전

스페이스엑스AI 합병 이후 핵심 인력 대거 이탈

AI13시간 전

베트남 전쟁 실종자 수색 및 유해 신원 확인 확대

국제13시간 전

현대 노동 시장의 경력 성장과 직무 이동 전략

경제15시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.21.0

v0.21.0

이번 릴리즈에서는 Transformers v4 지원이 공식적으로 중단되었으며, C++20 컴파일러가 빌드 요구사항으로 추가되었습니다. KV 오프로딩 서브시스템이 하이브리드 메모리 할당기(HMA)와 통합되었고, 추론 모델을 위한 스페큘러티브 디코딩의 'thinking budget' 지원이 개선되었습니다. 또한 NVIDIA Blackwell GPU를 위한 새로운 TOKENSPEED_MLA 백엔드가 추가되었습니다.

3시간 전

openai/tiktoken0.13.0

(없음)

내용 없음

7시간 전

microsoft/semantic-kernelpython-1.42.0

python-1.42.0

이번 릴리즈에서는 Python 패키지 버전이 1.42.0으로 업데이트되었습니다. 또한, Microsoft Agent Framework 후속 호출에 대한 문서가 추가되었으며, 여러 종속성 패키지들이 업데이트되었습니다. Azure AI Search 커넥터의 비공개 속성 접근이 중단되었고, OpenAPI 경로 매개변수 퍼센트 인코딩 및 HttpPlugin 요청 유효성 검사가 개선되었습니다.

1일 전

meta-llama/llama-stackv1.0.2

v1.0.2

UI 잠금 파일에서 ogx-client가 ^1.0.1로 업데이트되었습니다. 또한, 임시 이벤트 루프 초기화 후 SQL 엔진이 재설정되는 수정 사항이 포함되었습니다.

1일 전

Anthropicv0.102.0

v0.102.0

이번 릴리즈에서는 BetaManagedAgentsSearchResultBlock 타입과 캐시 진단 베타 지원이 추가되었습니다. 또한 Pydantic 이터레이터의 조기 검증을 지원하며, API 사양 업데이트가 포함되었습니다.

1일 전

PAPERS

cs.LG

FutureSim: 적응형 에이전트 평가를 위한 세계 이벤트 재현