MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 5월 3일 일요일

전문가의 AI 하이브리드 리서치 랩

AI검증

IBM, 기업용 문서 이해 특화 Granite 4.0 3B Vision 공개

IBM이 기업의 복잡한 문서와 차트를 정밀하게 분석하는 경량 모델 Granite 4.0 3B Vision을 발표했습니다. 이 모델은 모듈형 구조와 특화 데이터셋을 통해 기업 현장에서 효율적인 문서 처리 자동화를 지원합니다.

2026년 3월 31일

주장IBM은 기업의 복잡한 문서와 차트를 정확하게 이해하고 정보를 추출하기 위해 Granite 4.0 3B Vision 모델을 개발했습니다. 이 모델은 경량화된 구조를 통해 기업 현장에서 실용적이고 효율적인 문서 처리를 지원합니다.

팩트Granite 4.0 3B Vision은 2026년 3월 31일에 발표되었습니다. 이 모델은 30억 개의 파라미터를 가진 소형 모델로, 기업용 문서 이해를 목적으로 설계되었습니다.

팩트주요 기능은 복잡한 표 구조를 분석하는 표 추출, 차트를 기계가 읽을 수 있는 형식으로 변환하는 차트 이해, 문서 내 의미 있는 키-값 쌍을 식별하는 키-값 쌍 추출입니다. 이 모델은 Granite 4.0 마이크로 모델에 저순위 적응 기법인 로라 어댑터를 적용한 모듈형 구조를 채택했습니다.

팩트모델 성능 향상을 위해 170만 개의 차트 샘플로 구성된 차트넷 데이터셋을 구축했습니다. 이 데이터셋은 코드 기반 합성 파이프라인으로 생성되었으며, 24가지 차트 유형과 6개의 플로팅 라이브러리를 포함합니다.

팩트딥스택 아키텍처를 도입하여 시각적 특징을 계층적으로 주입합니다. 추상적인 시각 정보는 초기 레이어에, 고해상도 공간 정보는 후기 레이어에 전달하여 문서 내 위치와 내용을 동시에 파악합니다.

교차검증기존 멀티모달 모델은 시각적 패턴과 수치 데이터, 자연어를 동시에 추론하는 작업에서 한계를 보였습니다. 특히 선 그래프의 정확한 값을 읽는 등 공간적 정밀도가 필요한 작업에서 성능 저하가 발생했습니다.

팩트성능 평가 결과, 차트 투 서머리 벤치마크에서 86.4%의 점수를 기록하며 더 큰 규모의 모델들을 능가했습니다. 표 추출 성능을 측정하는 펍테이블스V2 벤치마크에서도 크롭된 표와 전체 페이지 문서 모두에서 최고 수준의 텍스트 편집 거리 기반 유사도 점수를 달성했습니다.

팩트미국 정부 문서 1,777개를 포함한 바렉스 벤치마크에서 85.5%의 제로샷 정확도를 기록했습니다. 이는 복잡한 중첩 구조를 가진 문서에서도 높은 신뢰도로 정보를 추출할 수 있음을 증명합니다.

주장이 모델은 독립형 엔진으로 사용하거나 IBM의 도클링 도구와 결합하여 전체 문서 처리 파이프라인을 자동화할 수 있습니다. 모듈형 설계를 통해 시각 정보가 필요 없는 경우에는 기본 언어 모델로 전환하여 자원을 절약합니다.

출처https://huggingface.co/blog/ibm-granite/granite-4-vision. IBM Granite 팀이 허깅페이스 블로그를 통해 공식 발표한 기술 문서입니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

10시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

1일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

1일 전

meta-llama/llama-stackv0.8.0

v0.8.0

이번 릴리즈에서는 Anthropic Messages API를 네이티브로 지원하며, 대화 압축 기능이 추가되었습니다. 또한, 기존 Eval API 및 관련 API가 제거되었고, 문서 전반에 걸쳐 UX 개선 및 최적화가 이루어졌습니다. 보안 취약점 수정 및 CI/CD 파이프라인 개선 작업도 포함되었습니다.

1일 전

LangChainlangchain==1.3.0a1

langchain v1.3.0a1

이번 릴리즈에서는 `create_agent`에 `stream_events` 기능이 추가되었으며, HITL 미들웨어에 `respond` 결정 기능이 포함되었습니다. 또한, 에이전트 상태를 도구 디스패치에 인라인하는 것을 중단하여 성능을 개선했습니다.

1일 전

PAPERS