MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 6월 19일 금요일

AI 시대, 당신을 더욱 스마트하게

AI검증

IBM, 기업용 문서 이해 특화 Granite 4.0 3B Vision 공개

IBM이 기업의 복잡한 문서와 차트를 정밀하게 분석하는 경량 모델 Granite 4.0 3B Vision을 발표했습니다. 이 모델은 모듈형 구조와 특화 데이터셋을 통해 기업 현장에서 효율적인 문서 처리 자동화를 지원합니다.

2026년 3월 31일

주장IBM은 기업의 복잡한 문서와 차트를 정확하게 이해하고 정보를 추출하기 위해 Granite 4.0 3B Vision 모델을 개발했습니다. 이 모델은 경량화된 구조를 통해 기업 현장에서 실용적이고 효율적인 문서 처리를 지원합니다.

팩트Granite 4.0 3B Vision은 2026년 3월 31일에 발표되었습니다. 이 모델은 30억 개의 파라미터를 가진 소형 모델로, 기업용 문서 이해를 목적으로 설계되었습니다.

팩트주요 기능은 복잡한 표 구조를 분석하는 표 추출, 차트를 기계가 읽을 수 있는 형식으로 변환하는 차트 이해, 문서 내 의미 있는 키-값 쌍을 식별하는 키-값 쌍 추출입니다. 이 모델은 Granite 4.0 마이크로 모델에 저순위 적응 기법인 로라 어댑터를 적용한 모듈형 구조를 채택했습니다.

팩트모델 성능 향상을 위해 170만 개의 차트 샘플로 구성된 차트넷 데이터셋을 구축했습니다. 이 데이터셋은 코드 기반 합성 파이프라인으로 생성되었으며, 24가지 차트 유형과 6개의 플로팅 라이브러리를 포함합니다.

팩트딥스택 아키텍처를 도입하여 시각적 특징을 계층적으로 주입합니다. 추상적인 시각 정보는 초기 레이어에, 고해상도 공간 정보는 후기 레이어에 전달하여 문서 내 위치와 내용을 동시에 파악합니다.

교차검증기존 멀티모달 모델은 시각적 패턴과 수치 데이터, 자연어를 동시에 추론하는 작업에서 한계를 보였습니다. 특히 선 그래프의 정확한 값을 읽는 등 공간적 정밀도가 필요한 작업에서 성능 저하가 발생했습니다.

팩트성능 평가 결과, 차트 투 서머리 벤치마크에서 86.4%의 점수를 기록하며 더 큰 규모의 모델들을 능가했습니다. 표 추출 성능을 측정하는 펍테이블스V2 벤치마크에서도 크롭된 표와 전체 페이지 문서 모두에서 최고 수준의 텍스트 편집 거리 기반 유사도 점수를 달성했습니다.

팩트미국 정부 문서 1,777개를 포함한 바렉스 벤치마크에서 85.5%의 제로샷 정확도를 기록했습니다. 이는 복잡한 중첩 구조를 가진 문서에서도 높은 신뢰도로 정보를 추출할 수 있음을 증명합니다.

주장이 모델은 독립형 엔진으로 사용하거나 IBM의 도클링 도구와 결합하여 전체 문서 처리 파이프라인을 자동화할 수 있습니다. 모듈형 설계를 통해 시각 정보가 필요 없는 경우에는 기본 언어 모델로 전환하여 자원을 절약합니다.

출처https://huggingface.co/blog/ibm-granite/granite-4-vision. IBM Granite 팀이 허깅페이스 블로그를 통해 공식 발표한 기술 문서입니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain==1.3.10

langchain==1.3.10

langchain 1.3.10 릴리즈에서는 cryptography, aiohttp, pyjwt 라이브러리 버전이 업데이트되었습니다. 또한, 요약 형식 변경 및 특정 스냅샷에 대한 프로바이더 전략 감지 기능이 수정되었습니다. README 설치 및 리소스 문서도 갱신되었습니다.

1일 전

LangChainlangchain-core==1.4.8

langchain-core==1.4.8

이번 릴리즈에서는 Python 3.10 미만 버전에 대한 코드가 제거되었으며, `BaseTool.tool_call_schema` 및 `model_json_schema`에 대한 성능 개선이 이루어졌습니다. 또한, v3 스트리밍 이벤트에서 사용 토큰 세부 정보가 보존되고, 명시적 역직렬화 허용 목록에 대한 테스트가 업데이트되었습니다.

1일 전

Anthropicv0.111.0

v0.111.0

이번 릴리즈에서는 refusal-fallback 미들웨어 요청에 fallback-refusal-middleware 태그를 추가하는 기능이 포함되었습니다. 자세한 변경 사항은 전체 변경 로그를 참조하시기 바랍니다.

1일 전

Anthropicv0.110.0

v0.110.0

이번 릴리즈에서는 새로운 code_execution_20260120 도구에 대한 지원이 추가되었습니다. 또한, 헤더 병합 시 x-stainless-helper가 덮어쓰이는 대신 추가되도록 수정되었으며, 스트림 이벤트 유형이 보존되도록 개선되었습니다.

1일 전

OpenAIv2.43.0

v2.43.0

OpenAI Python 라이브러리가 v2.43.0 버전으로 업데이트되었습니다. 이번 릴리즈에서는 API 관련 변경 사항으로 OpenAPI 사양 또는 Stainless 설정을 업데이트했습니다.

2일 전

PAPERS