AI검증

AWS, 지능형 문서 처리 스키마 자동 생성 기능 공개

아마존웹서비스(AWS)가 기업의 지능형 문서 처리(IDP) 도입을 돕는 다중 문서 발견 기능을 발표했습니다. 이 기술은 문서 레이아웃을 자동 분석해 스키마를 생성함으로써 수작업 효율을 높입니다.

2026년 5월 12일

주장지능형 문서 처리(IDP) 도입 과정에서 가장 큰 장애물은 수천 개에 달하는 문서 유형을 일일이 정의하고 스키마를 생성하는 수작업입니다. 아마존웹서비스(AWS)는 이번에 발표한 다중 문서 발견 기능을 통해 이러한 수동 작업을 자동화하고 기업의 IDP 도입 장벽을 낮춥니다.

팩트해당 솔루션은 AWS 스텝 펑션스(Step Functions)와 AWS 람다(Lambda)를 활용해 서버리스 환경에서 작동합니다. 사용자가 아마존 S3 버킷이나 압축 파일 형태로 문서를 올리면 아마존 베드록(Bedrock) 모델이 이를 분석해 IDP 가속기용 구성 파일을 자동으로 만듭니다.

팩트문서 분류 단계에서는 코히어 임베드(Cohere Embed) v4 모델을 사용해 문서의 시각적 특징을 벡터 임베딩으로 변환합니다. 시스템은 텍스트 내용보다 문서의 레이아웃과 구조적 특징을 우선 분석하여 유사한 유형의 문서를 클러스터링합니다.

팩트클러스터링 최적화는 실루엣 점수를 기준으로 결정하며 케이-민즈(k-means) 알고리즘을 통해 케이(k)값을 2에서 20 사이로 테스트합니다. 시스템은 가장 높은 점수를 기록한 그룹화 방식을 선택해 문서 유형 개수를 자동으로 파악합니다.

팩트클러스터링이 완료되면 스트랜즈 에이전트(Strands Agent)가 각 그룹을 분석해 문서 유형을 식별하고 스키마를 생성합니다. 에이전트는 클러스터 중심부와 주변부 등 다양한 위치의 문서를 전략적으로 샘플링하여 문서의 변동성을 포괄적으로 반영합니다.

주장이번 기술은 라벨링 되지 않은 대규모 문서 집합을 즉시 활용 가능한 구조적 데이터로 변환하는 데 핵심적인 역할을 합니다. 이는 데이터 과학자가 수동으로 분류 규칙을 만들던 기존의 비효율적인 방식을 획기적으로 개선합니다.

팩트벤치마크 테스트 결과, 조정된 랜드 지수(ARI)와 정규화된 상호 정보량(NMI)에서 1.0이라는 수치를 기록했습니다. 이는 모델이 은행 수표, 임대 계약서, 신용카드 명세서 등 다양한 문서를 정확하게 구분함을 의미합니다.

교차검증벤치마크 데이터셋에서 9개의 문서 유형을 완벽하게 분류했으나 이는 특정 데이터셋을 기준으로 한 결과입니다. 실제 기업 환경의 데이터 특성에 따라 클러스터링 품질과 스키마 생성 정확도는 달라질 수 있습니다.

교차검증본 솔루션은 다중 페이지 문서의 경우 첫 번째 페이지만을 사용해 임베딩을 생성합니다. 문서 첫 페이지에 유형을 구분할 시각적 정보가 부족하면 분류 정확도가 떨어질 위험이 있습니다.

출처AWS 머신러닝 블로그(https://aws.amazon.com/blogs/machine-learning/automate-schema-generation-for-intelligent-document-processing/)를 교차 검증했습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Trump: Iran’s leaders will either do the right thing, or we will finish the job.

1시간 전

TELEGRAM · Clash Report

Reporter: Is there any understanding between you and Putin that Russia should get the entire Donbas? Trump: No.

1시간 전

TELEGRAM · Clash Report

Trump: We and China are the two superpowers of the world.

1시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

"중장년층도 쓴다"...2026년 1분기 챗GPT 사용자층 범용화

AI22시간 전

싱킹 머신즈의 실시간 대화형 인공지능 모델 공개

AI11시간 전

피콕, 브라보 숏폼 마이크로드라마 출시

경제16시간 전

제너럴 모터스의 AI 인재 확보를 위한 IT 인력 600명 감원

AI16시간 전

Strands와 Exa를 활용한 웹 검색 AI 에이전트 구축 방안

AI16시간 전

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-core==1.4.0

langchain-core==1.4.0

이번 릴리즈에서는 content-block-centric 스트리밍(v2) 기능이 추가되었으며, 채팅 모델 및 LLM 호출 파라미터를 추적 가능한 메타데이터에 포함시켰습니다. 또한, Pydantic v1 임포트를 최적화하고, 도구 실행 시 구조화된 입력을 보존하며, 배치 크기 유효성 검사를 강화하는 등의 다양한 버그 수정 및 개선 사항이 포함되었습니다.

1일 전

Anthropicv0.101.0

v0.101.0

이번 릴리즈에서는 Claude Platform on AWS를 위한 AWS 클라이언트가 추가되었습니다. 또한 파일 타입 오류 메시지에 누락된 f-string 접두사가 수정되었으며, 예제 코드의 도구 실행기가 업데이트되었습니다.

1일 전

microsoft/semantic-kerneldotnet-1.76.0

dotnet-1.76.0

이번 릴리즈에서는 .Net 버전을 1.76.0으로 업데이트하고, CloudDrivePlugin 및 OpenAPI 플러그인의 입력 유효성 검사를 강화했습니다. 또한, 도구/함수 결과에 ImageContent 지원이 추가되었으며, Kiota 패키지 및 Snappier 라이브러리의 보안 취약점을 수정했습니다.

1일 전

vLLMv0.20.2

vLLM v0.20.2

이번 릴리즈는 DeepSeek V4, gpt-oss, Qwen3-VL에 대한 버그 수정 사항을 포함하는 작은 패치 릴리즈입니다. DeepSeek V4의 Sparse Attention 및 KV 캐시 관련 문제, gpt-oss의 MXFP4와 torch.compile 호환성 문제, Qwen3-VL의 잘못된 경계 검사 오류가 수정되었습니다.

2일 전

LangChainlangchain==1.2.18

langchain==1.2.18

langchain 1.2.18 릴리즈에서는 `create_agent` 호출 시 `ls_agent_type` 태그가 롤백되었습니다. 또한, `langchain-classic`의 `hub`, `limit loads/dumps` 기능이 사용 중단 처리되었으며, 선택적 종속성이 다시 활성화되었습니다.

4일 전

PAPERS

cs.CL

Speech-based Psychological Crisis Assessment using LLMs

1일 전

cs.LO

MDP에서 확률적 안전성을 보장하기 위한 쉴드

1일 전

cs.SE

CrackMeBench: Binary Reverse Engineering for Agents

1일 전

cs.LG