MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 6월 19일 금요일

AI 시대, 당신을 더욱 스마트하게

AI검증

아마존 세이지메이커 AI 비동기 추론의 인라인 페이로드 지원 도입

아마존 웹 서비스가 세이지메이커 AI 비동기 추론 서비스에 인라인 페이로드 기능을 추가했습니다. 개발자는 이제 데이터를 아마존 S3에 올리지 않고 API 요청 본문에 직접 담아 전송할 수 있습니다.

2026년 6월 18일

주장아마존 세이지메이커 AI 비동기 추론 서비스가 인라인 페이로드 기능을 도입하여 개발자의 작업 효율성을 높였습니다. 기존에는 모든 요청마다 데이터를 아마존 S3에 업로드해야 했으나, 이제는 API 요청 본문에 직접 데이터를 담아 전송할 수 있습니다.

팩트이번 업데이트를 통해 최대 12만 8000바이트까지의 데이터를 인라인으로 전송할 수 있습니다. 이 제한을 초과하는 대용량 데이터는 기존과 동일하게 S3 객체 URI를 사용하는 방식을 유지해야 합니다.

교차검증인라인 페이로드와 S3 입력 방식은 상호 배타적으로 작동합니다. API 요청 시 두 방식을 동시에 설정하면 오류가 발생하므로, 데이터 크기에 따라 적절한 방식을 선택해야 합니다.

팩트인라인 페이로드 지원은 서울 리전을 포함한 전 세계 31개 아마존 웹 서비스 상용 리전에서 즉시 사용 가능합니다. 사용자는 최신 버전의 보토3 라이브러리로 업데이트하여 해당 기능을 적용할 수 있습니다.

주장이번 기능 개선은 소규모 데이터 추론 시 발생하는 불필요한 네트워크 지연과 복잡한 아키텍처 문제를 해결합니다. S3 버킷 프로비저닝이나 아이에이엠 권한 관리 등 부수적인 작업이 생략되어 개발 생산성이 향상됩니다.

팩트인라인 방식을 사용하면 S3 풋 요청 비용이 제거되어 운영 비용이 절감됩니다. 또한 요청이 단일 API 호출로 완료되므로 오류 발생 경로가 단순해지고 즉각적인 유효성 검사가 가능합니다.

교차검증12만 8000바이트를 초과하는 이미지나 오디오, 대형 문서 파일은 여전히 S3 업로드 방식이 권장됩니다. 또한 감사나 재실행을 위해 입력 데이터를 보관해야 하는 경우에도 기존 S3 방식을 사용하는 것이 유리합니다.

팩트기존 비동기 추론 엔드포인트 설정이나 모델 컨테이너는 변경할 필요가 없습니다. 출력 데이터는 여전히 S3 출력 위치에 저장되며, 클라이언트는 기존과 동일하게 에스엔에스 알림이나 폴링을 통해 결과를 확인합니다.

주장이번 업데이트는 비동기 추론 워크플로우의 진입 장벽을 낮추는 중요한 변화입니다. 특히 실시간 추론보다 긴 처리 시간이 필요하면서도 데이터 크기가 작은 작업에 최적화된 환경을 제공합니다.

팩트이번 기능은 비동기 추론의 유연성을 강화하여 다양한 인공지능 모델 배포 환경을 지원합니다. 개발자는 데이터 전송 방식의 선택지를 넓혀 시스템 아키텍처를 더욱 간결하게 설계할 수 있습니다.

주장아마존 웹 서비스는 이번 업데이트를 통해 클라우드 기반 인공지능 개발 환경의 편의성을 지속적으로 개선하고 있습니다. 이는 복잡한 인프라 관리 부담을 줄여 개발자가 모델 개발에 집중하도록 돕습니다.

출처아마존 웹 서비스 공식 블로그(https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-ai-async-inference-now-supports-inline-request-payloads/)를 통해 해당 내용을 교차 검증했습니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain==1.3.10

langchain==1.3.10

langchain 1.3.10 릴리즈에서는 cryptography, aiohttp, pyjwt 라이브러리 버전이 업데이트되었습니다. 또한, 요약 형식 변경 및 특정 스냅샷에 대한 프로바이더 전략 감지 기능이 수정되었습니다. README 설치 및 리소스 문서도 갱신되었습니다.

14시간 전

LangChainlangchain-core==1.4.8

langchain-core==1.4.8

이번 릴리즈에서는 Python 3.10 미만 버전에 대한 코드가 제거되었으며, `BaseTool.tool_call_schema` 및 `model_json_schema`에 대한 성능 개선이 이루어졌습니다. 또한, v3 스트리밍 이벤트에서 사용 토큰 세부 정보가 보존되고, 명시적 역직렬화 허용 목록에 대한 테스트가 업데이트되었습니다.

14시간 전

Anthropicv0.111.0

v0.111.0

이번 릴리즈에서는 refusal-fallback 미들웨어 요청에 fallback-refusal-middleware 태그를 추가하는 기능이 포함되었습니다. 자세한 변경 사항은 전체 변경 로그를 참조하시기 바랍니다.

16시간 전

Anthropicv0.110.0

v0.110.0

이번 릴리즈에서는 새로운 code_execution_20260120 도구에 대한 지원이 추가되었습니다. 또한, 헤더 병합 시 x-stainless-helper가 덮어쓰이는 대신 추가되도록 수정되었으며, 스트림 이벤트 유형이 보존되도록 개선되었습니다.

17시간 전

OpenAIv2.43.0

v2.43.0

OpenAI Python 라이브러리가 v2.43.0 버전으로 업데이트되었습니다. 이번 릴리즈에서는 API 관련 변경 사항으로 OpenAPI 사양 또는 Stainless 설정을 업데이트했습니다.

1일 전

PAPERS