아마존 세이지메이커 AI 기반 AI 에이전트 도구 호출 정확도 개선
아마존 웹 서비스가 세이지메이커 AI를 활용해 소형 언어 모델의 도구 호출 정확도를 높이는 최적화 프레임워크를 공개했습니다. 지도 미세 조정과 직접 선호도 최적화를 결합해 기업용 AI 에이전트의 자율 작업 효율을 극대화합니다.
주장인공지능 에이전트가 복잡한 업무를 자율적으로 수행하려면 도구 호출 능력이 핵심입니다. 도구 선택 과정에서 발생하는 오류나 매개변수 형식 불일치는 작업 시간 증가와 비용 상승을 초래합니다.
팩트아마존 웹 서비스(AWS)는 지도 미세 조정(SFT)과 직접 선호도 최적화(DPO)를 결합해 소형 언어 모델(SLM)의 도구 호출 정확도를 개선하는 프레임워크를 제시합니다. 사용자는 아마존 세이지메이커 AI(Amazon SageMaker AI) 학습 작업을 통해 인프라 관리 부담 없이 모델을 최적화합니다.
팩트지도 미세 조정은 모델에 특정 도구와 상호작용하는 방식에 대한 예시를 제공해 언어적 뉘앙스와 제약 조건을 학습시킵니다. 직접 선호도 최적화는 보상 모델 없이 인간의 선호도를 학습 루프에 직접 반영하여 모델 출력을 목표 결과에 맞게 정렬합니다.
교차검증직접 선호도 최적화 방식은 강화 학습보다 자원 요구 사항과 학습 시간이 적게 듭니다. 다만 고품질의 선호 및 비선호 데이터셋 구축이 필수적이며 데이터 질이 모델 성능을 결정하므로 신중한 데이터 큐레이션이 필요합니다.
팩트이번 가이드는 큐웬3(Qwen3) 1.7B 모델을 세이지메이커 AI의 ml.p4d.24xlarge 인스턴스에서 학습시키는 과정을 다룹니다. 세이지메이커 AI는 분산 멀티 그래픽처리장치(GPU)와 멀티 노드 구성을 지원해 대규모 모델 학습을 효율적으로 처리합니다.
팩트학습 데이터셋으로는 엔비디아(NVIDIA)가 공개한 웬투콜(When2Call) 벤치마크를 활용합니다. 해당 데이터셋은 지도 미세 조정용 1만5000개 샘플과 직접 선호도 최적화용 9000개 샘플로 구성되어 도구 호출 결정 능력을 평가합니다.
주장지도 미세 조정과 직접 선호도 최적화의 결합은 언어 모델이 외부 애플리케이션과 자율적으로 상호작용하게 합니다. 이는 단순한 텍스트 생성을 넘어 기업 환경에서 복잡한 업무 흐름을 자동화하는 핵심 기술로 자리 잡습니다.
팩트실험 추적을 위해 세이지메이커 AI 상의 엠엘플로우(MLflow)를 활용합니다. 사용자는 인프라 지표와 학습 루프 내부 데이터를 분석해 모델 품질에 대한 데이터 기반 의사결정을 수행합니다.
교차검증세이지메이커 AI 사용 시 인프라 비용이 발생하므로 학습 작업 종료 후 리소스를 자동으로 종료하는 설정이 중요합니다. 상세한 비용 정보는 아마존 웹 서비스 세이지메이커 AI 가격 페이지에서 확인 가능합니다.
주장기업은 이러한 최적화 기법을 도입해 AI 에이전트의 신뢰성을 확보합니다. 정확한 도구 호출은 비즈니스 프로세스 자동화의 완성도를 높이는 필수 요건입니다.
팩트아마존 웹 서비스는 개발자가 모델 성능을 지속적으로 모니터링하고 개선하도록 지원합니다. 이는 모델 배포 이후의 안정적인 운영 환경을 조성합니다.
출처아마존 웹 서비스 블로그(https://aws.amazon.com/blogs/machine-learning/improve-your-agents-tool-calling-accuracy-with-sft-and-dpo-on-amazon-sagemaker-ai/) 및 관련 논문(arXiv:2305.18290)을 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

