AI검증

메타, 광고 추천 시스템에 거대언어모델 규모 적용 및 효율 개선

메타가 인스타그램 광고 추천 시스템에 거대언어모델(LLM) 규모의 적응형 랭킹 모델을 도입했습니다. 이 모델은 사용자 맥락에 따라 복잡성을 동적으로 조정하여 광고 성과를 높이고 시스템 효율을 극대화합니다.

2026년 3월 31일

주장메타는 광고 추천 시스템의 성능을 극대화하고자 모델의 복잡성을 거대언어모델(LLM) 수준으로 확장하는 전략을 추진합니다. 이는 사용자의 의도를 깊이 있게 이해하여 광고주에게 더 높은 성과를 제공하기 위한 조치입니다.

팩트메타가 개발한 적응형 랭킹 모델은 2025년 4분기 인스타그램에 적용되었습니다. 도입 이후 타겟 사용자 대상 광고 전환율은 3%, 광고 클릭률은 5% 증가했습니다.

주장메타는 모델 복잡성 증가와 시스템 효율 유지라는 추론의 난제를 해결하고자 적응형 랭킹 모델을 설계했습니다. 이 모델은 모든 요청에 동일한 방식을 적용하지 않고 사용자 맥락에 맞춰 복잡성을 동적으로 조정합니다.

교차검증거대언어모델 규모의 모델을 실시간 광고 추천에 적용하면 막대한 컴퓨팅 자원과 메모리가 필요합니다. 단순히 하드웨어 자원을 늘리는 방식은 비용 효율성 측면에서 지속 가능하지 않습니다.

팩트적응형 랭킹 모델은 1조 개 규모의 파라미터를 처리하며, 하드웨어 가속을 통해 모델 연산 효율(MFU)을 35%까지 높였습니다. 또한 100밀리초 수준의 지연 시간을 유지하며 거대언어모델급 복잡성을 구현했습니다.

팩트이 시스템은 요청 중심 아키텍처를 도입하여 기존의 선형적 확장 비용을 하위 선형적 비용으로 전환했습니다. 사용자 신호를 광고 후보마다 개별 계산하지 않고 요청당 한 번만 계산하여 중복 연산을 제거했습니다.

주장메타는 하드웨어와 모델을 공동 설계하여 이기종 하드웨어 환경에서의 활용도를 극대화했습니다. 이는 실리콘의 성능과 한계를 고려하여 모델 구조를 최적화한 결과입니다.

팩트오공 터보(Wukong Turbo)라 불리는 최적화된 런타임 아키텍처는 수치적 불안정성을 제거하고 네트워크 오버헤드를 줄였습니다. 이를 통해 파라미터 수를 늘리지 않고도 처리량을 높이는 구조적 개선을 달성했습니다.

교차검증광고 추천은 챗봇과 달리 1초 미만의 엄격한 지연 시간 제한을 준수해야 합니다. 따라서 모델의 깊이를 더하면서도 사용자 경험을 저해하지 않는 실시간 처리 기술이 필수적입니다.

출처https://engineering.fb.com/2026/03/31/ml-applications/meta-adaptive-ranking-model-bending-the-inference-scaling-curve-to-serve-llm-scale-models-for-ads/

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Algeria’s President Tebboune on UAE's withdrawal from OPEC: It is a non-event. Among the Arab countries, the main pillar in OPEC is the sisterly Kingdom of Saudi Arabia. End of discussion, and the book is closed... with them... It's finished.

21분 전

TELEGRAM · Clash Report

WATCH: German Chancellor Merz snapped at a terminally ill woman who challenged health cuts and political pay. A woman with stage IV cancer said: I’ve already sent you an invitation to my funeral… I can’t afford it. Why are cuts hitting us citizens… but not politicians? Merz, visibly irritated, shot back: At no point… was it ever considered to raise government salaries. I would be grateful if you would not repeat that unchecked.

21분 전

TELEGRAM · Clash Report

US Secretary of State Marco Rubio DJing at a wedding in Florida.

21분 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

AI 받아쓰기 앱 8종 기능 및 요금 정책 비교

AI23시간 전

유럽의 기술 주권 이끄는 유망 스타트업 21선 선정

경제23시간 전

미국 정치 양극화와 정보 환경의 위기

국제23시간 전

예멘 해안 유조선 유레카호 피랍 및 소말리아 이동

국제23시간 전

음성·폐 신호 통합 분석 하이브리드 AI 모델 개발

AI23시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

10시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

1일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

1일 전

meta-llama/llama-stackv0.8.0

v0.8.0

이번 릴리즈에서는 Anthropic Messages API를 네이티브로 지원하며, 대화 압축 기능이 추가되었습니다. 또한, 기존 Eval API 및 관련 API가 제거되었고, 문서 전반에 걸쳐 UX 개선 및 최적화가 이루어졌습니다. 보안 취약점 수정 및 CI/CD 파이프라인 개선 작업도 포함되었습니다.

1일 전

LangChainlangchain==1.3.0a1

langchain v1.3.0a1

이번 릴리즈에서는 `create_agent`에 `stream_events` 기능이 추가되었으며, HITL 미들웨어에 `respond` 결정 기능이 포함되었습니다. 또한, 에이전트 상태를 도구 디스패치에 인라인하는 것을 중단하여 성능을 개선했습니다.

1일 전

PAPERS

cs.AI

좋은 터미널 에이전트 벤치마크 과제란 무엇인가: 적대적이고 어렵고 명확한 평가 설계를 위한 가이드라인

3일 전

cs.CV

PRISM: 멀티모달 강화 학습을 위한 블랙박스 온폴리시 증류 기반 사전 정렬

3일 전