AI검증

전문가 모델 효율 극대화한 EMO 모델 개발

앨런 인공지능 연구소와 UC 버클리 연구진이 모듈형 구조를 갖춘 EMO 모델을 개발했습니다. 이 모델은 전체 전문가의 일부만 사용해도 성능 저하를 최소화합니다. 메모리 제약 환경에서 효율적인 운영이 가능합니다.

2026년 5월 16일

주장앨런 인공지능 연구소와 UC 버클리 연구진이 사전 학습 과정에서 모듈형 구조를 형성하는 EMO(Expert Modular Optimization) 모델을 개발했습니다. 이 모델은 전체 전문가 중 일부만 남겨도 성능 저하가 거의 발생하지 않는다는 점이 핵심입니다.

팩트EMO 모델은 128개의 전문가 중 25퍼센트인 32개만 사용해도 성능 하락이 1퍼센트 포인트에 불과합니다. 12.5퍼센트인 16개의 전문가만 사용해도 성능 하락은 약 3퍼센트 포인트 수준으로 유지됩니다.

교차검증기존의 혼합 전문가 모델은 전문가들이 문법적 패턴이나 구두점 같은 얕은 언어 정보에 의존합니다. 이로 인해 특정 도메인만 추출하여 모델을 경량화하는 작업이 사실상 불가능합니다.

팩트연구진은 문서 경계라는 학습 신호를 활용하여 모델이 특정 도메인에 전문성을 갖도록 유도했습니다. 문서 내 토큰들이 공유된 전문가 풀에서 활성화되도록 강제하여 도메인별 전문화를 달성했습니다.

팩트학습 안정성을 위해 연구진은 로드 밸런싱을 개별 배치가 아닌 문서 전체에 걸쳐 전역적으로 계산했습니다. 또한 학습 도중 문서 풀의 크기를 무작위로 변경하여 추론 시 다양한 크기의 전문가 하위 그룹을 다룰 수 있도록 설계했습니다.

주장EMO 모델은 전문가들이 실제 주제별로 전문성을 학습하게 합니다. 이는 모델이 건강, 정치, 영화 등 특정 도메인에 맞춰 내부적으로 구조화됨을 의미합니다.

교차검증표준 혼합 전문가 모델은 동일한 설정에서 전문가를 제거할 경우 성능이 10에서 15퍼센트 포인트까지 급락합니다. 심지어 동일한 활성 매개변수를 가진 밀집 모델보다 성능이 낮아지는 경우도 발생합니다.

팩트연구진은 10억 개의 활성 매개변수와 140억 개의 전체 매개변수를 가진 모델을 1조 개의 토큰으로 학습시켰습니다. 해당 모델은 동일한 조건의 표준 모델보다 우수한 성능을 보였습니다.

주장EMO 모델은 메모리 제약이 있는 환경에서 특정 도메인 전문가만 로드하여 효율적으로 운영할 수 있습니다. 또한 유해 콘텐츠 차단이나 특정 목적을 위한 모델 미세 조정에도 유용하게 활용됩니다.

출처더 디코더(The Decoder) 보도 내용 및 관련 논문 자료를 교차 검증했습니다. 연구진은 허깅페이스와 깃허브를 통해 모델과 학습 코드를 공개했습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

U.S. may ask Israel to redirect billions in withheld Palestinian tax funds to support Trump’s Gaza reconstruction plan. Source: Reuters

2시간 전

TELEGRAM · Clash Report

Trump bought shares of AI company Palantir Technologies weeks before publicly praising the stock on Truth Social. The records show Trump purchased between roughly $247,000 and $630,000 of Palantir stock in early 2026, including multiple buys in March. He later promoted the company in an April Truth Social post during a sharp selloff in tech stocks. The filings also show Trump sold up to $5 million worth of Palantir shares in February and made other large tech investments, includin

2시간 전

TELEGRAM · Clash Report

Kremlin: Putin will pay a visit to China on May 19 and 20.

2시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

테슬라 로보택시 원격 조종 중 충돌 사고 발생

AI16시간 전

구글의 생성형 인공지능 검색 최적화 가이드 발표

마케팅19시간 전

제롬 파월 연방준비제도 의장 대행 임명

경제14시간 전

가자지구 나크바 78주년 공습으로 팔레스타인인 7명 사망

국제14시간 전

루빈 천문대의 우주 관측과 데이터 혁명

AI22시간 전

릴리즈 & 논문

전체보기 →

RELEASES

OpenAIv2.37.0

v2.37.0

이번 릴리즈에서는 API의 responses compact 메서드에 service_tier 파라미터가 추가되었습니다. 또한, Pydantic 이터레이터에 대한 조기 유효성 검사를 지원하며, 워크로드 ID 공급자를 사용할 때 불필요한 client_id가 제거되었습니다. 파일 타입 오류 메시지에 누락된 f-string 접두사가 수정되었습니다.

14시간 전

LangChainlangchain==1.3.1

langchain==1.3.1

langchain 1.3.1 릴리즈에서는 Bedrock 제공자를 요약 토큰 검사에서 별칭으로 지정하는 수정 사항이 포함되었습니다.

18시간 전

vLLMv0.21.0

v0.21.0

이번 릴리즈에서는 Transformers v4 지원이 공식적으로 중단되었으며, C++20 컴파일러가 빌드 요구사항으로 추가되었습니다. KV 오프로딩 서브시스템이 하이브리드 메모리 할당기(HMA)와 통합되었고, 추론 모델을 위한 스페큘러티브 디코딩의 'thinking budget' 지원이 개선되었습니다. 또한 NVIDIA Blackwell GPU를 위한 새로운 TOKENSPEED_MLA 백엔드가 추가되었습니다.

1일 전

openai/tiktoken0.13.0

(없음)

내용 없음

1일 전

microsoft/semantic-kernelpython-1.42.0

python-1.42.0

이번 릴리즈에서는 Python 패키지 버전이 1.42.0으로 업데이트되었습니다. 또한, Microsoft Agent Framework 후속 호출에 대한 문서가 추가되었으며, 여러 종속성 패키지들이 업데이트되었습니다. Azure AI Search 커넥터의 비공개 속성 접근이 중단되었고, OpenAPI 경로 매개변수 퍼센트 인코딩 및 HttpPlugin 요청 유효성 검사가 개선되었습니다.

2일 전

PAPERS

cs.LG

FutureSim: 적응형 에이전트 평가를 위한 세계 이벤트 재현

2일 전

cs.CV

기하학적 일관성을 위한 정량적 비디오 세계 모델 평가

2일 전

cs.AI

OpenDeepThink: Bradley-Terry 집계를 통한 병렬 추론

2일 전

cs.CV