AI검증

메타, AI 인프라 최적화 도구 ‘커널이볼브’ 공개

메타가 인공지능 모델과 하드웨어 다양화에 따른 성능 병목 현상을 해결하기 위해 자동화 도구인 커널이볼브를 선보였습니다. 이 시스템은 커널 최적화를 자동화하여 연산 처리량을 대폭 개선하고 엔지니어링 시간을 단축합니다.

2026년 4월 3일

주장메타는 인공지능 모델의 급격한 증가와 하드웨어 다양화로 발생하는 성능 최적화 병목 현상을 해결하고자 커널이볼브를 개발했습니다. 기존의 수동 최적화 방식은 확장성에 한계가 있어 자동화된 에이전트 시스템이 필수적입니다.

팩트커널이볼브는 엔비디아 그래픽처리장치(GPU), 에이엠디(AMD) GPU, 메타의 자체 칩인 엠티아이에이(MTIA), 그리고 중앙처리장치(CPU) 등 다양한 하드웨어 환경에서 작동합니다. 이 시스템은 트리톤, 큐트 도메인 특화 언어(DSL), 플라이DSL과 같은 고수준 언어와 쿠다, 힙, 엠티아이에이 시플플 등 저수준 언어로 커널을 생성합니다.

팩트안드로메다 광고 모델의 경우 엔비디아 GPU에서 추론 처리량이 60% 이상 향상되었습니다. 메타의 자체 엠티아이에이 칩에서 실행되는 광고 모델의 학습 처리량 또한 25% 이상 개선되는 성과를 거두었습니다.

주장커널이볼브는 커널 최적화를 단순한 코드 생성이 아닌 검색 문제로 정의합니다. 전용 작업 환경이 후보 커널을 평가하고 진단 결과를 거대언어모델(LLM)에 전달하여 수백 개의 대안을 지속적으로 탐색합니다.

교차검증하드웨어마다 메모리 구조와 명령어 세트가 다르므로 특정 플랫폼에 최적화된 커널은 다른 환경에서 성능이 저하되거나 작동하지 않을 위험이 있습니다. 메타는 이를 해결하기 위해 세대별로 다른 최적화 전략을 적용합니다.

팩트메타의 엠티아이에이 칩 로드맵은 2년 동안 4개의 칩 세대인 엠티아이에이 300에서 500까지를 포함합니다. 각 세대는 새로운 연산 능력과 메모리 대역폭 특성을 가지며, 이전 세대에 최적화된 커널은 차세대 칩에서 성능이 떨어질 수 있습니다.

주장커널이볼브는 인공지능 소프트웨어와 하드웨어의 관계를 근본적으로 변화시킵니다. 과거 전문가가 수동으로 수행하던 커널 개발이 이제는 하드웨어와 모델의 변화에 맞춰 지속적이고 자동화된 방식으로 전환됩니다.

팩트커널이볼브는 메타의 랭킹 엔지니어 에이전트의 일부로 사용되며 매일 수조 건의 추론 요청을 처리하는 프로덕션 환경에 적용됩니다. 이 시스템은 수주가 소요되던 엔지니어링 작업을 수 시간으로 단축하여 인적 자원을 효율화합니다.

교차검증벤더가 제공하는 기본 라이브러리인 씨유블라스나 씨유디엔엔은 표준 연산을 지원하지만, 프로덕션 환경의 복잡한 맞춤형 연산까지 모두 대응하기에는 한계가 있습니다. 커널이볼브는 이러한 표준 라이브러리 외부의 커스텀 연산 최적화에 특화되어 있습니다.

팩트이 기술에 대한 상세 내용은 2026년 제53회 국제 컴퓨터 구조 심포지엄에서 발표될 예정입니다. 메타는 이를 통해 인공지능 인프라의 확장성과 모델 반복 주기를 획기적으로 개선합니다.

출처메타 엔지니어링 블로그(https://engineering.fb.com/2026/04/02/developer-tools/kernelevolve-how-metas-ranking-engineer-agent-optimizes-ai-infrastructure/)를 통해 해당 내용을 교차 검증했습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Former German Chancellor Scholz: After all, Russia did not conquer Ukraine. This is a big success.

2시간 전

TELEGRAM · Clash Report

Former German Chancellor Scholz: We were an engineers’ country. Now we’re a lawyers’ country. Other countries… build a national railway system in 20 years. We cannot build a commuter line in 20 years.

2시간 전

TELEGRAM · Clash Report

Russia says Russia will get ~200 billion rubles ($2.7 billion) extra from higher oil prices.

2시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

트럼프의 이란 평화안 검토와 공습 재개 경고

국제19시간 전

자석 부착형 초소형 전자책 단말기 Xteink X3의 특징과 한계

AI9시간 전

이스라엘, 미국산 F-35 및 F-15IA 전투기 추가 도입 승인

국제9시간 전

이스라엘의 레바논 남부 강제 이주 명령 확대와 작전 범위 확장

국제13시간 전

아카데미 시상식, AI 생성 연기 및 각본 후보 자격 제한

AI19시간 전

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-anthropic==1.4.3

langchain-anthropic==1.4.3

이번 릴리즈에서는 Anthropic 관련 기능이 1.4.3 버전으로 업데이트되었습니다. 또한, `create_agent`로의 이전 경고 대상 재지정 및 기타 내부 정리 작업이 포함되었습니다. 문서의 X 핸들 참조 업데이트와 Anthropic 관련 HTTPX 최종 처리기 보호 기능도 개선되었습니다.

6시간 전

LangChainlangchain-classic==1.0.5

langchain-classic==1.0.5

langchain-classic 1.0.5 릴리즈에서는 `create_agent`로의 마이그레이션을 위한 경고 메시지 수정 및 기타 정리 작업이 포함되었습니다. 또한, 일부 의존성 버전이 업데이트되었으며, 코어 라이브러리의 최소 버전이 상향 조정되었습니다.

6시간 전

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

15시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

2일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

2일 전

PAPERS

cs.AI

좋은 터미널 에이전트 벤치마크 과제란 무엇인가: 적대적이고 어렵고 명확한 평가 설계를 위한 가이드라인

3일 전

cs.CV

PRISM: 멀티모달 강화 학습을 위한 블랙박스 온폴리시 증류 기반 사전 정렬

3일 전

cs.AI

발현된 정렬 불량 페르소나의 일관성 특성화

3일 전

cs.AI