AI검증

구글 젬마 4 공개, 온디바이스 멀티모달 AI 시대 연다

구글 딥마인드가 온디바이스 환경에 최적화된 개방형 멀티모달 모델 젬마 4를 발표했습니다. 효율적인 추론 기술을 적용해 적은 파라미터로도 높은 성능을 구현하며 개발자 접근성을 높였습니다.

2026년 4월 2일

주장구글 딥마인드의 젬마 4는 온디바이스 환경에서 고성능 멀티모달 지능을 구현합니다. 아파치 2.0 라이선스를 채택하여 누구나 자유롭게 활용하고 미세 조정할 수 있는 개방형 모델입니다.

팩트젬마 4는 총 4가지 모델 크기로 출시되었습니다. 모든 모델은 기본 모델과 지시어 미세 조정 모델을 포함합니다. E2B와 E4B 모델은 128k 컨텍스트 윈도우를 지원하며, 31B와 26B 모델은 256k 컨텍스트 윈도우를 제공합니다.

팩트젬마 4는 텍스트뿐만 아니라 이미지와 오디오 입력을 지원하는 멀티모달 모델입니다. 특히 소형 모델인 E2B와 E4B는 오디오 처리 기능을 포함하여 다양한 온디바이스 환경에서 활용 가능합니다.

팩트31B 밀집 모델은 1452점의 엘엠아레나(LMArena) 텍스트 점수를 기록했습니다. 26B 혼합 전문가(MoE) 모델은 4B 활성 파라미터만으로 1441점을 달성했습니다. 이는 기존 모델 대비 약 30배 적은 파라미터로도 유사한 성능을 낸다는 의미입니다.

주장젬마 4는 효율적인 추론을 위해 계층별 임베딩(PLE)과 공유 키-값(KV) 캐시 기술을 도입했습니다. 이러한 구조적 혁신은 모델의 메모리 사용량을 줄이고 긴 문맥 처리 능력을 향상시킵니다.

팩트계층별 임베딩은 각 디코더 계층에 별도의 저차원 조건부 경로를 제공하여 모델의 효율성을 높입니다. 이는 모든 정보를 초기 임베딩에 압축해야 하는 기존 트랜스포머 모델의 한계를 극복합니다.

교차검증공유 키-값 캐시는 모델의 마지막 계층들이 앞선 계층의 상태를 재사용하게 하여 연산량을 줄입니다. 이 기술은 성능 저하를 최소화하면서 온디바이스 환경에서의 속도와 메모리 효율을 극대화합니다.

팩트젬마 4의 비전 인코더는 가변 종횡비를 지원합니다. 사용자는 속도와 품질 사이의 균형을 맞추기 위해 이미지 토큰 수를 설정할 수 있습니다. 이는 광학 문자 인식(OCR), 객체 탐지, 그래픽 사용자 인터페이스(GUI) 요소 분석 등 다양한 시각적 작업에 최적화됩니다.

주장젬마 4는 허깅페이스의 트랜스포머, 라마(Llama).cpp, 엠엘엑스(MLX) 등 다양한 라이브러리와 호환됩니다. 개발자는 선호하는 도구를 사용하여 즉시 모델을 배포하고 미세 조정할 수 있습니다.

출처허깅페이스의 젬마 4 기술 블로그를 교차 검증했습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Former German Chancellor Scholz: After all, Russia did not conquer Ukraine. This is a big success.

44분 전

TELEGRAM · Clash Report

Former German Chancellor Scholz: We were an engineers’ country. Now we’re a lawyers’ country. Other countries… build a national railway system in 20 years. We cannot build a commuter line in 20 years.

44분 전

TELEGRAM · Clash Report

Russia says Russia will get ~200 billion rubles ($2.7 billion) extra from higher oil prices.

44분 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

트럼프의 이란 평화안 검토와 공습 재개 경고

국제18시간 전

자석 부착형 초소형 전자책 단말기 Xteink X3의 특징과 한계

AI8시간 전

이스라엘, 미국산 F-35 및 F-15IA 전투기 추가 도입 승인

국제8시간 전

이스라엘의 레바논 남부 강제 이주 명령 확대와 작전 범위 확장

국제11시간 전

아카데미 시상식, AI 생성 연기 및 각본 후보 자격 제한

AI18시간 전

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-anthropic==1.4.3

langchain-anthropic==1.4.3

이번 릴리즈에서는 Anthropic 관련 기능이 1.4.3 버전으로 업데이트되었습니다. 또한, `create_agent`로의 이전 경고 대상 재지정 및 기타 내부 정리 작업이 포함되었습니다. 문서의 X 핸들 참조 업데이트와 Anthropic 관련 HTTPX 최종 처리기 보호 기능도 개선되었습니다.

4시간 전

LangChainlangchain-classic==1.0.5

langchain-classic==1.0.5

langchain-classic 1.0.5 릴리즈에서는 `create_agent`로의 마이그레이션을 위한 경고 메시지 수정 및 기타 정리 작업이 포함되었습니다. 또한, 일부 의존성 버전이 업데이트되었으며, 코어 라이브러리의 최소 버전이 상향 조정되었습니다.

4시간 전

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

13시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

2일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

2일 전

PAPERS

cs.AI

좋은 터미널 에이전트 벤치마크 과제란 무엇인가: 적대적이고 어렵고 명확한 평가 설계를 위한 가이드라인

3일 전

cs.CV

PRISM: 멀티모달 강화 학습을 위한 블랙박스 온폴리시 증류 기반 사전 정렬

3일 전

cs.AI

발현된 정렬 불량 페르소나의 일관성 특성화

3일 전

cs.AI