구글 젬마 4 출시, 성능과 효율 겸비한 오픈 모델로 공개
구글 딥마인드가 추론 능력과 에이전트 워크플로우에 최적화된 오픈 모델 젬마 4를 발표했습니다. 31B 밀집 모델을 포함한 4가지 크기로 출시된 이번 모델은 멀티모달 기능과 로컬 배포 환경을 지원합니다.
주장구글 딥마인드가 공개한 젬마 4는 추론 능력과 에이전트 워크플로우를 극대화하도록 설계된 오픈 모델입니다. 기존 젬마 3 대비 성능을 전반적으로 개선했으며, 상업적 활용이 가능한 아파치 2.0 라이선스를 적용했습니다.
팩트젬마 4는 31B 밀집 모델과 26B 전문가 혼합 모델, 그리고 모바일 및 사물인터넷 환경을 겨냥한 E4B와 E2B 등 총 4가지 크기로 구성됩니다. 31B 모델은 256K까지의 긴 문맥을 지원하며, 구조화된 제이슨 출력과 함수 호출 기능을 제공합니다.
팩트젬마 4는 텍스트를 넘어 비디오와 이미지를 기본적으로 처리하는 멀티모달 기능을 갖췄습니다. 특히 E2B와 E4B 모델은 음성 인식과 이해를 돕는 네이티브 오디오 입력을 지원합니다.
팩트젬마 4의 아키텍처는 하이브리드 어텐션과 계층별 임베딩, 키밸류 캐시 공유 등 효율성을 높이는 기술을 포함합니다. 비표준 트랜스포머 구조를 채택해 연산 효율을 높이고 메모리 사용량을 최적화했습니다.
팩트벤치마크 결과에 따르면 젬마 4 31B 모델은 아레나 리더보드에서 미국 오픈 모델 중 1위에 올랐습니다. 지피큐에이 다이아몬드 벤치마크에서는 85.7%의 점수를 기록하며 과학적 추론 능력을 입증했습니다.
교차검증일부 전문가는 젬마 4 31B 모델의 아키텍처가 젬마 3와 큰 차이가 없다고 분석합니다. 성능 향상이 구조적 혁신보다는 학습 데이터와 훈련 방식의 개선에서 비롯되었을 가능성을 제기합니다.
팩트젬마 4는 출시 당일부터 라마시피피와 올라마, 브이엘엘엠 등 주요 로컬 및 서버 스택의 지원을 받습니다. 개발자는 로컬 환경에서 모델을 빠르게 배포하고 활용할 수 있습니다.
주장젬마 4는 로컬 에이전트 엔진으로서 오픈 에이전트 스택의 핵심 모델로 자리 잡고 있습니다. 허미스 에이전트와 같은 프레임워크와 결합해 로컬 환경의 자동화 작업 효율을 개선합니다.
교차검증선호도 기반 리더보드는 모델 성능을 과대평가할 위험이 존재합니다. 실제 산업 현장에서의 활용성과 안정성은 추가적인 검증이 필요합니다.
출처레이턴트 스페이스의 젬마 4 관련 보도를 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.