구글, 8세대 TPU 및 에이전트 플랫폼 공개
구글이 클라우드 넥스트 26 행사에서 8세대 TPU와 기업용 에이전트 플랫폼을 선보였습니다. 하드웨어 최적화와 다양한 모델 지원을 통해 기업의 AI 전환을 가속화할 계획입니다.
주장구글은 클라우드 넥스트 26 행사에서 기업이 자율적인 인공지능 에이전트를 안전하게 운영하는 에이전트 엔터프라이즈 환경을 제시했습니다. 이는 단순한 모델 제공을 넘어 복잡한 업무를 스스로 계획하고 실행하는 에이전트 중심 생태계로의 전략적 전환을 의미합니다.
팩트구글은 8세대 텐서 처리 장치(TPU)를 학습용인 TPU 8t와 추론용인 TPU 8i 두 가지 버전으로 분리하여 출시했습니다. 이는 급증하는 에이전트 추론 수요에 대응하기 위해 하드웨어를 최적화하려는 조치입니다.
팩트TPU 8i 추론 칩은 온칩 정적 램(SRAM)과 고대역폭 메모리(HBM)를 강화하여 모델의 기억 장치인 키-값 캐시를 칩 내부에 더 많이 저장합니다. 또한 보드플라이 네트워크 토폴로지를 도입하여 칩 간 통신 지연 시간을 단축했습니다.
팩트구글은 버고 네트워크를 통해 최대 100만 개의 TPU를 하나의 클러스터로 연결하는 확장성을 확보했습니다. 이는 단일 칩 성능에 집중하는 엔비디아와 달리 대규모 연결성과 효율적인 데이터 처리에 집중하는 구글의 기술적 방향성을 보여줍니다.
팩트구글은 버텍스 AI 기반의 제미나이 엔터프라이즈 에이전트 플랫폼을 통해 에이전트 개발과 운영을 통합했습니다. 사용자는 에이전트 스튜디오에서 자연어로 에이전트를 생성하며, 메모리 뱅크를 활용해 장기 기억 기능을 구현합니다.
팩트워크스페이스 인텔리전스는 지메일, 문서, 드라이브, 챗 등 구글의 모든 앱을 연결하는 지능형 계층입니다. 이를 통해 인공지능은 개별 앱을 넘어 앱 간의 복잡한 관계를 이해하고 업무를 수행합니다.
팩트이번 플랫폼은 제미나이 3.1 프로, 나노 바나나 2, 리리아 3 모델뿐만 아니라 앤스로픽의 클로드 오퍼스 4.7 등 다양한 외부 모델을 지원합니다. 기업 고객은 각자의 필요에 따라 모델을 선택하여 에이전트를 구성합니다.
교차검증자율형 에이전트가 새로운 보안 위협을 초래할 수 있다는 우려가 존재합니다. 구글은 암호화된 신원 확인과 프롬프트 주입 필터, 이상 행동 탐지 기능을 도입했으나 이러한 안전장치가 실제 환경에서 얼마나 효과적일지는 추가적인 검증이 필요합니다.
주장구글의 이번 발표는 마이크로소프트 365와의 경쟁에서 우위를 점하기 위한 전략적 행보입니다. 기업이 기존 업무 환경을 구글 클라우드로 빠르게 전환할 수 있도록 마이그레이션 경로를 간소화했습니다.
출처더 디코더 보도 내용 및 구글 클라우드 공식 블로그 자료를 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.