AI미검

구글, 제미니 3.1 플래시 라이브로 실시간 음성 AI 성능 강화

구글 딥마인드가 실시간 대화 기능을 개선한 제미니 3.1 플래시 라이브를 발표했습니다. 향상된 음향 인식과 추론 능력으로 자연스러운 음성 상호작용을 구현합니다.

2026년 3월 27일

주장구글 딥마인드가 제미니 3.1 플래시 라이브를 출시하며 실시간 대화형 인공지능 기술을 한 단계 진전시켰습니다. 이 모델은 차세대 음성 우선 인공지능에 필요한 속도와 자연스러운 대화 리듬을 제공합니다.

팩트구글은 2026년 3월 26일 제미니 3.1 플래시 라이브를 공식 발표했습니다. 해당 모델은 정밀도를 높이고 지연 시간을 줄여 음성 상호작용의 유동성을 확보했습니다.

팩트새로운 오디오 모델은 음성 톤을 정교하게 이해하여 자연스러운 대화를 지원합니다. 개발자는 이를 활용해 복잡한 작업을 안정적으로 수행하는 음성 에이전트를 구축할 수 있습니다.

팩트제미니 3.1 플래시 라이브는 구글 제품 전반에 적용됩니다. 개발자는 구글 인공지능 스튜디오의 제미니 라이브 응용 프로그램 인터페이스를 통해 모델을 미리 확인 가능합니다.

팩트기업은 고객 경험을 위한 제미니 엔터프라이즈에서 이 모델을 활용할 수 있습니다. 일반 사용자는 서치 라이브와 제미니 라이브를 통해 해당 기능을 경험합니다.

팩트이 모델은 다단계 함수 호출 측정 벤치마크인 컴플렉스펑크벤치 오디오에서 90.8%의 점수를 기록했습니다. 이는 이전 모델 대비 향상된 성능을 입증합니다.

팩트스케일 인공지능의 오디오 멀티챌린지 벤치마크에서는 사고 기능을 활성화했을 때 36.1%의 점수를 달성했습니다. 이 시험은 실제 환경의 소음 속에서 복잡한 지시를 따르고 장기적인 추론을 수행하는 능력을 평가합니다.

팩트제미니 3.1 플래시 라이브는 음조 이해 능력이 개선되어 2.5 플래시 네이티브 오디오보다 음높이와 속도 같은 음향적 뉘앙스를 효과적으로 인식합니다. 사용자의 좌절감이나 혼란스러운 표현에도 동적으로 반응합니다.

팩트모델은 이전보다 빠른 응답 속도를 보이며 대화 흐름을 두 배 더 길게 유지합니다. 이는 긴 브레인스토밍 과정에서도 사고의 맥락을 놓치지 않도록 돕습니다.

팩트제미니 3.1 플래시 라이브는 다국어를 지원하여 서치 라이브의 글로벌 확장을 뒷받침합니다. 200개 이상의 국가와 지역에서 사용자가 선호하는 언어로 실시간 다중 모드 대화를 할 수 있습니다.

팩트모든 생성 오디오에는 신스아이디 워터마크가 삽입됩니다. 이 기술은 오디오 출력에 직접 포함되어 인공지능 생성 콘텐츠를 식별하고 잘못된 정보 확산을 방지합니다.

교차검증버라이즌, 라이브킷, 홈디포 등 주요 기업은 개선된 자연스러운 대화 기능에 긍정적인 평가를 내놓았습니다. 이는 실제 비즈니스 환경에서의 실질적인 유용성을 시사합니다.

출처https://deepmind.google/blog/gemini-3-1-flash-live-making-audio-ai-more-natural-and-reliable/

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Iran's FM Spox. Esmail Baghaei: Today's Friday meeting in Switzerland has been postponed to another day.

2시간 전

TELEGRAM · Clash Report

Trump privately told several associates that "Venezuela could be America's 51st state and that he would appoint a governor to run it." Source: NYT (reporting on Regime Change: Inside the Imperial Presidency of Donald Trump)

2시간 전

TELEGRAM · Clash Report

Pentagon Demands $80 Billion to Avoid Summer Operations Shutdown Having stretched its budget with the Iran war, Pentagon warns that US military will run out of operational funding this summer unless Congress quickly passes an $80 billion spending bill. READ MORE

2시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

의료용 거대언어모델의 데이터 암기 현상과 환자 정보 유출 위험

AI12시간 전

오픈에이아이, 기업공개 앞둔 핵심 인재 영입 전략

AI21시간 전

뇌-컴퓨터 인터페이스(BCI) 임상 시험의 급격한 증가와 기술적 도약

AI7시간 전

구글, 생성형 AI 스팸 탐지 기술 S-CTS 도입

AI2시간 전

AI 연산 효율성 확보를 위한 자원 최적화 전략

AI12시간 전

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain==1.3.10

langchain==1.3.10

langchain 1.3.10 릴리즈에서는 cryptography, aiohttp, pyjwt 라이브러리 버전이 업데이트되었습니다. 또한, 요약 형식 변경 및 특정 스냅샷에 대한 프로바이더 전략 감지 기능이 수정되었습니다. README 설치 및 리소스 문서도 갱신되었습니다.

22시간 전

LangChainlangchain-core==1.4.8

langchain-core==1.4.8

이번 릴리즈에서는 Python 3.10 미만 버전에 대한 코드가 제거되었으며, `BaseTool.tool_call_schema` 및 `model_json_schema`에 대한 성능 개선이 이루어졌습니다. 또한, v3 스트리밍 이벤트에서 사용 토큰 세부 정보가 보존되고, 명시적 역직렬화 허용 목록에 대한 테스트가 업데이트되었습니다.

22시간 전

Anthropicv0.111.0

v0.111.0

이번 릴리즈에서는 refusal-fallback 미들웨어 요청에 fallback-refusal-middleware 태그를 추가하는 기능이 포함되었습니다. 자세한 변경 사항은 전체 변경 로그를 참조하시기 바랍니다.

1일 전

Anthropicv0.110.0

v0.110.0

이번 릴리즈에서는 새로운 code_execution_20260120 도구에 대한 지원이 추가되었습니다. 또한, 헤더 병합 시 x-stainless-helper가 덮어쓰이는 대신 추가되도록 수정되었으며, 스트림 이벤트 유형이 보존되도록 개선되었습니다.

1일 전

OpenAIv2.43.0

v2.43.0

OpenAI Python 라이브러리가 v2.43.0 버전으로 업데이트되었습니다. 이번 릴리즈에서는 API 관련 변경 사항으로 OpenAPI 사양 또는 Stainless 설정을 업데이트했습니다.