xAI, 1분 음성 데이터 기반 커스텀 보이스 기능 출시
xAI가 1분 분량의 녹음만으로 사용자의 목소리를 복제하는 커스텀 보이스 기능을 공개했습니다. 2단계 인증을 통해 보안을 강화했으며, 기존 음성 API와 연동하여 실시간 서비스에 활용할 수 있습니다.
주장xAI는 사용자가 자신의 목소리를 짧은 녹음만으로 복제할 수 있는 커스텀 보이스 기능을 출시했습니다. 이 기술은 개인화된 음성 인터페이스를 구축하려는 기업과 개인에게 새로운 가능성을 제시합니다.
팩트사용자는 xAI 콘솔에서 1분 분량의 자연스러운 음성을 녹음합니다. 시스템은 이 데이터를 바탕으로 2분 이내에 음성 모델을 생성합니다.
팩트생성된 모델은 텍스트 음성 변환 및 음성 에이전트 API와 즉시 연결됩니다. 이러한 연동은 실시간 음성 상호작용이 필요한 서비스의 개발 속도를 높입니다.
교차검증음성 복제 기술은 딥페이크 등 악용 가능성이 존재합니다. xAI는 이를 방지하기 위해 2단계 인증 절차를 도입했습니다.
팩트사용자는 실시간으로 화면에 표시되는 암호를 읽어야 합니다. 시스템은 두 개의 녹음본을 비교하여 동일인 여부를 검증합니다.
교차검증이 검증 방식은 기존 녹음본을 활용하거나 타인의 목소리를 무단으로 복제하는 행위를 기술적으로 차단합니다. 보안을 강화하여 기술의 신뢰성을 확보하려는 조치입니다.
팩트xAI 콘솔은 28개 언어를 지원하는 80개 이상의 사전 설치된 음성을 보이스 라이브러리에 추가했습니다. 복제된 음성을 사용하는 것에 대한 추가 비용은 발생하지 않습니다.
팩트커스텀 보이스 기능은 최근 출시된 그록 음성 인식 및 텍스트 음성 변환 API를 기반으로 합니다. 이 기능은 그록 보이스 씽크 패스트 1.0 모델과 연동되어 작동합니다.
팩트그록 보이스 씽크 패스트 1.0 모델은 현재 스타링크의 고객 지원 및 영업 부문에서 활용하고 있습니다. 이는 해당 기술이 실제 산업 현장에서 성능을 검증받았음을 의미합니다.
출처더 디코더 보도 내용과 xAI 공식 발표 자료를 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.