코히어, 오픈소스 음성 인식 모델 '트랜스크라이브' 공개
캐나다 인공지능 기업 코히어가 새로운 자동 음성 인식 모델 '트랜스크라이브'를 발표했습니다. 이 모델은 주요 벤치마크에서 업계 최고 수준의 성능을 기록하며 기업용 음성 인터페이스 시장 공략을 예고했습니다.
주장코히어는 새로 공개한 오픈소스 자동 음성 인식 모델인 트랜스크라이브가 업계 최고의 성능을 갖췄다고 평가합니다. 이 모델은 기존의 강력한 경쟁 모델을 제치고 음성 인식 분야의 새로운 기준을 제시합니다.
팩트트랜스크라이브는 허깅페이스 오픈 자동 음성 인식 리더보드에서 평균 단어 오류율 5.42퍼센트를 기록하며 1위에 올랐습니다. 이는 오픈에이아이의 위스퍼 라지 v3와 일레븐랩스 스크라이브 v2를 능가하는 수치입니다.
팩트해당 모델은 20억 개의 파라미터로 구성되었으며 영어와 독일어, 프랑스어, 일본어를 포함한 14개 언어를 지원합니다. 코히어는 이 모델이 비슷한 규모의 다른 모델보다 뛰어난 처리량을 제공한다고 설명합니다.
팩트트랜스크라이브는 아파치 2.0 라이선스로 배포되어 누구나 허깅페이스에서 내려받을 수 있습니다. 사용자는 코히어의 응용 프로그램 인터페이스와 모델 볼트 플랫폼을 통해서도 이 모델에 접근합니다.
교차검증다만 모델의 성능은 특정 벤치마크 환경에서 측정된 결과이므로 실제 다양한 환경에서의 실사용 성능과는 차이가 발생할 수 있습니다. 사용자의 하드웨어 환경에 따라 처리 속도와 정확도가 달라질 가능성도 존재합니다.
팩트코히어는 앞으로 트랜스크라이브를 자사 인공지능 에이전트 플랫폼인 노스에 통합할 계획입니다. 이는 기업용 인공지능 시장에서 음성 인터페이스 역량을 강화하려는 전략입니다.
주장이번 모델 공개는 인공지능 업계에서 음성 인식 기술의 오픈소스화가 가속화되고 있음을 보여줍니다. 기업은 독점 기술을 넘어 개방형 생태계를 통해 기술 표준을 선점하려 합니다.
교차검증하지만 음성 인식 시장은 오픈에이아이와 같은 거대 기업이 이미 강력한 생태계를 구축하고 있습니다. 코히어가 오픈소스 전략으로 얼마나 많은 개발자와 기업을 자사 플랫폼으로 유입시킬지가 관건입니다.
팩트캐나다에 본사를 둔 코히어는 그동안 기업용 대규모 언어 모델 개발에 집중해 왔습니다. 이번 음성 인식 모델 출시는 코히어의 기술 포트폴리오가 텍스트를 넘어 음성 영역으로 확장됨을 의미합니다.
출처https://the-decoder.com/cohere-releases-open-source-model-that-tops-speech-recognition-benchmarks/ 및 코히어 공식 발표 자료를 참조했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.