MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 5월 3일 일요일

전문가의 AI 하이브리드 리서치 랩

AI검증

코히어, 오픈소스 음성 인식 모델 '트랜스크라이브' 공개

캐나다 인공지능 기업 코히어가 새로운 자동 음성 인식 모델 '트랜스크라이브'를 발표했습니다. 이 모델은 주요 벤치마크에서 업계 최고 수준의 성능을 기록하며 기업용 음성 인터페이스 시장 공략을 예고했습니다.

2026년 3월 28일

주장코히어는 새로 공개한 오픈소스 자동 음성 인식 모델인 트랜스크라이브가 업계 최고의 성능을 갖췄다고 평가합니다. 이 모델은 기존의 강력한 경쟁 모델을 제치고 음성 인식 분야의 새로운 기준을 제시합니다.

팩트트랜스크라이브는 허깅페이스 오픈 자동 음성 인식 리더보드에서 평균 단어 오류율 5.42퍼센트를 기록하며 1위에 올랐습니다. 이는 오픈에이아이의 위스퍼 라지 v3와 일레븐랩스 스크라이브 v2를 능가하는 수치입니다.

팩트해당 모델은 20억 개의 파라미터로 구성되었으며 영어와 독일어, 프랑스어, 일본어를 포함한 14개 언어를 지원합니다. 코히어는 이 모델이 비슷한 규모의 다른 모델보다 뛰어난 처리량을 제공한다고 설명합니다.

팩트트랜스크라이브는 아파치 2.0 라이선스로 배포되어 누구나 허깅페이스에서 내려받을 수 있습니다. 사용자는 코히어의 응용 프로그램 인터페이스와 모델 볼트 플랫폼을 통해서도 이 모델에 접근합니다.

교차검증다만 모델의 성능은 특정 벤치마크 환경에서 측정된 결과이므로 실제 다양한 환경에서의 실사용 성능과는 차이가 발생할 수 있습니다. 사용자의 하드웨어 환경에 따라 처리 속도와 정확도가 달라질 가능성도 존재합니다.

팩트코히어는 앞으로 트랜스크라이브를 자사 인공지능 에이전트 플랫폼인 노스에 통합할 계획입니다. 이는 기업용 인공지능 시장에서 음성 인터페이스 역량을 강화하려는 전략입니다.

주장이번 모델 공개는 인공지능 업계에서 음성 인식 기술의 오픈소스화가 가속화되고 있음을 보여줍니다. 기업은 독점 기술을 넘어 개방형 생태계를 통해 기술 표준을 선점하려 합니다.

교차검증하지만 음성 인식 시장은 오픈에이아이와 같은 거대 기업이 이미 강력한 생태계를 구축하고 있습니다. 코히어가 오픈소스 전략으로 얼마나 많은 개발자와 기업을 자사 플랫폼으로 유입시킬지가 관건입니다.

팩트캐나다에 본사를 둔 코히어는 그동안 기업용 대규모 언어 모델 개발에 집중해 왔습니다. 이번 음성 인식 모델 출시는 코히어의 기술 포트폴리오가 텍스트를 넘어 음성 영역으로 확장됨을 의미합니다.

출처https://the-decoder.com/cohere-releases-open-source-model-that-tops-speech-recognition-benchmarks/ 및 코히어 공식 발표 자료를 참조했습니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

6시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

1일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

1일 전

meta-llama/llama-stackv0.8.0

v0.8.0

이번 릴리즈에서는 Anthropic Messages API를 네이티브로 지원하며, 대화 압축 기능이 추가되었습니다. 또한, 기존 Eval API 및 관련 API가 제거되었고, 문서 전반에 걸쳐 UX 개선 및 최적화가 이루어졌습니다. 보안 취약점 수정 및 CI/CD 파이프라인 개선 작업도 포함되었습니다.

1일 전

LangChainlangchain==1.3.0a1

langchain v1.3.0a1

이번 릴리즈에서는 `create_agent`에 `stream_events` 기능이 추가되었으며, HITL 미들웨어에 `respond` 결정 기능이 포함되었습니다. 또한, 에이전트 상태를 도구 디스패치에 인라인하는 것을 중단하여 성능을 개선했습니다.

1일 전

PAPERS