딥시크 V4 시리즈의 기술적 특징과 성능 분석
딥시크가 1.6조 개의 파라미터를 갖춘 V4 시리즈를 공개했습니다. 오픈 웨이트 모델로서 높은 효율성을 확보했으나, 실무 적용 시 높은 환각 현상에 대한 주의가 요구됩니다.
주장딥시크 V4 시리즈는 오픈 웨이트 모델 중 최상위 수준의 성능을 구현하며 긴 문맥 처리와 에이전트 코딩 분야에서 기술적 진전을 보였습니다. 다만, 업계에서는 해당 모델이 최상위 폐쇄형 모델인 GPT-5.x나 오퍼스 4.7의 성능에는 미치지 못한다고 평가합니다.
팩트딥시크 V4 프로는 총 1조6000억 개의 파라미터를 보유하며, 이 중 490억 개가 활성 파라미터로 작동합니다. 하위 모델인 V4 플래시는 총 2840억 개의 파라미터와 130억 개의 활성 파라미터를 갖췄습니다.
팩트이번 모델은 100만 토큰의 문맥 길이를 지원하며, 32조에서 33조 개의 토큰으로 학습을 완료했습니다. 이는 이전 버전인 V3.2가 지원하던 12만8000 토큰 대비 대폭 확장된 수치입니다.
교차검증딥시크 V4는 100만 토큰의 문맥을 처리할 때 이전 모델 대비 27%의 연산량과 10%의 KV 캐시 메모리만을 사용합니다. 이는 압축 희소 어텐션과 고압축 어텐션 기술을 적용해 효율성을 높인 결과입니다.
팩트딥시크 V4 모델은 화웨이 어센드 칩에서 구동이 가능하도록 설계되었습니다. 이는 엔비디아와 쿠다 의존도를 낮추려는 중국의 기술 독립 전략과 맥락을 같이 합니다.
팩트모델 체크포인트는 FP4와 FP8의 혼합 정밀도를 사용합니다. 이를 통해 전체 모델을 단일 8x B200 노드에서 구동할 수 있어 인프라 운영 비용을 절감합니다.
주장딥시크 V4의 등장은 오픈 소스 인공지능 생태계의 민주화를 가속합니다. 그러나 모델 구조가 복잡해 일반적인 연구소에서 이를 직접 재현하기는 현실적으로 어렵다는 지적이 존재합니다.
팩트딥시크 V4 프로의 API 가격은 입력 100만 토큰당 1.74달러, 출력 100만 토큰당 3.48달러로 책정되었습니다. V4 플래시는 입력 0.14달러, 출력 0.28달러로 상대적으로 저렴한 가격에 제공됩니다.
교차검증아티피셜 애널리시스의 벤치마크 결과, V4 프로는 오픈 웨이트 모델 중 2위를 기록했습니다. 다만 94%에 달하는 높은 환각률을 보여 실무 적용 시 주의가 필요합니다.
출처해당 내용은 레이턴트 스페이스(Latent Space)의 딥시크 V4 프로 분석 리포트를 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.