AI미검

지푸 AI, 디자인 시안을 코드로 변환하는 GLM-5V-Turbo 공개

지푸 AI가 디자인 시안을 분석해 프론트엔드 코드로 변환하는 멀티모달 모델 GLM-5V-Turbo를 공개했습니다. 이 모델은 시각적 이해와 코드 생성 능력을 결합해 AI 에이전트의 워크플로우 효율성을 높이는 데 집중합니다.

2026년 4월 3일

주장지푸 AI는 GLM-5V-Turbo를 통해 시각적 이해와 코드 생성 능력을 결합하여 에이전트 워크플로우의 효율성을 극대화합니다. 이 모델은 단순한 텍스트 처리를 넘어 디자인 시안을 직접 분석하고 실행 가능한 프론트엔드 코드로 변환합니다.

팩트GLM-5V-Turbo는 20만 토큰의 컨텍스트 윈도우를 지원하며 최대 12만 8000토큰의 출력을 처리합니다. 모델은 사고 모드, 스트리밍 출력, 함수 호출 및 컨텍스트 캐싱 기능을 포함합니다.

팩트지푸 AI는 자체 개발한 비전 인코더인 CogViT를 사용하여 이미지와 텍스트를 학습 초기부터 통합 처리합니다. 추론 과정에서 여러 토큰을 동시에 예측하여 출력 속도를 높였습니다.

팩트해당 모델은 안드로이드월드와 웹보이저 같은 그래픽 사용자 인터페이스(GUI) 환경 탐색 벤치마크에서 높은 점수를 기록했습니다. 디자인 시안을 바탕으로 레이아웃 구조와 기능을 재구성하여 픽셀 단위의 시각적 일관성을 유지합니다.

주장이번 모델은 단순한 스크린샷 재현을 넘어 자율적인 탐색을 통한 코드 생성을 지향합니다. 클로드 코드와 같은 프레임워크와 결합하여 웹사이트를 스스로 탐색하고 페이지 전환을 매핑하며 필요한 시각적 요소를 수집합니다.

팩트지푸 AI는 에이전트 훈련 데이터 부족 문제를 해결하고자 다단계의 검증 가능한 데이터 시스템을 구축했습니다. 에이전트의 메타 기술을 사전 학습 단계에 포함하여 초기부터 행동 예측과 실행 능력을 강화했습니다.

팩트GLM-5V-Turbo는 현재 지푸 AI 플랫폼을 통해 API 형태로만 제공됩니다. 가격은 입력 토큰 100만 개당 1.2달러, 출력 토큰 100만 개당 4달러로 책정되었으며 모델 가중치는 공개되지 않았습니다.

교차검증지푸 AI는 이 모델이 멀티모달 코딩 및 GUI 에이전트 벤치마크에서 우수한 성능을 보인다고 밝히지만, 아직 독립적인 외부 기관의 검증은 이루어지지 않았습니다. 텍스트 전용 코딩 작업에서도 성능 저하가 없다고 보고되었으나 실제 개발 환경에서의 범용성은 추가 확인이 필요합니다.

교차검증중국의 AI 기업들은 미국의 수출 규제 상황 속에서 화웨이 등 자국 칩을 활용한 모델 개발에 집중합니다. 지푸 AI의 이전 모델인 GLM-5가 엔비디아 GPU뿐만 아니라 중국산 칩에서도 구동된다는 점은 기술적 자립 측면에서 중요한 의미를 지닙니다.

팩트알리바바의 Qwen3.5-Omni 등 경쟁사들 또한 텍스트, 이미지, 오디오, 비디오를 통합 처리하는 옴니모달 모델을 개발하고 있습니다. 이는 시각적 입력에서 코드를 생성하는 기술이 향후 AI 에이전트 시장의 핵심 경쟁 분야임을 보여줍니다.

출처더 디코더(The Decoder)의 보도 내용을 교차 검증했습니다. (https://the-decoder.com/zhipu-ais-glm-5v-turbo-turns-design-mockups-directly-into-executable-front-end-code)

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Former German Chancellor Scholz: After all, Russia did not conquer Ukraine. This is a big success.

3시간 전

TELEGRAM · Clash Report

Former German Chancellor Scholz: We were an engineers’ country. Now we’re a lawyers’ country. Other countries… build a national railway system in 20 years. We cannot build a commuter line in 20 years.

3시간 전

TELEGRAM · Clash Report

Russia says Russia will get ~200 billion rubles ($2.7 billion) extra from higher oil prices.

3시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

트럼프의 이란 평화안 검토와 공습 재개 경고

국제20시간 전

자석 부착형 초소형 전자책 단말기 Xteink X3의 특징과 한계

AI11시간 전

이스라엘, 미국산 F-35 및 F-15IA 전투기 추가 도입 승인

국제11시간 전

이스라엘의 레바논 남부 강제 이주 명령 확대와 작전 범위 확장

국제14시간 전

아카데미 시상식, AI 생성 연기 및 각본 후보 자격 제한

AI20시간 전

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-anthropic==1.4.3

langchain-anthropic==1.4.3

이번 릴리즈에서는 Anthropic 관련 기능이 1.4.3 버전으로 업데이트되었습니다. 또한, `create_agent`로의 이전 경고 대상 재지정 및 기타 내부 정리 작업이 포함되었습니다. 문서의 X 핸들 참조 업데이트와 Anthropic 관련 HTTPX 최종 처리기 보호 기능도 개선되었습니다.

7시간 전

LangChainlangchain-classic==1.0.5

langchain-classic==1.0.5

langchain-classic 1.0.5 릴리즈에서는 `create_agent`로의 마이그레이션을 위한 경고 메시지 수정 및 기타 정리 작업이 포함되었습니다. 또한, 일부 의존성 버전이 업데이트되었으며, 코어 라이브러리의 최소 버전이 상향 조정되었습니다.

7시간 전

vLLMv0.20.1

vLLM v0.20.1

이번 릴리즈는 v0.20.0 버전을 기반으로 하며, DeepSeek V4의 안정성 및 성능 개선에 중점을 두었습니다. 또한 여러 중요한 버그 수정이 포함되었습니다. 주요 변경 사항으로는 DeepSeek V4 모델 지원, 성능 향상을 위한 다양한 최적화, 그리고 CUDA 그래프 및 메모리 관련 버그 수정 등이 있습니다.

16시간 전

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

2일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

2일 전

PAPERS

cs.AI

좋은 터미널 에이전트 벤치마크 과제란 무엇인가: 적대적이고 어렵고 명확한 평가 설계를 위한 가이드라인

4일 전

cs.CV

PRISM: 멀티모달 강화 학습을 위한 블랙박스 온폴리시 증류 기반 사전 정렬

4일 전

cs.AI

발현된 정렬 불량 페르소나의 일관성 특성화

4일 전

cs.AI