MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 5월 26일 화요일

AI 시대, 당신을 더욱 스마트하게

AI미검

마이크로소프트 등 연구진, 38억 파라미터로 60억 모델 능가하는 생성형 AI 'Lens' 공개

마이크로소프트와 주요 연구기관이 공동 개발한 'Lens'는 기존 모델 대비 80% 이상의 학습 비용을 절감하면서도 성능은 뛰어넘는 효율성을 입증했습니다. 고밀도 데이터셋과 최적화된 아키텍처를 통해 텍스트-이미지 생성 모델의 새로운 기준을 제시합니다.

2026년 5월 26일

팩트마이크로소프트와 공동 연구진이 38억 개의 파라미터(매개변수)를 가진 텍스트-이미지 생성 모델 'Lens'를 발표했습니다. 연구진 소속 정보는 arxiv 등록 기준입니다.

주장Lens는 기존 60억 파라미터 이상의 최첨단 모델들과 대등하거나 오히려 앞서는 성능을 기록했습니다. 모델의 규모를 줄이면서도 성능을 높인 점이 이번 연구의 핵심 성과입니다.

팩트Lens는 기존 모델인 Z-Image와 비교해 학습에 필요한 컴퓨팅 자원을 19.3% 수준으로 대폭 낮췄습니다. 이는 효율적인 AI 학습 전략이 모델 성능 향상에 기여할 수 있음을 보여줍니다.

팩트연구진은 'Lens-800M'이라는 8억 개의 이미지-텍스트 쌍으로 구성된 데이터셋을 사용했습니다. 각 캡션은 GPT-4.1을 통해 생성되었으며 평균 109개의 단어를 포함해 풍부한 의미적 정보를 제공합니다.

팩트모델은 잠재 공간(Latent Space, 데이터의 핵심 특징을 압축하여 표현하는 다차원 공간)을 개선하기 위해 의미론적 VAE(변분 오토인코더)를 도입했습니다. 또한 강력한 언어 인코더를 활용해 최적화 속도를 높이고 다국어 범용성을 확보했습니다.

주장이번 연구는 학습 배치(데이터 묶음)를 구성할 때 다양한 해상도와 종횡비를 혼합하는 방식을 채택했습니다. 이를 통해 각 최적화 단계에서 시각적 정보의 포괄 범위를 넓히는 혁신을 이뤄냈습니다.

팩트학습 후에는 분류 체계 기반의 프롬프트와 구조화된 보상 체계를 적용한 강화학습(RL)을 수행했습니다. 이를 통해 이미지의 인위적인 왜곡을 줄이고 시각적 품질을 개선했습니다.

팩트Lens는 1024x1024 해상도의 이미지를 엔비디아 H100 GPU 한 대에서 3.15초 만에 생성합니다. 증류 기술을 적용한 터보 버전은 4단계 추론 과정을 거쳐 0.84초 만에 이미지를 만들어냅니다.

교차검증해당 논문은 arxiv에 선공개된 프리프린트(Preprint) 상태로, 학계의 공식적인 동료 평가(Peer Review)를 거치지 않았습니다. 연구 결과의 학술적 타당성은 향후 검증이 필요합니다.

교차검증모델의 성능이 특정 벤치마크 데이터셋에 과적합되었을 가능성이 존재합니다. 또한 다양한 언어와 문화적 맥락에서 생성 결과가 일관된 품질을 유지하는지에 대한 일반화 성능은 추가적인 실증 연구가 요구됩니다.

주장Lens는 1:2에서 2:1까지의 자유로운 종횡비와 최대 1440x1440 해상도를 지원합니다. 이는 생성형 AI 모델이 실무 환경에서 더욱 유연하게 활용될 수 있는 가능성을 열어줍니다.

출처arxiv의 선공개 논문(https://arxiv.org/abs/2605.21573)을 참고했습니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

PAPERS