AI미검

거대언어모델을 소형화하는 새로운 프로그래밍 패러다임, PAW 공개

하버드대학교 등 공동 연구진이 거대언어모델의 연산 효율을 극대화하는 '프로그램-애즈-웨이트(PAW)' 기술을 발표했습니다. 이 기술은 복잡한 자연어 작업을 경량화된 신경망 아티팩트로 변환하여 추론 비용과 메모리 사용량을 획기적으로 줄입니다.

2026년 7월 3일

주장하버드대학교와 공동 연구진이 발표한 '프로그램-애즈-웨이트(PAW)'는 거대언어모델(LLM)을 활용한 소프트웨어 개발 방식을 근본적으로 재정의합니다. 연구진은 기존의 규칙 기반 프로그래밍이 어려운 작업을 거대언어모델에 의존하는 현상을 극복하고자 했습니다.

팩트연구진은 자연어 명세를 로컬에서 실행 가능한 소형 신경망 아티팩트(Neural Artifact)로 변환하는 '퍼지 함수 프로그래밍(Fuzzy-function programming)' 개념을 제안했습니다. 이는 모델을 매번 호출하는 대신, 특정 기능을 수행하는 작은 프로그램을 생성해 재사용하는 방식입니다.

팩트이번 연구를 위해 연구진은 1천만 개의 예제로 구성된 '퍼지벤치(FuzzyBench)' 데이터셋을 구축했습니다. 이를 바탕으로 40억 개의 파라미터를 가진 컴파일러를 훈련하여 고효율 어댑터를 생성하도록 설계했습니다.

팩트0.6B(6억 개) 파라미터 규모의 'Qwen3' 인터프리터(컴퓨터 언어를 즉시 실행하는 프로그램)가 PAW 프로그램을 실행할 경우, 32B(320억 개) 규모의 Qwen3 모델을 직접 사용하는 것과 대등한 성능을 보입니다.

팩트PAW 기술을 적용하면 추론에 필요한 메모리 사용량을 기존 대비 50분의 1 수준으로 절감할 수 있습니다. 또한 맥북 M3 환경에서 초당 30토큰(Token, 언어 모델이 처리하는 최소 단위)의 처리 속도를 기록했습니다.

주장PAW는 거대언어모델을 입력값마다 문제를 해결하는 도구가 아닌, 기능을 만드는 '도구 제작자'로 전환합니다. 함수 정의 시점에 단 한 번만 모델을 호출하면 되므로 이후 실행 과정에서 발생하는 비용과 지연 시간을 최소화합니다.

교차검증본 연구는 아카이브(arxiv)에 공개된 선공개 논문으로, 아직 학계의 공식적인 동료 평가(Peer Review) 과정을 거치지 않았습니다. 따라서 제시된 성능 수치와 방법론은 향후 검증 과정에서 수정될 가능성이 있습니다.

교차검증기술적 측면에서 PAW는 특정 도메인에 최적화된 소형 모델을 생성하는 방식이므로, 학습 데이터셋인 퍼지벤치에 포함되지 않은 범용적인 작업이나 복잡한 추론 문제에서는 성능 저하가 발생할 수 있습니다. 또한 모델의 가중치를 고정하는 방식이기에 새로운 데이터에 대한 적응성(Generalizability) 측면에서 추가 연구가 필요합니다.

주장이번 성과는 로컬 환경에서 거대언어모델을 운용하려는 기업과 개발자들에게 새로운 대안을 제시합니다. 외부 API 의존도를 낮추어 데이터 보안과 비용 효율성을 동시에 확보할 수 있기 때문입니다.

팩트연구진은 이번 프로젝트를 통해 로컬 실행의 중요성을 강조하며, 클라우드 기반 API 호출이 가진 재현성 부족과 비용 문제를 해결하고자 했습니다. PAW는 오프라인 환경에서도 고성능의 언어 모델 기능을 구현할 수 있는 토대를 마련했습니다.

주장향후 PAW와 같은 경량화 기술이 보편화되면 스마트폰이나 노트북 등 온디바이스(On-device) AI 시장의 성장이 더욱 가속화될 것으로 전망됩니다. 거대언어모델의 거대한 파라미터 규모가 더 이상 로컬 실행의 걸림돌이 되지 않기 때문입니다.

출처arxiv의 선공개 논문(https://arxiv.org/abs/2607.02512)을 참고했습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Sami Hamdi | Geopolitical Analyst | The International Interest:   Palestine has a long history of Muslims, Jews, and Christians living side by side. Zionism ruined it by expelling Muslims & Christians. Today, Israel operates as an apartheid state, mirroring America's Jim Crow laws with segregated infrastructure. Israel's greatest fear is not a military conquest of Tel Aviv. Its greatest fear is equality of all Palestinians. If forced into a one-state solution with equal voting r

3시간 전

TELEGRAM · Clash Report

WATCH: Iran’s Ghalibaf cries during the farewell ceremony of late Supreme Leader Ali Khamenei.

3시간 전

TELEGRAM · Clash Report

Sami Hamdi | Geopolitical Analyst | The International Interest:   Iran has emerged stronger by exposing the limitations of US power that are now driving a schism between the US and Israel. Its regional proxies, like Hezbollah and the Houthis, have been preserved. Gulf states that once hoped the US and Israel would defeat Iran are now quietly going to Tehran to negotiate their own safety. Iran has proved it can squeeze the global economy through the Strait of Hormuz, even without weaponizing

3시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

피드먼트 헬스케어의 환자 신뢰 구축을 위한 마케팅 전략

마케팅17시간 전

클라우드플레어 AI 크롤러 제어 정책 도입과 검색 엔진 영향

마케팅12시간 전

범암 면역항암제 반응 예측 AI 모델 컴퍼스 개발

AI7시간 전

AI 산업의 지속 가능한 성장을 위한 경쟁과 협력 전략

AI17시간 전

앤스로픽, 클로드 코드 시스템 프롬프트 80퍼센트 축소

AI17시간 전

릴리즈 & 논문

전체보기 →

RELEASES

Transformersv5.13.0

릴리즈 v5.13.0

이번 릴리즈에서는 KimiK 2.5, 2.6, 2.7 모델과 MiMo-V2-Flash 모델, 그리고 NVIDIA의 Nemotron 3.5 ASR 모델이 추가되었습니다. KimiK 모델은 장기 코딩, 코딩 기반 디자인, 자율 실행 등에서 향상된 기능을 제공하며, MiMo-V2-Flash는 긴 컨텍스트 처리 능력과 추론 효율성 사이의 균형을 맞춘 모델입니다. Nemotron 3.5 ASR은 스트리밍 및 배치 환경 모두에서 고품질 다국어 음성 인식을 지원합니다.

6시간 전

Anthropicv0.116.0

v0.116.0

이번 릴리즈에서는 `agent-memory-2026-07-22` 베타 API 헤더가 추가되었습니다. 이 변경 사항은 새로운 기능과 관련된 API 지원을 확장합니다.

1일 전

Anthropicv0.115.1

0.115.1 (20260701) Full Changelog: v0.115.0...v0.115.1(https://github.com/anthropics/anthropicsdkpython/compare/v0.115

2일 전

Anthropicv0.115.0

v0.115.0

이번 릴리즈에서는 Managed Agents 이벤트 델타 스트리밍, 에이전트 재정의, 역방향 페이지네이션, Vault 자격 증명 주입 범위 지정, 에이전트 및 배포 웹훅 이벤트에 대한 지원이 추가되었습니다. API 기능이 전반적으로 향상되었습니다.

3일 전