AI미검

범용 세계 파운데이션 모델 '오르카(Orca)'의 등장과 차세대 AI 학습 패러다임

연구진은 영상과 언어 데이터를 통합해 세계의 상태 변화를 예측하는 범용 파운데이션 모델 오르카를 공개했습니다. 오르카는 12만 5천 시간의 영상 데이터를 학습해 텍스트 생성, 이미지 예측, 로봇 제어 등 다양한 분야에서 성능을 입증했습니다.

2026년 7월 1일

주장인공지능 기술이 단순한 텍스트 생성을 넘어 물리적 세계를 이해하는 단계로 진입하고 있습니다. 최근 공개된 모델 오르카(Orca)는 세계의 상태를 통합적으로 이해하는 파운데이션 모델로서 새로운 가능성을 제시합니다.

팩트이번 연구는 이하오 왕(Yihao Wang)을 포함한 57명의 다국적 연구진이 주도했습니다. 연구진 소속 정보는 arxiv 등록 기준입니다.

팩트오르카는 기존의 다음 토큰 예측 방식에서 벗어나 차세대 상태 예측(Next-State-Prediction) 모델링을 도입했습니다. 이는 세계의 상태 변화를 이해하고 예측하며 행동으로 옮기는 통합 경로를 제공합니다.

주장오르카는 잠재 공간(Latent Space, 데이터의 핵심 특징을 압축해 표현하는 다차원 공간)을 활용해 멀티모달 신호를 처리합니다. 이를 통해 모델은 복잡한 현실 세계의 정보를 효율적으로 구조화합니다.

팩트연구진은 학습을 위해 12만 5천 시간 분량의 영상 데이터와 1억 6천만 개의 이벤트 주석(Annotation)을 포함한 대규모 데이터셋을 구축했습니다.

팩트모델은 무의식적 학습과 의식적 학습이라는 두 가지 패러다임을 병행합니다. 무의식적 학습은 연속적인 영상에서 자연스러운 상태 변화를 포착하며, 의식적 학습은 언어로 묘사된 사건과 시각 질의응답(VQA)을 통해 의미 있는 변화를 모델링합니다.

주장오르카의 핵심 강점은 범용성에 있습니다. 모델의 근간이 되는 백본(Backbone)을 고정한 채 가벼운 디코더만 학습시켜도 텍스트 생성, 이미지 예측, 로봇의 행동 생성 등 다양한 하위 작업에서 우수한 성능을 보입니다.

팩트실험 결과 오르카는 비슷한 규모의 특화된 모델들과 비교해 더 뛰어난 성능을 기록했습니다. 이는 세계의 상태를 이해하는 잠재 공간이 강화될수록 하위 작업의 성능도 함께 향상됨을 의미합니다.

교차검증본 연구는 arxiv에 공개된 선공개 논문으로 아직 학계의 공식적인 동료 평가(Peer Review) 과정을 거치지 않았습니다. 연구 결과의 학술적 타당성은 향후 검증이 필요합니다.

교차검증기술적 한계도 존재합니다. 대규모 데이터셋을 사용했음에도 불구하고, 모델이 실제 물리 법칙을 얼마나 정확하게 일반화(Generalizability)할 수 있는지에 대한 의문이 남습니다. 또한 복잡한 환경에서의 추론 과정에 대한 설명 가능성(Explainability) 확보가 향후 과제로 남아 있습니다.

주장오르카는 인공지능이 단순히 데이터를 모방하는 수준을 넘어 세계의 작동 원리를 파악하는 방향으로 나아가고 있음을 보여줍니다. 이는 향후 로봇 공학 및 자율 주행 분야에 큰 영향을 미칠 전망입니다.

출처arxiv의 선공개 논문(https://arxiv.org/abs/2606.30534)을 참고했습니다.

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

OSINT Team Blog

Built for the Public, Failing the Analyst: LLM Guardrails in OSINT Intel Work

2일 전

OSINT Team Blog

Human Trafficking OSINT Needs Governance Controls, Not More Clues — AI-assisted OSINT does not fail only when analysts miss signals. It also fails when signals become claims faster than the evidence can…Continue reading on OSINT Team »

2일 전

OSINT Team Blog

Race Condition Vulnerability: How to Find It, Test It, and Report It — I was testing a fintech app a few months ago. The app had a referral bonus feature. Every time you referred a friend, you earned 50 points…Continue reading on OSINT Team »

2일 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

엔비디아 추론 소프트웨어, 토큰당 비용 절감 효과 입증

AI2시간 전

앤스로픽의 과학 연구용 인공지능 클로드 사이언스 출시

AI2시간 전

앤스로픽의 클로드 사이언스 출시 및 기술 산업 현황

AI2시간 전

구글 나노 바나나 2 라이트와 제미나이 옴니 플래시 출시

AI2시간 전

챗GPT 글로벌 사용량 증가와 인공지능 대중화 현황

AI2시간 전

릴리즈 & 논문

전체보기 →

RELEASES

meta-llama/llama-stackv0.5.4

v0.5.4

이번 패치 릴리스는 OCI 종속성 수정 및 현재 `ogx-ai/ogx` 리포지토리에서 게시하는 데 필요한 릴리스 워크플로우 수정을 포함하여 `release-0.5.x` 버전을 업데이트합니다. OCI 종속성이 선택 사항으로 변경되어 OCI가 아닌 배포판에서 기본적으로 OCI 전용 패키지를 가져오지 않도록 하고, OpenTelemetry 부트스트랩 종속성 충돌을 해결하여 릴리스 0.5 컨테이너 빌드를 안정화했습니다. 또한 레거시 0.5.x 패키지 이름에 대해 현재 `ogx-ai` 리포지토리 소유자로부터 릴리스 게시를 활성화하고, 0.5.x 게시 경로에 대한 릴리스 Docker 이미지에서 API 패키지를 고정했습니다.

4일 전

LangChainlangchain-anthropic==1.4.8

langchain-anthropic==1.4.8

이번 릴리즈에서는 Anthropic 관련 기능이 업데이트되었습니다. `content_block_start` 이벤트 발생 시 초기 텍스트를 유지하도록 수정되었으며, `ValueError` 발생 시 메시지가 추가되었습니다. 또한, `langgraph-checkpoint` 라이브러리 버전이 4.1.0에서 4.1.1로 업데이트되었습니다.

4일 전

meta-llama/llama-stackv0.5.3

v0.5.3

OpenTelemetry 부트스트랩 종속성 충돌을 허용하여 릴리스-0.5.x 컨테이너 빌드 문제를 해결했습니다. OCI 종속성 처리를 릴리스 브랜치에 국한하여 광범위한 종속성 변경 없이 다운스트림 빌드를 차단 해제할 수 있도록 했습니다.

4일 전

mistralai/mistral-commonv1.11.5

v1.11.5: Hotfix encoding only two consecutive images

What's Changed Fix multiimage content ordering by @juliendenize in https://github.com/mistralai/mistralcommon/pull/25

5일 전

LangChainlangchain-fireworks==1.4.3

Changes since langchainfireworks==1.4.2 release(fireworks): 1.4.3 chore: bump vcrpy from 8.1.1 to 8.2.1 in /libs/partne

5일 전