오포, 온디바이스 안드로이드 AI 에이전트 엑스-옴니클로 공개
오포가 클라우드 서버를 거치지 않고 기기 내부에서 직접 작동하는 AI 에이전트 엑스-옴니클로를 공개했습니다. 이 기술은 사용자 데이터를 외부로 유출하지 않고 복잡한 작업을 수행하며 깃허브를 통해 소스 코드를 제공합니다.
주장오포의 멀티-엑스 팀이 개발한 엑스-옴니클로(X-OmniClaw)는 클라우드 서버를 거치지 않고 안드로이드 기기 내부에서 직접 작동하는 인공지능 에이전트입니다. 이 시스템은 사용자의 카메라, 화면, 음성 데이터를 기기 밖으로 전송하지 않고도 복잡한 작업을 수행하도록 설계되었습니다.
팩트엑스-옴니클로는 기존 클라우드 기반 가상 안드로이드 서비스인 레드핑거, 알리바바의 우잉, 텐센트 클라우드 폰과 차별화됩니다. 기존 서비스들은 데이터 센터 내 가상화 환경에서 에이전트를 실행하여 로컬 센서나 카메라 접근에 한계가 있었으나, 오포의 기술은 물리적 기기에서 직접 구동합니다.
팩트해당 에이전트는 비전 언어 모델을 사용하여 카메라로 촬영한 제품 가격을 타오바오 등에서 검색하거나 화면 속 연습 문제를 해결합니다. 사용자의 갤러리 사진을 분석하여 특정 주제별로 앨범을 자동으로 생성하는 기능도 포함합니다.
주장엑스-옴니클로는 개인정보 보호를 위해 로컬 데이터 처리 방식을 채택합니다. 갤러리 사진은 기기 내에서 객체와 장면 정보로 요약되어 마크다운 파일로 저장되며, 민감한 정보는 저장 전 필터링 과정을 거칩니다.
교차검증클라우드 기반 비전 모델은 강력한 연산 능력을 제공하지만 데이터 유출 위험이 존재합니다. 오포는 이러한 위험을 방지하기 위해 온디바이스 모델로의 전환을 추진하며 원본 이미지가 기기 외부로 나가지 않도록 설계했습니다.
팩트시스템은 사용자의 행동을 복제하여 재사용 가능한 기술로 변환합니다. 매번 단계를 반복하는 대신 딥링크를 통해 앱의 특정 페이지로 직접 이동하며, 엑스엠엘(XML) 구조 데이터와 시각적 접지 모델을 결합하여 정확한 터치 지점을 찾아냅니다.
주장이번 프로젝트는 오픈소스 헤르메스 앱 코드베이스를 기반으로 하며, 피시(PC) 중심의 오픈클로와 누스 리서치의 헤르메스 에이전트 사이의 기술적 위치를 점합니다. 이는 온디바이스 인공지능 에이전트 생태계에서 안드로이드 기기의 활용도를 극대화하려는 시도입니다.
팩트구글 역시 최근 젬마 4를 통해 스마트폰에서 완전히 로컬로 작동하는 인공지능 에이전트 기능을 선보였습니다. 오포의 엑스-옴니클로는 바이트댄스의 유아이-타스(UI-TARS)와 같은 시각적 지유아이(GUI) 에이전트 방식에 구조적 엑스엠엘 데이터를 결합하여 동적 인터페이스에서의 오류율을 낮췄습니다.
팩트엑스-옴니클로의 소스 코드와 관련 자산은 현재 깃허브를 통해 공개되어 있습니다. 개발자들은 이를 통해 기기 내에서 작동하는 에이전트의 인식, 제어, 앱 상호작용 로직을 직접 확인하고 활용할 수 있습니다.
출처더 디코더(The Decoder) 보도 내용과 아카이브(Arxiv) 기술 보고서를 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.
