칭화대, 범용 객체 계수 AI 모델 카운트 애니싱 공개
칭화대학교 연구진이 의료 영상부터 위성 사진까지 다양한 환경의 객체를 단일 모델로 계수하는 카운트 애니싱을 개발했습니다. 기존 모델 대비 정확도를 대폭 개선했으나, 고밀도 환경에서의 식별 능력은 여전히 과제로 남았습니다.
주장칭화대학교 연구진이 개발한 카운트 애니싱은 의료 영상, 위성 사진, 군중 속 인원 등 서로 다른 환경의 객체를 하나의 모델로 계수합니다. 기존 시스템이 특정 도메인에만 최적화되어 범용성이 부족했던 문제를 해결합니다.
팩트이 시스템은 메타의 사전 학습 모델인 세그먼트 애니싱 모델 3를 기반으로 구축되었습니다. 연구진은 모델 전체를 재학습하는 대신 카운팅 작업을 수행하는 어댑터 구성 요소를 추가하는 방식을 택했습니다.
팩트모델 학습을 위해 연구진은 씨엘오씨라는 새로운 데이터셋을 구축했습니다. 해당 데이터셋은 6개 도메인에 걸쳐 22만 장의 이미지와 619개의 카테고리, 1,500만 개의 라벨링된 객체를 포함합니다.
팩트카운트 애니싱은 대형 객체에 상자를 표시하는 방식과 소형 객체에 점을 찍는 방식을 결합합니다. 연구진은 두 방식의 결과를 병합할 때 중복 계수를 방지하는 규칙을 적용하여 정확도를 높였습니다.
팩트자체 테스트 결과, 카운트 애니싱은 카운트 지디나 클립 카운트 등 경쟁 모델보다 우수한 성능을 보였습니다. 카테고리당 평균 오차는 9개 수준으로, 경쟁 모델 대비 2배 이상 정확합니다.
주장객체 계수는 의료 진단, 농작물 수확량 예측, 도시 교통 분석 등 실생활과 직결된 중요한 작업입니다. 이번 연구는 범용 인공지능이 인간의 기본적인 시각적 인지 능력을 따라잡기 위한 필수 단계입니다.
교차검증다만 모델의 한계점도 존재합니다. 모호한 용어나 고도로 전문적인 분야에서는 객체를 놓치거나 잘못 분류하는 사례가 발생합니다.
교차검증매우 밀집된 장면에서 객체가 겹쳐 있을 경우, 두 예측이 동일한 객체인지 구분하는 데 어려움을 겪습니다. 군중 계수 분야에서는 여전히 특화된 전문 시스템이 더 나은 성능을 보이기도 합니다.
팩트최근 베이비비전 벤치마크 테스트에 따르면, 최신 인공지능 모델은 3세 아동보다 낮은 시각적 인지 능력을 보였습니다. 특히 가려진 3차원 블록을 세는 작업에서 인공지능 모델의 성공률은 20.5퍼센트에 그쳤습니다.
주장인공지능의 시각적 인지 능력은 실생활의 복잡한 데이터를 처리하는 핵심 역량입니다. 이번 연구는 범용성을 확보했다는 점에서 기술적 진보를 이뤘습니다.
주장앞으로 연구진은 고밀도 환경에서의 식별 정확도를 높이는 데 집중할 계획입니다. 이는 인공지능이 인간 수준의 시각적 판단력을 갖추기 위한 핵심 과제입니다.
출처더 디코더 보도 내용 및 아카이브 논문 자료를 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

