인간 선호도 예측 정확도 향상을 위한 3개 선택지 활용법
미국 매사추세츠 공과대학교(MIT) 연구진이 인간의 선호도를 정확히 예측하기 위해 3개 이상의 선택지를 비교하는 새로운 방법론을 제시했습니다. 기존 2개 선택지 비교 모델의 한계를 극복하고 인공지능 정렬의 효율성을 높이는 방안을 소개합니다.
주장인간의 선호도를 정확히 예측하려면 기존의 2개 선택지 비교 방식에서 벗어나 3개 이상의 선택지를 활용하는 이른바 '3의 힘'이 필요합니다. 이는 지난 100년간 경제학과 심리학 분야에서 활용해 온 무작위 효용 모델(RUM)의 한계를 극복하는 전환점이 됩니다.
팩트1927년 심리학자 루이스 레온 서스톤은 사람들이 여러 선택지 중 가장 높은 가치를 지닌 대상을 선택한다는 이론을 제시하며 무작위 효용 모델의 기초를 닦았습니다. 이 모델은 인간의 내면적 선호도를 정량화하여 다양한 상황에서의 행동을 예측하는 데 널리 사용합니다.
교차검증기존의 2개 선택지 비교 방식은 사용자에게 인지적 부담이 적다는 장점이 있습니다. 하지만 연구진은 이 방식만으로는 선택지 간의 복잡한 상관관계를 파악하는 것이 수학적으로 불가능하다고 지적합니다.
팩트넷플릭스나 아마존 같은 플랫폼이 사용자 선호도를 파악할 때 2개 항목만 비교하면 데이터의 독립성 가정에 갇히게 됩니다. 실제 인간의 선호도는 서로 연결되어 있으므로 이를 무시하면 추천 알고리즘의 정확도가 하락합니다.
주장3개 선택지를 순서대로 평가하게 하면 개별 선택지 간의 상관관계를 명확히 식별할 수 있습니다. 이는 단순히 데이터를 늘리는 것이 아니라 데이터의 질적 구조를 개선하여 전체적인 선호도 지도를 그리는 핵심 방법론입니다.
팩트이번 연구는 2026년 4월 브라질 리우데자네이루에서 열린 국제 학습 표현 학회(ICLR)에서 발표되었습니다. 예슈완트 체라파남제리, 가브리엘레 파리나, 콘스탄티노스 다스칼라키스, 소브한 모하마드푸르가 공동 저자로 참여했습니다.
팩트연구진이 개발한 알고리즘은 선택지의 개수가 늘어나도 필요한 실험 횟수가 지수적으로 증가하지 않는 효율성을 보입니다. 이는 대규모 데이터베이스를 다루는 현대 산업 현장에서 실용적인 해결책이 됩니다.
주장무작위 효용 모델은 앞으로 인공지능 모델의 정렬(Alignment) 과정에서 중요한 역할을 합니다. 특히 거대 언어 모델(LLM)이 인간의 선호에 맞는 톤과 스타일을 학습하는 데 이 모델이 핵심적인 기여를 합니다.
교차검증몬트리올 대학교의 엠마 프레이징거 교수는 이 연구가 전통적인 데이터 수집 방식의 실패 원인을 수학적으로 증명했다고 평가합니다. 단순히 3개 선택지 비교를 도입하는 것만으로도 모델의 최적화 능력을 크게 향상할 수 있다는 점이 실무적 가치를 지닙니다.
주장이번 연구 결과는 복잡한 인간의 의사결정 과정을 인공지능이 더 정교하게 이해하도록 돕습니다. 데이터의 구조적 개선을 통해 인공지능의 판단 능력을 한 단계 높일 것으로 기대합니다.
팩트연구진은 MIT 정보 및 의사결정 시스템 연구소(LIDS) 소속으로 인간의 행동 양식을 수학적으로 모델링하는 연구를 지속하고 있습니다. 이들은 이번 성과를 바탕으로 더 정밀한 선호도 예측 시스템을 구축할 계획입니다.
출처https://news.mit.edu/2026/when-predicting-preferences-it-pays-to-consider-power-of-three-0611 및 MIT 정보 및 의사결정 시스템 연구소 자료를 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

