데이터 저널리스트 에이전트: 데이터 기반의 검증 가능한 멀티모달 뉴스 자동화
케빈 칭홍 린 등 연구진은 원시 데이터를 신뢰할 수 있는 멀티모달 스토리로 변환하는 멀티 에이전트 프레임워크 'Data2Story'를 개발했습니다. 이 시스템은 데이터 분석부터 시각화까지 전 과정을 자동화하며, 모든 기사 내용에 대한 근거를 추적하여 투명성을 확보합니다.
주장데이터는 사회를 형성하는 강력한 도구이지만, 이를 일반인이 이해하기 쉬운 이야기로 바꾸는 작업에는 많은 시간과 전문 인력이 필요합니다. 연구진은 이러한 뉴스룸의 복잡한 과정을 자동화하기 위해 'Data2Story'라는 멀티 에이전트 시스템(MAS, 여러 인공지능 에이전트가 협력하여 복잡한 과업을 수행하는 체계)을 제안합니다.
팩트이번 연구에는 케빈 칭홍 린, 바투 엘, 유홍 시, 판 루, 필립 토르, 제임스 조 등 다국적 연구진이 참여했습니다. 연구진 소속 정보는 arxiv 등록 기준입니다.
팩트Data2Story는 크게 두 가지 핵심 혁신을 제시합니다. 첫째, 모든 기사 내 수치와 주장에는 데이터, 코드, 외부 참조를 연결하는 '인스펙터(Inspector)'가 작동하여 근거를 확보합니다. 둘째, 텍스트와 정적 차트에 머물지 않고 지도나 오디오 등 독자에게 최적화된 멀티모달(Multimodal, 텍스트·이미지·음성 등 다양한 형태의 정보를 동시에 처리하는 방식) 도구를 활용합니다.
주장기존의 인공지능 에이전트들은 데이터 분석이나 디자인 등 개별적인 업무 수행에는 능숙하지만, 전체 뉴스 제작 과정을 통합적으로 관리하는 데 한계가 있었습니다. Data2Story는 가상의 뉴스룸을 구축하여 기획부터 최종 발행까지 전 과정을 조율합니다.
팩트연구진은 18개의 실제 뉴스 기사를 대상으로 Data2Story의 성능을 평가했습니다. 평가 지표는 인간의 기사 작성 방식과의 비교, 53명의 참가자를 대상으로 한 5개 차원의 평가, 컴퓨터 사용 에이전트를 활용한 독자 경험 대리 평가, 그리고 코드 검증기를 통한 데이터 일치성 확인 등 총 4가지 축으로 구성했습니다.
교차검증본 연구는 arxiv에 공개된 선공개 논문으로, 아직 학계의 정식 동료 평가(Peer Review)를 거치지 않았습니다. 따라서 제시된 성능 지표가 실제 뉴스룸 환경에서 동일하게 구현될지는 추가적인 검증이 필요합니다.
팩트평가 결과, Data2Story는 증거 추적이 가능한 수준 높은 멀티미디어 기사를 생성하는 데 성공했습니다. 특히 투명성과 감사 가능성 측면에서 우수한 성능을 보였습니다.
교차검증다만, 이번 연구는 일반화 가능성(Generalizability) 측면에서 한계를 가집니다. 인간 기자가 가진 고유의 편집적 시각, 창의적인 디자인, 독창적인 스토리텔링 능력은 여전히 인공지능이 완전히 대체하기 어려운 영역으로 확인되었습니다.
주장연구진은 Data2Story가 기자를 대체하는 것이 아니라, 기자의 업무를 돕는 협력자로서의 역할을 수행해야 한다고 강조합니다. 데이터 기반의 투명하고 검증 가능한 보도를 지원하는 것이 이 기술의 궁극적인 목표입니다.
팩트Data2Story는 잠재 공간(Latent Space, 인공지능이 데이터를 추상화하여 학습한 다차원적인 수치 공간) 내에서 독자가 무엇을 보고 싶어 하는지를 추론하여 시각화 도구를 선택합니다. 이는 기존의 단순한 정보 전달 방식보다 정보 전달 효율을 크게 높입니다.
주장앞으로 인공지능이 뉴스룸에 도입되면 데이터 저널리즘의 진입 장벽이 낮아질 전망입니다. 복잡한 데이터를 다루는 기술적 부담을 덜어내고, 기자는 더욱 본질적인 취재와 기획에 집중할 수 있는 환경이 조성됩니다.
출처arxiv의 선공개 논문(https://arxiv.org/abs/2606.11176)을 참고했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

