거대언어모델의 필기체 문서 해독 성능 혁신
거대언어모델이 기존 필기체 인식 소프트웨어보다 뛰어난 정확도와 속도를 기록하며 기록 보관소의 디지털화 방식을 바꾸고 있습니다. 인공지능 기술 도입으로 과거 수십 년이 걸리던 역사적 문서 분석 작업이 획기적으로 단축되었습니다.
주장거대언어모델이 기존의 전문 필기체 인식 소프트웨어를 능가하는 성능을 보이며 기록 보관소의 디지털화 방식을 바꾸고 있습니다. 과거 전문가의 수작업이나 특수 소프트웨어에 의존하던 작업이 이제는 인공지능을 통해 몇 초 만에 가능해졌습니다.
팩트윌프리드 로리에 대학교의 마크 험프리스 교수팀은 2025년 5월 학술지 히스토리컬 메소드에 연구 결과를 발표했습니다. 연구진은 18~19세기 문서 50건을 대상으로 실험을 진행하여 거대언어모델이 기존 전문 소프트웨어인 트랜스크리버스보다 정확도와 속도, 비용 면에서 우월함을 확인했습니다.
팩트기존 전문 소프트웨어인 트랜스크리버스의 문자 오류율은 약 8퍼센트 수준이었습니다. 반면 거대언어모델을 활용한 방식은 오류율을 2퍼센트 미만으로 낮추었으며, 작업 속도는 50배 빠르고 비용은 50분의 1 수준으로 절감되었습니다.
교차검증트랜스크리버스 측은 이러한 기술 변화에 대응하고자 자사 플랫폼에 거대언어모델을 직접 통합하는 방안을 발표했습니다. 이는 범용 모델의 강력한 성능이 기존 전문 산업계의 기술 표준까지 변화시키고 있음을 보여줍니다.
주장방대한 데이터를 학습한 범용 모델이 특정 목적을 위해 설계된 전문 모델보다 더 나은 성능을 발휘하는 현상이 나타나고 있습니다. 모델들은 명시적인 학습 없이도 방대한 데이터 속에서 필기체와 텍스트 간의 관계를 스스로 습득했습니다.
팩트리앤 레디 교수는 이 기술을 활용해 북미 전역에 흩어진 원주민 여성들의 기록을 추적합니다. 과거에는 수십 년이 걸릴 작업이었으나, 이제는 인공지능을 통해 수천 건의 문서를 빠르게 분석하여 파편화된 역사적 사실을 연결합니다.
팩트노스캐롤라이나 대학교 채플힐 캠퍼스의 사서들은 인공지능을 활용해 노예 조상을 추적하는 연구자들을 위한 특별 컬렉션을 디지털화합니다. 특히 제미나이 모델은 복잡한 표 구조를 가진 장부 문서를 처리하는 데 탁월한 성능을 보입니다.
팩트필라델피아 연방준비은행 또한 인공지능을 도입하여 과거의 차량 등록부와 부동산 증서 데이터를 추출합니다. 이는 기존에 비용 문제로 처리하지 못했던 방대한 경제 데이터를 분석하여 새로운 연구 질문을 도출하는 데 기여합니다.
교차검증인공지능 모델이 필기체 해독에 혁신을 가져왔으나, 여전히 모든 필기체를 완벽하게 읽어내는 것은 아닙니다. 그럼에도 과거에는 사실상 접근이 불가능했던 방대한 기록물들이 이제는 검색 가능한 데이터로 변환되고 있다는 점이 핵심적인 변화입니다.
출처IEEE Spectrum 및 2025년 5월 학술지 히스토리컬 메소드에 게재된 마크 험프리스 교수팀의 연구 결과를 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.