오픈에이아이의 에르되시 문제 해결과 범용 인공지능의 추론 능력 고도화
오픈에이아이가 80년간 미해결 과제였던 에르되시 평면 단위 거리 문제를 인공지능으로 반증하는 성과를 거두었습니다. 이번 연구는 범용 모델이 복잡한 과학적 추론을 수행할 수 있음을 입증하며 인공지능 기술의 새로운 이정표를 제시합니다.
주장오픈에이아이(OpenAI)가 80년 동안 풀리지 않았던 에르되시 평면 단위 거리 문제를 반증하는 성과를 거두었습니다. 이번 결과는 인공지능이 단순한 연산 도구를 넘어 복잡한 과학적 추론을 수행하는 단계에 진입했음을 의미합니다.
팩트연구진은 32시간 미만의 실행 시간과 1,000달러 미만의 비용으로 해당 결과를 도출했습니다. 모델이 생성한 추론 과정은 125페이지에 달하며 기존 사각형 격자 방식보다 개선된 새로운 구성 방식을 포함합니다.
교차검증수학계 일각에서는 이번 성과가 문제의 완전한 증명이 아닌 반증이라는 점을 지적합니다. 하지만 티모시 가워스 등 저명한 수학자들은 인공지능이 유명한 미해결 수학 문제를 해결한 최초의 명확한 사례로 평가합니다.
팩트이번 연구에 사용된 모델은 수학 전용 모델이 아닌 범용 거대언어모델(LLM)입니다. 오픈에이아이는 이번 결과가 과학 전반에 걸친 장기적 추론 능력 향상을 보여주는 중요한 이정표라고 강조합니다.
팩트코히어(Cohere)는 아파치 2.0 라이선스를 적용한 커맨드 에이 플러스(Command A+) 모델을 공개했습니다. 해당 모델은 218B 파라미터의 전문가 혼합(MoE) 구조를 갖추었으며 2개의 에이치100(H100) 그래픽처리장치만으로 구동 가능합니다.
교차검증인공지능 분석 기관의 벤치마크 결과, 커맨드 에이 플러스는 클로드 4.5 하이쿠와 유사한 성능을 보입니다. 환각 현상은 적지만 과학적 추론과 코딩 능력은 최상위 모델보다 부족하다는 평가를 받습니다.
팩트인퍼런스벤치(InferenceBench) 평가에 따르면 현재 최첨단 에이전트들은 시스템 수준의 엔지니어링과 의존성 관리에서 어려움을 겪습니다. 단순한 하이퍼파라미터 튜닝을 거친 모델이 더 나은 성능을 보이는 역전 현상도 관찰됩니다.
팩트민트이벌(MintEval) 평가 결과, 138.8k 토큰 이상의 긴 문맥을 처리하는 7개 메모리 시스템의 평균 정확도는 27.9%에 그쳤습니다. 이는 메모리 기능이 단순한 검색 증강 생성(RAG) 방식을 넘어 학습된 별도의 하위 시스템으로 발전해야 함을 시사합니다.
팩트구글은 제미나이 3.5 플래시를 공개하며 기존 모델 대비 4배 빠른 속도와 절반 이하의 비용을 강조했습니다. 또한 제미나이 옴니를 통해 영상 편집 등 복합적인 입력을 처리하는 멀티모달 기능을 강화했습니다.
출처해당 내용은 레이턴트 스페이스(Latent Space)의 기술 분석 보고서를 통해 교차 검증했습니다.
본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.
