AI검증

오픈에이아이의 에르되시 문제 해결과 범용 인공지능의 추론 능력 고도화

오픈에이아이가 80년간 미해결 과제였던 에르되시 평면 단위 거리 문제를 인공지능으로 반증하는 성과를 거두었습니다. 이번 연구는 범용 모델이 복잡한 과학적 추론을 수행할 수 있음을 입증하며 인공지능 기술의 새로운 이정표를 제시합니다.

2026년 5월 21일

주장오픈에이아이(OpenAI)가 80년 동안 풀리지 않았던 에르되시 평면 단위 거리 문제를 반증하는 성과를 거두었습니다. 이번 결과는 인공지능이 단순한 연산 도구를 넘어 복잡한 과학적 추론을 수행하는 단계에 진입했음을 의미합니다.

팩트연구진은 32시간 미만의 실행 시간과 1,000달러 미만의 비용으로 해당 결과를 도출했습니다. 모델이 생성한 추론 과정은 125페이지에 달하며 기존 사각형 격자 방식보다 개선된 새로운 구성 방식을 포함합니다.

교차검증수학계 일각에서는 이번 성과가 문제의 완전한 증명이 아닌 반증이라는 점을 지적합니다. 하지만 티모시 가워스 등 저명한 수학자들은 인공지능이 유명한 미해결 수학 문제를 해결한 최초의 명확한 사례로 평가합니다.

팩트이번 연구에 사용된 모델은 수학 전용 모델이 아닌 범용 거대언어모델(LLM)입니다. 오픈에이아이는 이번 결과가 과학 전반에 걸친 장기적 추론 능력 향상을 보여주는 중요한 이정표라고 강조합니다.

팩트코히어(Cohere)는 아파치 2.0 라이선스를 적용한 커맨드 에이 플러스(Command A+) 모델을 공개했습니다. 해당 모델은 218B 파라미터의 전문가 혼합(MoE) 구조를 갖추었으며 2개의 에이치100(H100) 그래픽처리장치만으로 구동 가능합니다.

교차검증인공지능 분석 기관의 벤치마크 결과, 커맨드 에이 플러스는 클로드 4.5 하이쿠와 유사한 성능을 보입니다. 환각 현상은 적지만 과학적 추론과 코딩 능력은 최상위 모델보다 부족하다는 평가를 받습니다.

팩트인퍼런스벤치(InferenceBench) 평가에 따르면 현재 최첨단 에이전트들은 시스템 수준의 엔지니어링과 의존성 관리에서 어려움을 겪습니다. 단순한 하이퍼파라미터 튜닝을 거친 모델이 더 나은 성능을 보이는 역전 현상도 관찰됩니다.

팩트민트이벌(MintEval) 평가 결과, 138.8k 토큰 이상의 긴 문맥을 처리하는 7개 메모리 시스템의 평균 정확도는 27.9%에 그쳤습니다. 이는 메모리 기능이 단순한 검색 증강 생성(RAG) 방식을 넘어 학습된 별도의 하위 시스템으로 발전해야 함을 시사합니다.

팩트구글은 제미나이 3.5 플래시를 공개하며 기존 모델 대비 4배 빠른 속도와 절반 이하의 비용을 강조했습니다. 또한 제미나이 옴니를 통해 영상 편집 등 복합적인 입력을 처리하는 멀티모달 기능을 강화했습니다.

출처해당 내용은 레이턴트 스페이스(Latent Space)의 기술 분석 보고서를 통해 교차 검증했습니다.

주제

OpenAI

관련 콘텐츠

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

SCMP

UK PM Burnham to welcome Ukraine’s Zelensky in first foreign leader visit — Britain’s Prime Minister Andy Burnham will on Monday host Ukrainian President Volodymyr Zelensky as his first foreign leader since taking office a week ago, to underline London’s “unwavering support” for Kyiv. The pair are set to visit a British naval base and hear from both countries’ armed forces

3시간 전

SCMP

Nobel laureate Simon Johnson on the AI race and China’s ‘over-automation’ problem — Simon Johnson is a professor of entrepreneurship at the Massachusetts Institute of Technology (MIT). A former chief economist of the International Monetary Fund (IMF), he won a joint Nobel Prize for economics in 2024 for his research into how institutions shape national prosperity. On June 8, the Br

3시간 전

SCMP

US border tsar says vetting of ICE officer is under internal review after Maine shooting — US President Donald Trump’s border tsar said on Sunday that the vetting of an immigration officer involved in the deadly shooting of a Colombian native in Maine is under internal review after relatives revealed to Associated Press that he had a history of serious mental health struggles and violent

3시간 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

루마니아의 러시아 드론 격추 및 외교적 항의

국제6시간 전

먼데이닷컴 등 기술 기업의 인공지능 전환에 따른 대규모 인력 감축

경제22시간 전

오픈에이아이의 허깅페이스 시스템 침해와 투명성 요구

AI6시간 전

앤스로픽 클로드 오퍼스 5의 ARC-AGI-3 벤치마크 신기록 달성

AI12시간 전

오픈에이아이 지피티-5 모델의 생화학 무기 정보 제공 논란

AI12시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.26.0

v0.26.0 릴리즈

이번 릴리즈에서는 Inkling 모델 제품군 지원, DeepSeek-V4 성능 향상, fp32 `lm_head` 지원 추가, 유연한 어텐션 백엔드, KV 오프로딩 및 계층형 보조 스토리지 기능 강화 등 다양한 업데이트가 포함되었습니다. 또한 Rust 프론트엔드 기능 확장 및 Transformers 5.13.0 지원이 추가되었습니다.

1일 전

LangChainlangchain-anthropic==1.5.2

langchain-anthropic==1.5.2

Claude Opus 5 모델 지원이 추가되었습니다. 이번 릴리즈는 이전 버전인 langchain-anthropic==1.5.1 이후의 변경 사항을 포함합니다.

2일 전

Anthropicv0.120.0

v0.120.0

이번 릴리즈에서는 claude-opus-5 모델이 추가되었습니다. 또한, 도구 추가/제거 블록 및 tool_change 이벤트가 지원되며, 클라이언트 측 대체 크레딧 토큰 유형이 확장되고 서버 측 대체 기본 옵션이 추가되었습니다.

2일 전

LangChainlangchain-openai==1.4.1

langchain-openai==1.4.1

이번 릴리즈에서는 LangSmith 게이트웨이를 환경 변수를 통해 지원하도록 기능이 추가되었습니다. 또한 `gpt-5.3-chat-latest` 프로필이 수정되었습니다.