MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 5월 14일 목요일

전문가의 AI 하이브리드 리서치 랩

AI검증

캠벨 브라운의 포럼 AI, 인공지능 정보 정확성 검증 체계 구축

메타 뉴스 책임자 출신 캠벨 브라운이 설립한 포럼 AI가 인공지능 정보의 정확성을 평가하는 벤치마크를 개발합니다. 각 분야 전문가를 영입해 인공지능 답변의 신뢰도를 인간 전문가 수준으로 높이는 것이 목표입니다.

2026년 5월 14일

주장캠벨 브라운 포럼 AI 설립자는 인공지능이 정보 유통의 핵심 경로로 자리 잡을 것으로 전망합니다. 그는 현재 인공지능 모델이 제공하는 정보의 정확성이 부족하며, 기술이 진실하고 정직한 정보를 전달하도록 최적화해야 한다고 강조합니다.

팩트캠벨 브라운은 메타의 첫 뉴스 책임자를 역임했으며, 17개월 전 뉴욕에서 포럼 AI를 설립했습니다. 해당 기업은 지난해 가을 레러 히포가 주도한 투자 라운드에서 300만 달러를 조달했습니다.

팩트포럼 AI는 지정학, 정신 건강, 금융, 채용 등 정답이 명확하지 않은 고위험 분야를 집중적으로 평가합니다. 나일 퍼거슨, 파리드 자카리아, 토니 블링컨 등 각 분야 전문가를 영입해 인공지능 모델의 정확성을 측정하는 벤치마크를 설계했습니다.

팩트포럼 AI는 인공지능 심사위원이 인간 전문가와 약 90%의 일치율을 보이도록 만드는 것을 목표로 합니다. 브라운은 현재 포럼 AI가 해당 목표치에 도달할 수 있는 기술적 수준을 확보했다고 밝혔습니다.

교차검증현재 인공지능 기업은 코딩과 수학적 성능 향상에 집중하며 정보의 정확성은 상대적으로 후순위로 둡니다. 브라운은 이러한 접근 방식이 모델의 편향성과 맥락 부족 문제를 야기한다고 지적합니다.

팩트브라운은 구글 제미나이가 중국 공산당 웹사이트 정보를 부적절하게 인용하거나, 대다수 모델에서 정치적 편향성이 나타나는 사례를 언급했습니다. 또한 모델이 맥락을 놓치거나 허수아비 공격의 오류를 범하는 등 미묘한 실패가 빈번하게 발생합니다.

주장브라운은 기업용 인공지능 시장이 정보 정확성을 개선하는 동맹이 될 것으로 기대합니다. 신용 결정, 대출, 보험, 채용 등 법적 책임이 중요한 분야에서 기업이 인공지능의 높은 정확성을 요구하기 때문입니다.

교차검증현행 인공지능 규제 환경은 형식적인 감사와 표준화된 벤치마크에 그쳐 실효성이 낮다는 비판이 존재합니다. 브라운은 뉴욕시 채용 편향성 법안 사례를 들며, 감사를 통과한 기업에서도 실제 위반 사항이 발견된다고 설명합니다.

주장실질적인 인공지능 평가를 위해서는 일반 지식만 가진 인력이 아닌 특정 도메인에 대한 깊은 전문 지식이 필수적입니다. 브라운은 인공지능 업계가 주장하는 혁신과 일반 사용자가 체감하는 저품질 답변 사이에는 큰 괴리가 존재한다고 강조합니다.

팩트인공지능에 대한 대중의 신뢰도는 낮은 수준이며, 브라운은 이러한 회의론이 정당하다고 평가합니다. 실리콘밸리 내부의 낙관적 담론과 소비자가 겪는 인공지능의 오류 사이에는 간극이 존재합니다.

출처테크크런치의 보도 내용을 통해 포럼 AI의 설립 배경과 인공지능 평가 모델의 방향성을 교차 검증했습니다.

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

microsoft/semantic-kernelpython-1.42.0

python-1.42.0

이번 릴리즈에서는 Python 패키지 버전이 1.42.0으로 업데이트되었습니다. 또한, Microsoft Agent Framework 후속 호출에 대한 문서가 추가되었으며, 여러 종속성 패키지들이 업데이트되었습니다. Azure AI Search 커넥터의 비공개 속성 접근이 중단되었고, OpenAPI 경로 매개변수 퍼센트 인코딩 및 HttpPlugin 요청 유효성 검사가 개선되었습니다.

10시간 전

meta-llama/llama-stackv1.0.2

v1.0.2

UI 잠금 파일에서 ogx-client가 ^1.0.1로 업데이트되었습니다. 또한, 임시 이벤트 루프 초기화 후 SQL 엔진이 재설정되는 수정 사항이 포함되었습니다.

13시간 전

Anthropicv0.102.0

v0.102.0

이번 릴리즈에서는 BetaManagedAgentsSearchResultBlock 타입과 캐시 진단 베타 지원이 추가되었습니다. 또한 Pydantic 이터레이터의 조기 검증을 지원하며, API 사양 업데이트가 포함되었습니다.

18시간 전

meta-llama/llama-stackv1.0.1

v1.0.1

이번 릴리즈에서는 UI 잠금 파일의 ogx-client 업데이트, 라우터의 헬스 및 벡터 스토어 팬아웃 병렬화, SQLStore 및 MongoDB 만료 강제 적용을 위한 asyncio.Lock 추가 등의 변경 사항이 포함되었습니다. 또한 비밀 처리 강화, 라우터 및 Redis KV 읽기에서의 비동기 안전성 개선, 다양한 프로바이더의 비동기 안전성 수정, Milvus에서 누락된 컬렉션 처리 기능이 추가되었습니다.

18시간 전

google-deepmind/gemmav4.0.0

v4.0.0

Gemma 4가 추가되었습니다.

22시간 전

PAPERS