인사이트
거대언어모델 중재 능력 평가 프레임워크 'SoCRATES' 공개
미검국내 연구진이 거대언어모델(LLM)의 갈등 중재 능력을 정밀하게 평가하는 새로운 벤치마크 'SoCRATES'를 개발했습니다. 실제 갈등 상황을 반영한 8개 도메인에서 모델의 사회적 적응력을 측정하며 기존 평가 방식의 한계를 극복했습니다.
거대언어모델의 임베딩 성능 개선하는 '임베드필터' 기술 공개
미검송하오 우 등 연구진은 거대언어모델의 임베딩 성능을 저해하는 고빈도 토큰 문제를 해결하는 '임베드필터'를 발표했습니다. 이 기술은 언어모델 내부의 언임베딩 행렬을 활용해 의미론적 표현력을 높이고 데이터 저장 효율을 개선합니다.
암 유전체 미생물 탐지 도구 PRISM 개발
검증암 유전체 데이터에서 미생물을 정확히 식별하는 새로운 계산 파이프라인 PRISM이 개발되었습니다. 이 도구는 오염 물질을 효율적으로 제거하여 암 진단과 치료 전략 수립의 정확도를 높입니다. 관련 연구 결과는 네이처 리뷰 캔서에 발표되었습니다.
할리우드 영화 산업과 인공지능의 공존 전략
검증인공지능 기술의 급격한 발전 속에서도 할리우드 영화 산업은 인간의 창의성을 중심으로 재편되고 있습니다. 영화 전문가들은 기술과 예술의 교차점에서 영화가 지닌 고유한 가치를 보존해야 한다고 강조합니다.
테렌스 타오의 수학 연구 인공지능 전환과 대규모 협업
검증수학자 테렌스 타오는 미래 수학 연구가 인공지능을 활용한 대규모 집단 협업 방식으로 변화할 것이라고 전망합니다. 그는 인공지능이 증명 과정의 오류를 검증하는 진실 기계 역할을 수행하며 연구 효율성을 극대화할 것으로 내다봅니다.
메타 인스타그램 AI 챗봇 결함으로 인한 2만여 계정 유출
검증메타가 운영하는 인스타그램의 AI 계정 복구 챗봇에서 보안 결함이 발생해 2만여 개의 계정이 유출되었습니다. 메타는 해당 기능을 즉시 비활성화하고 피해 계정의 비밀번호 재설정을 조치했습니다.
에이전트 AI 시대의 토큰 경제 전환과 비즈니스 지표화
미검에이전트 AI의 확산으로 기존 정액제 기반의 AI 서비스 모델이 토큰 단위의 종량제 체제로 전환하고 있습니다. 기업은 단순 토큰 소비량을 넘어 업무 효율과 성과를 반영한 새로운 비용 평가 체계를 구축하고 있습니다.
오픈소스 에이전트 학습을 위한 OpenEnv 표준화 추진
검증오픈소스 커뮤니티가 에이전트 강화학습 환경을 통합하는 OpenEnv 표준화를 시작합니다. 주요 AI 기업과 연구소들이 참여하여 파편화된 학습 환경을 개선하고 범용 인터페이스를 구축합니다.
에이전트 경제 모델의 시장 통제와 창발성 확보 전략
검증에이전트 기반 경제 모델에서 시장의 창발적 행동은 외부 충격으로 통제하기 어렵다는 사실이 실험을 통해 확인되었습니다. 연구진은 시장의 자율성을 보장하면서도 목표 수익을 달성하기 위해 결제 시점에서의 직접적인 가격 조정 방식을 제안합니다.
크로매틱스: GPU 가속 기반 파동 광학 시뮬레이션 라이브러리
검증크로매틱스는 잭스(JAX)를 기반으로 구축된 미분 가능한 파동 광학 시뮬레이션 오픈소스 라이브러리입니다. GPU 가속을 통해 기존 방식보다 최대 22배 빠른 연산 속도를 제공하며 계산 광학 연구의 효율성을 높입니다.
스팟
WIRE- TG러시아, 우크라이나 전쟁서 138만 명의 군인 손실12시간 전
- TG이스라엘 레바논에 새 공습 가해1일 전
- TG미국 이란 협상 비공개 약속 존재1일 전
- TG네덜란드, 성적 지향 전환 치료 금지 법안 통과2일 전
- TG우크라이나, 국경 700km 러시아 유정 공격4일 전
- TG러시아, 타타르스탄과 모스크바, 상트페테르부르크에서 가솔린 판매 제한 시작5일 전
- TG영국 프로팔레스타인 활동가 4명 이스라엘 방위 산업 공장 습격 구속5일 전
- TG우크라이나군, 러시아 공급 다리 공격 드론 폭격7일 전
- TGEU, 21번째 러시아 제재 패키지 공개 및 러시아 군인 입국 금지 제안9일 전
- TG캐나다, 스크류웜 확산 방지 위해 텍사스 주 가축 수입 일시 금지11일 전
글로벌 인텔리전스
전체보기 →본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.
버블 지표
상세보기 →많이 본 콘텐츠
뇌-컴퓨터 인터페이스(BCI) 임상 시험의 급격한 증가와 기술적 도약
아우라, 전자잉크 적용 디지털 액자 잉크 출시
구글, 생성형 AI 스팸 탐지 기술 S-CTS 도입
릴라이언스 인더스트리, 인도 AI 시장 주도권 확보 전략
인공지능 모델의 인물 인식 수준 확인 도구 '인 더 웨이츠'
릴리즈 & 논문
전체보기 →RELEASES
langchain==1.3.10
langchain 1.3.10 릴리즈에서는 cryptography, aiohttp, pyjwt 라이브러리 버전이 업데이트되었습니다. 또한, 요약 형식 변경 및 특정 스냅샷에 대한 프로바이더 전략 감지 기능이 수정되었습니다. README 설치 및 리소스 문서도 갱신되었습니다.
1일 전
langchain-core==1.4.8
이번 릴리즈에서는 Python 3.10 미만 버전에 대한 코드가 제거되었으며, `BaseTool.tool_call_schema` 및 `model_json_schema`에 대한 성능 개선이 이루어졌습니다. 또한, v3 스트리밍 이벤트에서 사용 토큰 세부 정보가 보존되고, 명시적 역직렬화 허용 목록에 대한 테스트가 업데이트되었습니다.
1일 전
v0.111.0
이번 릴리즈에서는 refusal-fallback 미들웨어 요청에 fallback-refusal-middleware 태그를 추가하는 기능이 포함되었습니다. 자세한 변경 사항은 전체 변경 로그를 참조하시기 바랍니다.
1일 전
v0.110.0
이번 릴리즈에서는 새로운 code_execution_20260120 도구에 대한 지원이 추가되었습니다. 또한, 헤더 병합 시 x-stainless-helper가 덮어쓰이는 대신 추가되도록 수정되었으며, 스트림 이벤트 유형이 보존되도록 개선되었습니다.
1일 전
v2.43.0
OpenAI Python 라이브러리가 v2.43.0 버전으로 업데이트되었습니다. 이번 릴리즈에서는 API 관련 변경 사항으로 OpenAPI 사양 또는 Stainless 설정을 업데이트했습니다.
2일 전
PAPERS
전염 네트워크: 다중 에이전트 LLM 시스템에서의 평가자 편향 전파
2일 전
DiffusionGemma는 얼마나 투명한가?
2일 전
지시문은 음성을 어떻게 형성하는가? 스타일 캡션 기반 텍스트 음성 변환을 위한 교차 주의 기여도 분석
2일 전
AI 에이전트를 위한 효율적이고 건전한 확률적 검증
2일 전
안전 정렬된 LLM은 혼합된 준수 시연으로부터 무엇을 배우는가?
2일 전
FreeStyle: 커뮤니티 LoRA 마이닝을 통한 스타일-콘텐츠 이중 참조 생성의 자유로운 제어
2일 전
다중 에이전트 및 일반 다체 시스템의 최적 순서
2일 전
UltraQuant: 컨텍스트가 많은 에이전트를 위한 4비트 KV 캐싱
2일 전
에이전트 AI 시스템에 대한 모델 유도 자동 공격에 대응하는 방어적 오도 분석
2일 전
LLM 기반 악성코드 분류를 위한 다중 뷰 디컴파일
2일 전