MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 5월 3일 일요일

전문가의 AI 하이브리드 리서치 랩

인사이트

말은 잘하는데 일은 아직: AI 노동 자동화 실험 결과

미검

Center for AI Safety와 Scale AI 연구진이 실제 프리랜서 프로젝트를 기반으로 AI 자동화율을 측정했다. 최고 성능 AI의 자동화율은 2.5%에 그쳤다. AI는 문제를 푸는 능력은 빠르게 발전했으나 돈을 받고 끝까지 책임지는 능력은 아직 인간의 영역이었다.

AI·110일 전

대화형 AI를 속이는 가장 쉬운 방법: 시(詩) 형식 탈옥

미검

위험한 요청을 시 형식으로 바꾸면 대부분의 대화형 AI가 안전 규칙을 지키지 못한다는 연구 결과가 나왔다. 최신 LLM 25개를 대상으로 실험한 결과 전체 평균 탈옥 성공률이 62%에 달했다. 일부 모델은 90~100%에 도달했다.

AI·110일 전

AI 코딩의 미래: Sonar CEO가 말하는 코드 품질과 책임

검증

전세계 700만 명이 사용하는 AI 코딩 플랫폼 Sonar의 CEO 타리크 샤우캇이 맥킨지와 AI 코딩의 미래를 논의했다. AI가 작성한 코드의 리뷰와 유지보수가 더 어려워지고 있으며, 독립적 검증과 아키텍처 설계 능력이 핵심 역량으로 부상한다.

AI·114일 전

"지어내지 마"라고 하면 AI가 더 틀리는 이유

미검

"지어내지 마"라고 요구할수록 AI의 답변이 더 부정확해질 수 있다는 연구 결과가 나왔다. 정답이 문서 안에 있어도 AI가 확신하지 못하면 답변을 포기했다. 연구진은 이를 안전해지기 위해 정확성을 희생하는 Safety Tax라고 설명한다.

AI·116일 전

WIRE

WIRE

글로벌 인텔리전스

전체보기 →

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

LangChainlangchain-openrouter==0.2.3

langchain-openrouter==0.2.3

langchain-openrouter 0.2.3 버전이 출시되었습니다. 스트리밍 시 분할된 `reasoning_details`를 병합하는 버그가 수정되었습니다.

1일 전

LangChainlangchain-mistralai==1.1.3

langchain-mistralai==1.1.3

이번 릴리즈에서는 MistralAI 통합에 대한 기능 개선 및 버그 수정이 포함되었습니다. 주요 변경 사항으로는 휴먼 메시지에 대한 이미지 입력 지원 추가, 모델 프로필 데이터 업데이트, 그리고 `langchain-core`의 최소 버전이 `1.2.21`로 상향 조정되었습니다. 또한, 여러 의존성 패키지가 최신 버전으로 업데이트되었습니다.

1일 전

meta-llama/llama-stackv0.8.0

v0.8.0

이번 릴리즈에서는 Anthropic Messages API를 네이티브로 지원하며, 대화 압축 기능이 추가되었습니다. 또한, 기존 Eval API 및 관련 API가 제거되었고, 문서 전반에 걸쳐 UX 개선 및 최적화가 이루어졌습니다. 보안 취약점 수정 및 CI/CD 파이프라인 개선 작업도 포함되었습니다.

1일 전

LangChainlangchain==1.3.0a1

langchain v1.3.0a1

이번 릴리즈에서는 `create_agent`에 `stream_events` 기능이 추가되었으며, HITL 미들웨어에 `respond` 결정 기능이 포함되었습니다. 또한, 에이전트 상태를 도구 디스패치에 인라인하는 것을 중단하여 성능을 개선했습니다.

1일 전

LangChainlangchain-openrouter==0.2.2

langchain-openrouter==0.2.2

OpenRouter 통합에 `session_id` 및 `trace` 필드가 추가되었습니다. 또한, 코어 라이브러리에 콘텐츠 블록 중심 스트리밍(v2) 기능이 추가되었으며, 여러 의존성 및 모델 프로필 데이터가 업데이트되었습니다.

1일 전

PAPERS