MARKETS
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
KOSPI
KOSDAQ
S&P 500
NASDAQ
USD/KRW
BTC
NIKKEI
WTI
Wittgenhaus

2026년 6월 5일 금요일

AI 시대, 당신을 더욱 스마트하게

AI검증

데이터브릭스, 검색 속도 3배 개선한 모델 발표

데이터브릭스가 병렬 처리 기술을 도입해 지식 어시스턴트의 검색 속도를 기존 대비 3배 이상 단축했습니다. 새로운 모델인 인스트럭티드 리트리버-1을 통해 기업용 데이터 검색 효율을 극대화했습니다.

2026년 6월 4일

주장데이터브릭스는 병렬 테스트 타임 스케일링 기술을 적용해 검색 성능과 속도를 동시에 개선했습니다. 기존의 순차적 에이전트 방식에서 벗어나 병렬 처리 방식을 도입함으로써 응답 품질을 유지하면서 효율성을 높였습니다.

팩트데이터브릭스의 지식 어시스턴트 업데이트로 답변 생성 시간은 2배, 검색 시간은 3배 이상 줄었습니다. 첫 토큰 생성 시간은 약 2초 수준으로 개선되었습니다.

팩트이번 성능 향상의 핵심은 인스트럭티드 리트리버-1 모델입니다. 이 모델은 쿼리 생성과 재순위화 단계를 병렬로 수행해 지연 시간을 최소화합니다.

교차검증기존 에이전트 검색 시스템은 도구 호출과 사고 과정을 순차적으로 처리해 품질은 높지만 지연 시간과 비용이 증가하는 한계가 있었습니다. 데이터브릭스는 이러한 순차적 연산의 단점을 병렬화로 극복했습니다.

팩트인스트럭티드 리트리버-1 모델은 칼벤치 평가에서 클로드 소넷 4.5와 대등한 검색 품질을 보였습니다. 특히 다중 피벗 그룹화 재순위화 방식을 통해 검색 정밀도를 높였습니다.

주장기업 환경에서는 도메인별 제약 조건이 중요하므로 검색 모델의 훈련 방식이 핵심입니다. 데이터브릭스는 사용자 지침과 인덱스 스키마를 모든 검색 단계에 전파해 기업용 데이터에 최적화된 검색을 구현했습니다.

팩트모델 훈련을 위해 데이터브릭스는 합성 기업형 검색 환경을 구축했습니다. 이 환경은 사실 확인, 요약, 추천, 문제 해결 등 지식 어시스턴트가 실제 업무에서 처리하는 다양한 작업을 포함합니다.

교차검증검색 품질 향상은 실제 워크로드에서 검증되어야 의미가 있습니다. 데이터브릭스는 내부 대규모 데이터셋을 활용해 쿼리 생성의 구체성, 폭, 관련성을 평가하고 재순위화 성능을 측정했습니다.

팩트재순위화 성능 평가에서 인스트럭티드 리트리버-1은 엔디시지@10 지표 기준 81.0점을 기록했습니다. 이는 재순위화가 없는 환경 대비 14.1% 향상된 수치이며 클로드 소넷 4.5의 80.1점보다 높은 결과입니다.

팩트모델의 효율적인 운영을 위해 혼합 전문가 아키텍처와 FP8 양자화 기술을 적용했습니다. 이를 통해 품질 저하 없이 추론 속도와 처리량을 개선해 실무 환경에 적합한 성능을 확보했습니다.

주장데이터브릭스는 이번 기술 도입을 통해 기업용 인공지능 서비스의 실질적인 운영 효율을 한 단계 끌어올렸습니다. 앞으로도 복잡한 기업 데이터를 정교하게 처리하는 모델 고도화에 집중할 예정입니다.

출처데이터브릭스 공식 블로그를 통해 해당 기술의 성능 지표와 모델 구조를 교차 검증했습니다. (https://www.databricks.com/blog/3x-faster-search-parallel-test-time-scaling-instructed-retriever-1)

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

버블 지표

상세보기 →

릴리즈 & 논문

전체보기 →

RELEASES

Transformersv5.10.2

패치 릴리즈 v5.10.2

Clip 관련 모델 변환 시 발생했던 심각한 버그가 수정되었습니다. 이 버그는 sam3 등 여러 모델에 영향을 미쳤습니다. 해당 수정 사항은 @zucchini-nlp의 작업(#46406)을 통해 이루어졌습니다.

5시간 전

mistralai/mistral-commonv1.11.3

v1.11.3: continue_final_message 수정, to_openai에 reasoning 형식 추가

이번 릴리즈에서는 `continue_final_message`를 수정하고, `to_openai`에 AssistantMessage에 대한 reasoning 형식을 추가했습니다. 또한, OpenAI 시드 보존 및 알 수 없는 모델에 대한 `from_hf_hub` 안내 등 여러 개선 사항이 포함되었습니다.

15시간 전

microsoft/semantic-kernelpython-1.43.0

Python 1.43.0

이번 릴리즈에서는 Python 함수 호출 시 매개변수 일관성이 개선되었습니다. 또한, OpenAPI 문서 파싱 옵션이 변경되어 이전 버전과 호환되지 않을 수 있습니다. CI 파이프라인의 Python 테스트 커버리지 워크플로우도 강화되었습니다.

1일 전

OpenAIv2.41.0

v2.41.0

이번 릴리즈에서는 API에 responses.moderation 및 chat_completions.moderation 기능이 추가되었습니다. 자세한 변경 사항은 전체 변경 로그를 참고하시기 바랍니다.

1일 전

LangChainlangchain-deepseek==1.1.0

langchain-deepseek v1.1.0

이번 릴리즈에서는 Deepseek 파트너 라이브러리의 여러 종속성 업데이트와 함께 모델 프로필 데이터가 갱신되었습니다. 또한, Azure 엔드포인트 탐지를 위한 URL 파싱 방식이 개선되었으며, 특정 함수 딕션이 주어졌을 때 Azure 배포의 Tool Choice가 'required'로 설정되도록 수정되었습니다.

1일 전

PAPERS