AI검증

AI 성능을 결정하는 데이터 품질 확보 전략

고품질 인공지능 모델 구축을 위해 데이터 생성 단계부터 품질을 관리하는 체계가 필요합니다. 미국 엔와이유 랑곤 헬스는 원천 시스템 개선과 통합 플랫폼 도입으로 데이터 신뢰성을 확보했습니다.

2026년 5월 14일

주장인공지능 모델의 성능은 학습 데이터의 품질이 결정합니다. 고품질 데이터를 확보하기 위해서는 데이터가 생성되는 트랜잭션 시스템의 문제를 근본적으로 해결해야 합니다.

팩트엔와이유 랑곤 헬스(NYU Langone Health)는 기존 온프레미스 데이터 레이크를 폐기하고 엔터프라이즈 데이터 웨어하우스를 현대화했습니다. 이 기관은 임상의와 분석가, 과학자가 함께 사용하는 통합 데이터 및 인공지능 플랫폼을 운영합니다.

팩트나더 메라비 최고 디지털 정보 책임자는 2017년부터 데이터 전략을 주도하며 의료 시스템의 기초를 마련했습니다. 그는 깨끗한 물을 얻으려면 끝단에서 필터링하는 대신 파이프 자체를 고쳐야 한다는 원칙을 강조합니다.

교차검증데이터 품질을 확보하지 못한 상태에서 인공지능 모델만 구축하는 방식은 비용 효율성이 낮고 위험합니다. 데이터가 통합되지 않으면 부서 간 지표가 충돌하여 신뢰할 수 없는 결과를 도출할 가능성이 큽니다.

팩트엔와이유 랑곤 헬스는 환자 데이터와 재무 데이터, 운영 데이터의 원천을 명확히 정의했습니다. 데이터 웨어하우스 계층에서 데이터를 매핑하는 대신 원천 시스템에서 문제를 해결하는 방식을 고수합니다.

주장의료 분야에서 통합 데이터는 환자 중심의 의료 서비스를 가능하게 합니다. 임상 시험 데이터와 수술 중 수집된 표본, 재무 정보를 연결해야 진정한 데이터 활용이 가능합니다.

팩트엔와이유 랑곤 헬스는 데이터와 인공지능 모델을 관리하기 위해 유니티 카탈로그(Unity Catalog)를 사용합니다. 데이터의 발견 가능성과 신뢰성을 높이기 위해 마스터 데이터 소스를 정의하고 소유권을 명확히 합니다.

교차검증플랫폼 도입만으로 충분한 가치를 창출하기는 어렵습니다. 정보기술 부서뿐만 아니라 임상의와 연구원 등 조직 전체가 데이터를 활용하도록 데이터 리터러시 교육과 커뮤니티 구축을 병행해야 합니다.

팩트응급실과 같은 고위험 환경에서는 사후 보고보다 실시간 의사결정 지원이 중요합니다. 엔와이유 랑곤 헬스는 특정 위급 상황을 감지하여 오진을 방지하는 모델을 실시간으로 운영합니다.

출처데이터브릭스 블로그(https://www.databricks.com/blog/data-quality-ai-strategy)를 교차 검증했습니다.

관련 콘텐츠

← 목록으로 돌아가기

본 기사는 전문가의 분석과 공개 자료를 기반으로 AI가 작성 후 다른 AI의 검증을 거쳐 작성됐으며 정보의 정확성과 완전성을 보장하지 않습니다. 기사 내용은 특정 투자·의사결정의 권유가 아니며, Wittgenhaus는 이를 근거로 한 행위의 결과에 책임을 지지 않습니다.

스팟

WIRE

글로벌 인텔리전스

전체보기 →

TELEGRAM · Clash Report

Syrian President Ahmad al-Sharaa: We should never be forced to choose between Israeli ambitions and Iranian ambitions in the region. The region itself must have its own independent policy and its own independent identity.

45분 전

TELEGRAM · Clash Report

Syrian President Ahmad al-Sharaa: In its natural course, a national renaissance takes about 20 to 25 years before its full results become visible. When we talk about Singapore, Rwanda today, Türkiye, or even the Gulf Cooperation Council countries—every country that has achieved this kind of success took time. It took around 20 to 25 years. But that doesn't mean we have to wait 20 years before we see change in Syria. What matters is that the trajectory is upward. Progress should become visibl

45분 전

TELEGRAM · Clash Report

Syrian President Ahmad al-Sharaa: Let's distinguish between the SDF and the Kurdish people. The Kurdish community is a large community spread across Syria; it is not confined to one specific area. A segment of the Kurdish population had been denied Syrian citizenship under the previous regime. This is an old issue that we inherited, but we were determined to resolve it. We issued a decree granting citizenship and nationality rights, and many have already received them. Their cultural rights

45분 전

본 페이지의 정보는 공개 채널을 통해 자동 수집되는 정보로 정보의 정확성·완전성을 보장하지 않으며, Wittgenhaus의 공식 입장이 아닙니다. 이를 근거로 한 판단과 행위의 결과에 Wittgenhaus는 책임을 지지 않습니다.

버블 지표

상세보기 →

많이 본 콘텐츠

루마니아의 러시아 드론 격추 및 외교적 항의

국제7시간 전

먼데이닷컴 등 기술 기업의 인공지능 전환에 따른 대규모 인력 감축

경제23시간 전

오픈에이아이의 허깅페이스 시스템 침해와 투명성 요구

AI7시간 전

앤스로픽 클로드 오퍼스 5의 ARC-AGI-3 벤치마크 신기록 달성

AI13시간 전

오픈에이아이 지피티-5 모델의 생화학 무기 정보 제공 논란

AI13시간 전

릴리즈 & 논문

전체보기 →

RELEASES

vLLMv0.26.0

v0.26.0 릴리즈

이번 릴리즈에서는 Inkling 모델 제품군 지원, DeepSeek-V4 성능 향상, fp32 `lm_head` 지원 추가, 유연한 어텐션 백엔드, KV 오프로딩 및 계층형 보조 스토리지 기능 강화 등 다양한 업데이트가 포함되었습니다. 또한 Rust 프론트엔드 기능 확장 및 Transformers 5.13.0 지원이 추가되었습니다.

1일 전

LangChainlangchain-anthropic==1.5.2

langchain-anthropic==1.5.2

Claude Opus 5 모델 지원이 추가되었습니다. 이번 릴리즈는 이전 버전인 langchain-anthropic==1.5.1 이후의 변경 사항을 포함합니다.

2일 전

Anthropicv0.120.0

v0.120.0

이번 릴리즈에서는 claude-opus-5 모델이 추가되었습니다. 또한, 도구 추가/제거 블록 및 tool_change 이벤트가 지원되며, 클라이언트 측 대체 크레딧 토큰 유형이 확장되고 서버 측 대체 기본 옵션이 추가되었습니다.

2일 전

LangChainlangchain-openai==1.4.1

langchain-openai==1.4.1

이번 릴리즈에서는 LangSmith 게이트웨이를 환경 변수를 통해 지원하도록 기능이 추가되었습니다. 또한 `gpt-5.3-chat-latest` 프로필이 수정되었습니다.