DATA LAKE(데이터 레이크)
[데이터 소스] → [수집 Layer] → [저장 Layer] → [처리 Layer] → [분석/시각화] (DB, IoT, SaaS) (Kafka, Flume) (S3, HDFS) (Spark, SQL) (Tableau, ML)DATA LAKE(데이터 레이크) 는 구조화된 데이터, 반구조화된 데이터, 비정형 데이터 등 모든 유형의 대용량 데이터를 원본 형태 그대로 저장하고 관리하는 중앙 집중식 저장소입니다.(→ 전통적인 데이터 웨어하우스와 달리, 데이터를 미리 정제하거나 스키마를 정의하지 않아 유연성이 높습니다.) 1. 데이터 레이크의 핵심 특징특징설명원본 데이터 저장CSV, JSON, 로그 파일, 이미지, 동영상, IoT 데이터 등 다양한 형식 수용스키마 온 리드(Schema-on-R..