반응형
ETL 과 ELT
- 데이터 파이프라이는 ETL, ELT 같은 용어로 표현된다.
- ETL과 ELT는 순서 차이이다.
E = Extract (추출)
L = Load (적재)
T = Transform (변환)
- 변환은 비정형 데이터의 정형과정 등이 포함될 수 있다.
ETL 특징
- 추출 -> 변환 -> 적재
- 적재하는 과정에서 변환이 이루어짐 (Schema-on-Write)
- 적재된 데이터는 이미 정형화 되어있기 때문에, 비즈니스 분석 및 시각화에 용이
ELT 특징
- 추출 -> 적재 -> 변환
- 적재하고 나서 분석을 시작하며 변환 (Schema-on-Read)
- 비정형 데이터 분석에 주로 사용된다 -> 정형화 데이터 분석보다 느림 (더 복잡하기 때문)
- 최근 클라우드의 발전, 빅데이터 (TB,PB 등 크기의 데이터) 적재 전 변환과정이 병목이 될 수 있다는 이유에서 ELT를 사용하기도 함
추출 대상
- 관계형 데이터 베이스 (RDBMS)
- NoSQL
- 텍스트 파일 (JSON, log, txt 등)
- SaaS로부터 생성되는 데이터 (Ads 와 같은 광고 데이터)
- 데이터 레이크 (비정형 데이터를 포함해 원시 데이터를 저장하는 공간)
적재 대상
- 데이터 웨어하우스
반응형
'DevOps > DevOps' 카테고리의 다른 글
[Mac OS]Mac OS Proxy 서버 구동 (nginx) (0) | 2022.12.30 |
---|---|
MLOps 란? (DevOps 와 비교) (0) | 2022.12.21 |
데이터 파이프 라인 (0) | 2022.12.21 |
CORS 란? (0) | 2022.12.16 |
[Mac OS]Mac 환경에서 nginx 실행하기 (0) | 2022.12.15 |