728x90
반응형
Greenplum PXF(Platform Extension Framework)
Greenplum이 아닌 외부시스템에서 가지고 있는 DATA 를 Greenplum 으로 Load 할 수 있는 프레임워크이다.
외부시스템 DATA는 ORACLE, Maraidb 처럼 RDBMS의 테이블이 될 수 있으며 하둡의 HDFS, 파일시스템의 SAM File, XML, JSON 등이 될 수 있다.
PXF 는 Greenplum 5.x 때부터 사용되었으며 6.x 에서부터는 완전 권장하는 느낌(?)이다.
## PXF 장점
- 많은 유형의 DataSource를 Load 할 수 있다.
- 병렬로 데이터를 처리하여 속도가 빠르다.
- 기본 제공 모듈로써 추가비용을 낼 필요없이 자유롭게 사용할 수 있다.
## Greenplum 버전별로 DATA Load 를 권하는 개인적인 생각기준
- Version 4 : copy / external table / gpload
- Version 5 : gpload / PXF
- Version 6 : PXF
## 공식 설명
gpdb.docs.pivotal.io/pxf/5-15/using/overview_pxf.html
## 참고
www.slideshare.net/kongyew/greenplum-pxfnov-2018
## PXF Github - 구동로직을 공부/확인할때는 역시 소스레벨
728x90
반응형
'Database > Greenplum' 카테고리의 다른 글
Greenplum 6.14에서 ORCA(query optimizer) 성능향상 (0) | 2021.02.17 |
---|---|
Greenplum biopython-1.76 모듈 설치 (0) | 2021.01.01 |
Greenplum - Procedural Languages 란? (0) | 2020.12.23 |
Greenplum minor 업그레이드하기(6.3.0->6.11.1) (0) | 2020.12.16 |
statement_timeout 속성에 대해서 (0) | 2020.12.08 |