Greenplum PXF(Platform Extension Framework)
Greenplum이 아닌 외부시스템에서 가지고 있는 DATA 를 Greenplum 으로 Load 할 수 있는 프레임워크이다.
외부시스템 DATA는 ORACLE, Maraidb 처럼 RDBMS의 테이블이 될 수 있으며 하둡의 HDFS, 파일시스템의 SAM File, XML, JSON 등이 될 수 있다.
PXF 는 Greenplum 5.x 때부터 사용되었으며 6.x 에서부터는 완전 권장하는 느낌(?)이다.
## PXF 장점
- 많은 유형의 DataSource를 Load 할 수 있다.
- 병렬로 데이터를 처리하여 속도가 빠르다.
- 기본 제공 모듈로써 추가비용을 낼 필요없이 자유롭게 사용할 수 있다.
## Greenplum 버전별로 DATA Load 를 권하는 개인적인 생각기준
- Version 4 : copy / external table / gpload
- Version 5 : gpload / PXF
- Version 6 : PXF
## 공식 설명
Platform Extension Framework (PXF): Enabling Parallel Query Processing Over Heterogeneous Data Sources In Greenplum
Authors: Venkatesh Raghavan, Alexander Denissov, Francisco Guerrero, Oliver Albertini, Divya Bhargov, Lisa Owen, Shivram Mani, Lav Jain Abstract: With the explosion of data stores and cloud service…
Greenplum Platform Extension Framework (PXF) | Pivotal Greenplum PXF Docs
Greenplum Platform Extension Framework (PXF)
## 참고
Greenplum PXF-Nov 2018
The Greenplum Platform Extension Framework (PXF) provides parallel, high throughput data access and federated queries across heterogeneous data sources via bui…
## PXF Github - 구동로직을 공부/확인할때는 역시 소스레벨
Platform Extension Framework: Federated Query Engine - greenplum-db/pxf
'Database > Greenplum' 카테고리의 다른 글
Greenplum 6.14에서 ORCA(query optimizer) 성능향상 (0) | 2021.02.17 |
Greenplum biopython-1.76 모듈 설치 (0) | 2021.01.01 |
Greenplum - Procedural Languages 란? (0) | 2020.12.23 |
Greenplum minor 업그레이드하기(6.3.0->6.11.1) (0) | 2020.12.16 |
statement_timeout 속성에 대해서 (0) | 2020.12.08 |