본문 바로가기

Database/Greenplum

Greenplum PXF 란?

728x90
반응형

Greenplum PXF(Platform Extension Framework)

Greenplum이 아닌 외부시스템에서 가지고 있는 DATA 를 Greenplum 으로 Load 할 수 있는 프레임워크이다.

https://www.slideshare.net/Pivotal/federated-queries-across-both-different-storage-mediums-and-different-data-engines-greenplum-summit-2018

외부시스템 DATA는 ORACLE, Maraidb 처럼 RDBMS의 테이블이 될 수 있으며 하둡의 HDFS, 파일시스템의 SAM File, XML, JSON 등이 될 수 있다.

PXF 는 Greenplum 5.x 때부터 사용되었으며 6.x 에서부터는 완전 권장하는 느낌(?)이다.

 

## PXF 장점

  • 많은 유형의 DataSource를 Load 할 수 있다.
  • 병렬로 데이터를 처리하여 속도가 빠르다.
  • 기본 제공 모듈로써 추가비용을 낼 필요없이 자유롭게 사용할 수 있다.

 

## Greenplum 버전별로 DATA Load 를 권하는 개인적인 생각기준

  • Version 4 : copy / external table / gpload
  • Version 5 : gpload / PXF
  • Version 6 : PXF

 

## 공식 설명

greenplum.org/platform-extension-framework-pxf-enabling-parallel-query-processing-over-heterogeneous-data-sources-in-greenplum/

 

Platform Extension Framework (PXF): Enabling Parallel Query Processing Over Heterogeneous Data Sources In Greenplum

Authors: Venkatesh Raghavan, Alexander Denissov, Francisco Guerrero, Oliver Albertini, Divya Bhargov, Lisa Owen, Shivram Mani, Lav Jain Abstract: With the explosion of data stores and cloud service…

greenplum.org

gpdb.docs.pivotal.io/pxf/5-15/using/overview_pxf.html

 

Greenplum Platform Extension Framework (PXF) | Pivotal Greenplum PXF Docs

Greenplum Platform Extension Framework (PXF)

 

## 참고

www.slideshare.net/kongyew/greenplum-pxfnov-2018

 

Greenplum PXF-Nov 2018

The Greenplum Platform Extension Framework (PXF) provides parallel, high throughput data access and federated queries across heterogeneous data sources via bui…

www.slideshare.net

 

## PXF Github - 구동로직을 공부/확인할때는 역시 소스레벨

github.com/greenplum-db/pxf

 

greenplum-db/pxf

Platform Extension Framework: Federated Query Engine - greenplum-db/pxf

github.com

 

728x90
반응형