이 빠른 시작에서는 Google Cloud 파이프라인 구성요소(GCPC) SDK 설치 과정을 안내합니다.
최신 출시 버전 설치
다음 명령어를 사용하여 Python 패키지 색인(PyPI)에서 Google Cloud 파이프라인 구성요소 SDK를 설치합니다.
pip install --upgrade google-cloud-pipeline-components
GCPC SDK를 통해 사전 빌드된 구성요소 사용
Google Cloud 파이프라인 구성요소 SDK를 설치한 후 사전 빌드된 구성요소를 가져오는 데 사용할 수 있습니다.
지원되는 구성요소에 대한 SDK 참조 정보는 google_cloud_pipeline_components
SDK 문서를 참조하세요.
예를 들어 다음 코드를 사용하여 파이프라인에서 Dataflow 구성요소를 가져오고 사용할 수 있습니다.
from google_cloud_pipeline_components.v1.dataflow import DataflowPythonJobOp
from kfp import dsl
@dsl.pipeline(
name=PIPELINE_NAME,
description='Dataflow launch python pipeline'
)
def pipeline(
python_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/wc.py',
project_id:str = PROJECT_ID,
location:str = LOCATION,
staging_dir:str = PIPELINE_ROOT,
requirements_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/requirements.txt',
):
dataflow_python_op = DataflowPythonJobOp(
project=project_id,
location=location,
python_module_path=python_file_path,
temp_location = staging_dir,
requirements_file_path = requirements_file_path,
args = ['--output', OUTPUT_FILE],
)
다음 단계
- Google Cloud 파이프라인 구성요소 소개 읽어보기
- 모든
google_cloud_pipeline_components
SDK 사용 튜토리얼 참조 - Dataflow 구성요소 시작하기