Questa guida rapida ti guida nell'installazione dell'SDK Google Cloud Pipeline Componenti (GCPC).
Installa release più recente
Utilizza il comando seguente per installare l'SDK Google Cloud Pipeline components da Python Package Index (PyPI):
pip install --upgrade google-cloud-pipeline-components
Utilizza un componente predefinito tramite l'SDK GCPC
Dopo aver installato l'SDK Google Cloud Pipeline Componenti, puoi utilizzarlo per importare un componente predefinito.
Per informazioni di riferimento sull'SDK per i componenti supportati, consulta
la documentazione dell'SDK google_cloud_pipeline_components
.
Ad esempio, puoi utilizzare il codice seguente per importare e utilizzare il componente Dataflow in una pipeline.
from google_cloud_pipeline_components.v1.dataflow import DataflowPythonJobOp
from kfp import dsl
@dsl.pipeline(
name=PIPELINE_NAME,
description='Dataflow launch python pipeline'
)
def pipeline(
python_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/wc.py',
project_id:str = PROJECT_ID,
location:str = LOCATION,
staging_dir:str = PIPELINE_ROOT,
requirements_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/requirements.txt',
):
dataflow_python_op = DataflowPythonJobOp(
project=project_id,
location=location,
python_module_path=python_file_path,
temp_location = staging_dir,
requirements_file_path = requirements_file_path,
args = ['--output', OUTPUT_FILE],
)
Passaggi successivi
- Leggi l'articolo Introduzione ai componenti di pipeline di Google Cloud.
- Guarda tutti i tutorial che utilizzano l'SDK
google_cloud_pipeline_components
. - Inizia a utilizzare i componenti di Dataflow.