Questa guida rapida illustra l'installazione del SDK GCPC (Google Cloud Pipeline Components).
Installa la release più recente
Utilizza il comando seguente per installare l'SDK dei componenti della pipeline di Google Cloud da Python Indice pacchetto (PyPI):
pip install --upgrade google-cloud-pipeline-components
Utilizzare un componente predefinito tramite l'SDK GCPC
Dopo aver installato l'SDK dei componenti della pipeline di Google Cloud, puoi utilizzarlo per importare componente predefinito.
Per informazioni di riferimento relative all'SDK per i componenti supportati, consulta
la documentazione relativa all'SDK google_cloud_pipeline_components
.
Ad esempio, puoi utilizzare il seguente codice per importare e utilizzare Componente Dataflow in una pipeline.
from google_cloud_pipeline_components.v1.dataflow import DataflowPythonJobOp
from kfp import dsl
@dsl.pipeline(
name=PIPELINE_NAME,
description='Dataflow launch python pipeline'
)
def pipeline(
python_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/wc.py',
project_id:str = PROJECT_ID,
location:str = LOCATION,
staging_dir:str = PIPELINE_ROOT,
requirements_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/requirements.txt',
):
dataflow_python_op = DataflowPythonJobOp(
project=project_id,
location=location,
python_module_path=python_file_path,
temp_location = staging_dir,
requirements_file_path = requirements_file_path,
args = ['--output', OUTPUT_FILE],
)
Passaggi successivi
- Leggi la pagina Introduzione ai componenti della pipeline di Google Cloud.
- Guarda tutti i tutorial che utilizzano il
google_cloud_pipeline_components
l'SDK. - Inizia a utilizzare i componenti di Dataflow.