Ce guide de démarrage rapide vous accompagne tout au long de l'installation du SDK des composants du pipeline Google Cloud (GCPC).
Installer la dernière version
Utilisez la commande suivante pour installer le SDK des composants du pipeline Google Cloud à partir de l'index de packages Python (PyPI) :
pip install --upgrade google-cloud-pipeline-components
Utiliser un composant prédéfini via le SDK GCPC
Après avoir installé le SDK de composants Google Cloud, vous pouvez l'utiliser pour importer un composant prédéfini.
Pour obtenir des informations de référence sur les composants compatibles du SDK, consultez la documentation du SDK google_cloud_pipeline_components
.
Par exemple, vous pouvez utiliser l'extrait de code suivant pour importer et utiliser le composant Dataflow dans un pipeline.
from google_cloud_pipeline_components.v1.dataflow import DataflowPythonJobOp
from kfp import dsl
@dsl.pipeline(
name=PIPELINE_NAME,
description='Dataflow launch python pipeline'
)
def pipeline(
python_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/wc.py',
project_id:str = PROJECT_ID,
location:str = LOCATION,
staging_dir:str = PIPELINE_ROOT,
requirements_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/requirements.txt',
):
dataflow_python_op = DataflowPythonJobOp(
project=project_id,
location=location,
python_module_path=python_file_path,
temp_location = staging_dir,
requirements_file_path = requirements_file_path,
args = ['--output', OUTPUT_FILE],
)
Étape suivante
- Consultez la page Présentation des composants du pipeline Google Cloud.
- Consultez tous les tutoriels qui utilisent le SDK
google_cloud_pipeline_components
. - Faites vos premiers pas avec les composants de Dataflow