A diferencia de los flujos de trabajo estándar, que crean una instancia de un recurso de plantilla de flujo de trabajo creado anteriormente, los flujos de trabajo insertados utilizan un archivo YAML o una definición de WorkflowTemplate insertada para ejecutar un flujo de trabajo.
.Crear y ejecutar un flujo de trabajo insertado
gcloud
Consulta Crear una instancia de un flujo de trabajo con un archivo YAML.
REST
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- project-id: Google Cloud ID de proyecto
- region: región del clúster, como "us-central1"
- zoneUri: Especifica una zone en la región del clúster, como "us-central1-b", o deja este campo vacío ("") para usar la colocación automática de zonas de Dataproc.
- clusterName: nombre del clúster
Método HTTP y URL:
POST https://dataproc.googleapis.com/v1/projects/project-id/regions/region/workflowTemplates:instantiateInline
Cuerpo JSON de la solicitud:
{ "jobs": [ { "hadoopJob": { "mainJarFileUri": "file:///usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar", "args": [ "teragen", "1000", "hdfs:///gen/" ] }, "stepId": "teragen" }, { "hadoopJob": { "mainJarFileUri": "file:///usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar", "args": [ "terasort", "hdfs:///gen/", "hdfs:///sort/" ] }, "stepId": "terasort", "prerequisiteStepIds": [ "teragen" ] } ], "placement": { "managedCluster": { "clusterName": "cluster-name", "config": { "gceClusterConfig": { "zoneUri": "zone" } } } } }
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
{ "name": "projects/project-id/regions/region/operations/2fbd0dad-...", "metadata": { "@type": "type.googleapis.com/google.cloud.dataproc.v1.WorkflowMetadata", "graph": { "nodes": [ { "stepId": "teragen", "state": "RUNNABLE" }, { "stepId": "terasort", "prerequisiteStepIds": [ "teragen" ], "state": "BLOCKED" } ] }, "state": "PENDING", "startTime": "2020-04-02T22:50:44.826Z" } }
Consola
Actualmente, no se pueden crear flujos de trabajo insertados en la consola Google Cloud . Las plantillas de flujo de trabajo y los flujos de trabajo creados se pueden ver en la página Flujos de trabajo de Dataproc.