A differenza dei workflow standard che creano un'istanza di una risorsa modello di workflow creata in precedenza, i workflow incorporati utilizzano un file YAML o una definizione WorkflowTemplate incorporata per eseguire un workflow.
.Crea ed esegui un workflow inline
gcloud
Consulta Istanziare un flusso di lavoro utilizzando un file YAML.
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- project-id: Google Cloud ID progetto
- region: regione del cluster, ad esempio "us-central1"
- zoneUri: Specifica un zone all'interno della regione del cluster, ad esempio "us-central1-b", o lascia vuoto ("") per utilizzare il posizionamento automatico delle zone di Dataproc
- clusterName: nome del cluster
Metodo HTTP e URL:
POST https://dataproc.googleapis.com/v1/projects/project-id/regions/region/workflowTemplates:instantiateInline
Corpo JSON della richiesta:
{
"jobs": [
{
"hadoopJob": {
"mainJarFileUri": "file:///usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar",
"args": [
"teragen",
"1000",
"hdfs:///gen/"
]
},
"stepId": "teragen"
},
{
"hadoopJob": {
"mainJarFileUri": "file:///usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar",
"args": [
"terasort",
"hdfs:///gen/",
"hdfs:///sort/"
]
},
"stepId": "terasort",
"prerequisiteStepIds": [
"teragen"
]
}
],
"placement": {
"managedCluster": {
"clusterName": "cluster-name",
"config": {
"gceClusterConfig": {
"zoneUri": "zone"
}
}
}
}
}
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{
"name": "projects/project-id/regions/region/operations/2fbd0dad-...",
"metadata": {
"@type": "type.googleapis.com/google.cloud.dataproc.v1.WorkflowMetadata",
"graph": {
"nodes": [
{
"stepId": "teragen",
"state": "RUNNABLE"
},
{
"stepId": "terasort",
"prerequisiteStepIds": [
"teragen"
],
"state": "BLOCKED"
}
]
},
"state": "PENDING",
"startTime": "2020-04-02T22:50:44.826Z"
}
}
Console
Al momento, la creazione di flussi di lavoro in linea non è supportata nella console Google Cloud . I modelli di flusso di lavoro e i flussi di lavoro con istanze create possono essere visualizzati dalla pagina Flussi di lavoro di Dataproc.