Inviare un job Spark utilizzando un modello

Questa pagina mostra come utilizzare un modello Explorer API di Google per eseguire un semplice job Spark su un cluster Dataproc esistente.

Per altri modi per inviare un job a un cluster Dataproc, consulta:

Prima di iniziare

Prima di poter eseguire un job Dataproc, devi creare un cluster di una o più macchine virtuali (VM) su cui eseguirlo. Puoi utilizzare lo Explorer API, il file Console Google Cloud, la gcloud CLI a strumento a riga di comando gcloud, o le Guide rapide sull'utilizzo delle librerie client di Cloud per creare un cluster.

Invia un job

Per inviare un job Apache Spark di esempio che calcola un valore approssimativo per pi, compila ed esegui il modello Prova questa API di Explorer API di Google.

  1. Parametri di richiesta:

    1. Inserisci il tuo projectId.
    2. Specifica la regione in cui si trova il cluster (conferma o sostituisci "us-central1"). Il cluster è elencata sulla piattaforma Dataproc nella pagina Cluster nella console Google Cloud.
  2. Corpo della richiesta:

    1. job.placement.clusterName: Il nome del cluster in cui verrà eseguito il job (conferma o sostituisci "example-cluster").
    2. job.sparkJob.args: "1000", il numero di attività del job.
    3. job.sparkJob.jarFileUris: "file:///usr/lib/spark/examples/jars/spark-examples.jar". Questo è il percorso file locale sul nodo master del cluster Dataproc dove è installato il jar che contiene il codice del job Spark Scala.
    4. job.sparkJob.mainClass: "org.apache.spark.examples.SparkPi". È il metodo principale all'applicazione Scala di calcolo del pi greco del job.
  3. Fai clic su ESEGUI. La prima volta che esegui il modello di API, potrebbe esserti chiesto di scegliere e accedere al tuo Account Google, quindi di autorizzare Google APIs Explorer ad accedere al tuo account. Se la richiesta ha esito positivo, la risposta JSON indica che la richiesta di invio del job è in attesa.

  4. Per visualizzare l'output del job, apri il Pagina Job Dataproc nella console Google Cloud, poi fai clic sull'ID job in alto (il più recente). Fai clic su "RITORNO A CAPO AUTOMATICO" su ON per visualizzare le linee che superano il margine destro.

    ...
    Pi is roughly 3.141804711418047
    ...
    

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.

  1. Se non hai bisogno del cluster per esplorare le altre guide rapide o per eseguire altri job, utilizza Explorer API, la console Google Cloud, l'interfaccia a riga di comando gcloud o le librerie client di Cloud per eliminare il cluster.

Passaggi successivi