Inizia a utilizzare Batch

In questa pagina viene descritto come iniziare a utilizzare Batch per Google Cloud.

Panoramica

Batch è un servizio completamente gestito che consente di pianificare, inserire in coda ed eseguire carichi di lavoro di elaborazione batch sulle risorse Google Cloud. Il batch esegue il provisioning delle risorse e gestisce la capacità per conto tuo, consentendo l'esecuzione dei carichi di lavoro batch su larga scala.

Utilizzando Batch, non è necessario configurare e gestire scheduler di job di terze parti, eseguire il provisioning e il deprovisioning delle risorse o richiedere risorse una zona alla volta. Per eseguire un job, devi specificare i parametri delle risorse necessarie per il carico di lavoro, quindi Batch ottiene le risorse e mette in coda il job per l'esecuzione. Batch fornisce l'integrazione nativa con altri servizi Google Cloud per facilitare la pianificazione, l'esecuzione, l'archiviazione e l'analisi dei job batch, in modo che tu possa concentrarti sull'invio di un job e sul consumo dei risultati.

Il batch è costituito dai seguenti componenti:

  • Job: un programma pianificato che esegue una serie di attività fino al completamento senza alcuna interazione da parte dell'utente, in genere per carichi di lavoro di calcolo. Ad esempio, un job potrebbe essere un singolo script shell o un calcolo complesso e multiparte.

    Un job viene eseguito tramite una o più azioni specifiche chiamate attività. Ogni job batch è costituito da un array di una o più attività che eseguono gli stessi eseguibili, che sono gli script eseguibili e i container per il job. Le attività di un job possono essere eseguite in parallelo o in sequenza sulle risorse del job.

  • Attività: azioni programmatiche che sono definite come parte di un job ed eseguite all'esecuzione del job. Ogni attività fa parte del gruppo di attività di un job. Gli elementi eseguibili del job vengono eseguiti da ogni attività nel job.

  • Risorse: l'infrastruttura necessaria per eseguire un job. Ogni job batch viene eseguito su un gruppo di istanze gestite a livello di regione (MIG) di una o più istanze di macchine virtuali (VM) Compute Engine in base ai requisiti e alla località specificati per il job. Ogni VM ha un hardware dedicato per i core della CPU e la memoria, che influisce sulle prestazioni del job, e un disco di avvio, in cui è archiviata un'immagine del sistema operativo e le istruzioni per l'esecuzione del job. Se specificato, un job può anche utilizzare o accedere a risorse aggiuntive, come GPU, o risorse di archiviazione di lettura/scrittura aggiuntive, come SSD locali o un bucket Cloud Storage. Alcuni dei fattori che determinano il numero di VM di cui è stato eseguito il provisioning per un job includono le risorse hardware VM necessarie per ogni attività e il parallelismo del job, ovvero se vuoi che le attività vengano eseguite in sequenza su una VM o contemporaneamente su più VM.

Riassumendo, Batch ti consente di creare ed eseguire job, di cui ciascuno esegue automaticamente il provisioning e l'utilizzo delle risorse necessarie per eseguire le proprie attività.

Prezzi

Non sono previsti costi aggiuntivi per l'utilizzo di Batch. Ti viene addebitato solo il costo delle risorse sottostanti necessarie per eseguire i job.

Per ulteriori informazioni sui costi associati a Batch e su come filtrare i report di fatturazione Cloud per visualizzare i costi batch, consulta la sezione Prezzi.

Limitazioni

Batch prevede le seguenti limitazioni:

Prerequisiti

Per iniziare a utilizzare Batch, completa i seguenti prerequisiti:

  1. Se il tuo progetto non ha mai utilizzato Batch, abilita Batch per il tuo progetto.
  2. Configura Batch per ogni nuovo utente.

Abilitare Batch per un progetto

Per iniziare a utilizzare Batch con un progetto, segui questi passaggi:

  1. Nella console di Google Cloud Console, nella pagina del selettore dei progetti, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  2. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  3. Assicurati che la funzionalità Batch sia abilitata per il tuo progetto:

    1. Abilitare le API per Batch utilizzando la console Google Cloud o Google Cloud CLI.

      Console

      Abilita le API Batch, Compute Engine, and Cloud Logging.

      Abilita le API

      gcloud

      Abilita le API Batch, Compute Engine, and Cloud Logging.

      gcloud services enable batch.googleapis.com compute.googleapis.com logging.googleapis.com

    2. Per assicurarti che l'account di servizio per ogni job disponga delle autorizzazioni necessarie per consentire all'agente di servizio Batch di creare e accedere alle risorse per i job, chiedi all'amministratore di concedere i seguenti ruoli IAM a tutti gli account di servizio che il tuo progetto utilizza per i job batch.

      L'account di servizio utilizzato da ogni job per impostazione predefinita è l'account di servizio predefinito di Compute Engine, ma puoi anche personalizzare l'account di servizio utilizzato da un job.

      • Reporter agente batch (roles/batch.agentReporter) nel progetto
      • Per consentire ai job di accedere a un bucket Cloud Storage: Amministratore Storage (roles/storage.admin) nel bucket
      • Per consentire ai job di generare log in Cloud Logging: Writer log (roles/logging.logWriter) nel progetto

      Per ulteriori informazioni sulla concessione dei ruoli agli account di servizio, consulta Limitazione degli account di servizio e Gestire l'accesso agli account di servizio.

    3. Assicurati di conoscere l'agente di servizio Batch del tuo progetto:

      Dopo aver creato un job batch, l'agente di servizio Batch (un account di servizio gestito da Google) viene creato automaticamente per il tuo progetto con il seguente nome:

      service-PROJECT_NUMBER@gcp-sa-cloudbatch.iam.gserviceaccount.com
      

      Sostituisci PROJECT_NUMBER con il numero di progetto del tuo progetto.

      All'agente di servizio Batch viene concesso automaticamente il ruolo IAM Agente di servizio Google Batch (roles/batch.serviceAgent). Questa configurazione è necessaria per consentire al progetto di utilizzare Batch.

      Tuttavia, alcuni casi d'uso, ad esempio l'esecuzione di un job su una VPC condiviso condivisa, richiedono di concedere autorizzazioni aggiuntive all'agente di servizio batch del progetto.

      Per ulteriori informazioni, vedi Agenti di servizio.

Configurare Batch per un nuovo utente

Per iniziare a utilizzare Batch come utente:

  1. Per ottenere le autorizzazioni necessarie per l'utilizzo di Batch, chiedi all'amministratore di concederti i ruoli IAM richiesti per il progetto. Consulta la documentazione di ogni attività per visualizzare le autorizzazioni richieste.

    Ad esempio, se vuoi iniziare a imparare a utilizzare Batch creando un job di base, valuta la possibilità di richiedere ruoli per le seguenti attività:

    • Per creare job:
    • Per elencare e descrivere i job: Editor job batch (roles/batch.jobsEditor) o Visualizzatore job batch (roles/batch.jobsViewer) nel progetto
    • Per visualizzare i log per i job: visualizzatore log (roles/logging.viewer) nel progetto
    • Per eliminare i job: editor di job batch (roles/batch.jobsEditor) nel progetto

    Per ulteriori informazioni sulla concessione dei ruoli, consulta Gestione dell'accesso.

  2. Se vuoi utilizzare gli esempi di riga di comando per Batch, configura Google Cloud CLI come descritto di seguito. Scopri di più sull'autenticazione per Google Cloud CLI.

    1. Installa Google Cloud CLI, quindi inizializzalo eseguendo il comando seguente:

      gcloud init

    2. Consigliato: imposta un progetto predefinito utilizzando il comando gcloud config set project:

      gcloud config set project PROJECT_ID
      

      Sostituisci PROJECT_ID con l'ID progetto del tuo progetto.

  3. Se vuoi utilizzare gli esempi di API o di librerie client per Batch, consulta Autenticazione in Batch.

Ricevi assistenza

Puoi discutere di Batch con la community sui forum Cloud.

In caso di problemi con Batch, consulta la documentazione sulla risoluzione dei problemi.

Per ricevere assistenza o fornire feedback per Batch, utilizza le seguenti risorse:

  • Per problemi di fatturazione con Google Cloud, contatta l'assistenza per la fatturazione.

  • Se disponi di un pacchetto di assistenza a pagamento, contatta direttamente l'assistenza Google Cloud in caso di problemi con Batch.

    Google Cloud offre pacchetti di assistenza per diverse esigenze, come copertura 24 ore su 24, 7 giorni su 7, assistenza telefonica e accesso a un responsabile dell'assistenza tecnica. Per ulteriori informazioni, visita la pagina dell'assistenza Google Cloud.

  • Per fornire feedback o richieste di funzionalità per Batch, oppure per segnalare problemi per Batch senza un pacchetto di assistenza a pagamento, fai clic sul pulsante Invia feedback, che puoi trovare all'inizio e alla fine di ogni pagina della documentazione di Batch. Poi seleziona una delle seguenti opzioni:

    • Per un feedback relativo alla documentazione Batch, selezionate "Feedback sulla documentazione".
    • Per tutti gli altri feedback su Batch, selezionate "Feedback sul prodotto".

Passaggi successivi