Inizia a utilizzare Batch

Questa pagina descrive come iniziare a utilizzare Batch per Google Cloud.

Panoramica

Batch è un servizio completamente gestito che consente di pianificare, inserire in coda ed eseguire carichi di lavoro di elaborazione batch sulle risorse Google Cloud. Ad esempio, prendi in considerazione l'utilizzo di Batch per carichi di lavoro di computing ad alte prestazioni (HPC), machine learning (ML) ed elaborazione dei dati. Batch esegue il provisioning delle risorse e gestisce la capacità per tuo conto, consentendo l'esecuzione dei tuoi carichi di lavoro batch su larga scala.

Con Batch, non devi configurare e gestire scheduler di terze parti, eseguire il provisioning e il deprovisioning delle risorse o richiedere risorse una zona alla volta. Per eseguire un job, devi specificare i parametri per le risorse necessarie per il carico di lavoro. Batch ottiene le risorse e mette in coda il job per l'esecuzione. Batch offre integrazione nativa con altri servizi Google Cloud per facilitare la pianificazione, l'esecuzione, l'archiviazione e l'analisi di job batch, in modo che tu possa concentrarti sull'invio di un job e sul consumo dei risultati.

Il batch è costituito dai seguenti componenti:

  • Job: un programma pianificato che esegue fino al completamento di una serie di attività senza interazione da parte dell'utente, in genere per i carichi di lavoro di calcolo. Ad esempio, un job potrebbe essere un singolo script shell o un complesso complesso multiparte.

    Nello specifico, un job batch rappresenta un array di una o più attività e l'ambiente in cui eseguirle. Il programma per il job è una sequenza di uno o più eseguibili. Ogni attività esegue la sequenza di elementi eseguibili sulle risorse del job. Puoi configurare le attività di un job in modo che vengano eseguite in parallelo o in sequenza.

  • Attività: un'esecuzione della sequenza di elementi eseguibili di un job. Quando un job include più attività, puoi specificare in che modo ogni esecuzione deve variare facendo riferimento alla variabile di ambiente per l'indice di un'attività negli elementi eseguibili del job.

  • Eseguibile: uno script o un container eseguibile che definisci come parte di un job.

  • Risorse:l'infrastruttura necessaria per eseguire un job. Come minimo, devi specificare solo le risorse di calcolo richieste per attività: core della CPU, memoria e, se richiesto, spazio di archiviazione su disco di avvio aggiuntivo. Se vuoi, puoi anche specificare altre opzioni delle risorse per il job. Batch crea ed elimina automaticamente le risorse che soddisfano le tue specifiche durante il tempo di esecuzione del job.

    In particolare, ogni job batch viene eseguito su un gruppo di istanze gestite a livello di regione, ovvero un gruppo di una o più istanze di macchine virtuali (VM) Compute Engine corrispondenti, ciascuna situata in una delle zone incluse. Ogni VM dispone di un hardware dedicato per core e memoria della CPU, che influiscono sulle prestazioni del job, e di un disco di avvio, in cui è archiviata un'immagine del sistema operativo (OS) e le istruzioni per l'esecuzione del job. Se specificato, un job può anche includere o accedere a risorse aggiuntive, ad esempio GPU o volumi di archiviazione esterni. Il numero di VM di cui è stato eseguito il provisioning per un job dipende dai requisiti hardware e dalle opzioni di pianificazione delle attività specificate.

Riassumendo, Batch ti consente di creare ed eseguire job di cui ciascuno esegue automaticamente il provisioning e l'utilizzo delle risorse necessarie per eseguire le proprie attività.

Per ulteriori informazioni sul comportamento e sulle opzioni del job, consulta la pagina Panoramica sulla creazione ed esecuzione dei job.

Prezzi

Non sono previsti costi aggiuntivi per l'utilizzo di Batch. Ti viene addebitato solo il costo delle risorse sottostanti necessarie per l'esecuzione dei tuoi job.

Per ulteriori informazioni sui costi associati a Batch e su come filtrare i report di fatturazione Cloud per visualizzare i costi batch, consulta la pagina Prezzi.

Limitazioni

Batch ha le seguenti restrizioni:

  • Non puoi superare quote e limiti per i batch per il tuo progetto.
  • Puoi specificare un solo tipo di macchina, che può essere predefinita o personalizzata, per job.
  • Non puoi specificare più di un gruppo di attività per job. Tutti i job hanno un solo gruppo attività denominato group0.

Prerequisiti

Per iniziare a utilizzare Batch, completa i seguenti prerequisiti:

  1. Se il tuo progetto non ha mai utilizzato Batch, abilita Batch per il tuo progetto.
  2. Configura Batch per ogni nuovo utente.

Abilita Batch per un progetto

Per iniziare a utilizzare Batch con un progetto, segui questi passaggi:

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  3. Assicurati che Batch sia abilitato per il tuo progetto:

    1. Abilitare le API per Batch usando la console Google Cloud o Google Cloud CLI.

      Console

      Abilita le API Batch, Compute Engine, and Cloud Logging.

      Abilita le API

      gcloud

      Abilita le API Batch, Compute Engine, and Cloud Logging.

      gcloud services enable batch.googleapis.com compute.googleapis.com logging.googleapis.com

    2. Assicurati che il progetto abbia uno o più account di servizio con le autorizzazioni necessarie per creare e accedere alle risorse per l'esecuzione di job batch.

      È importante sottolineare che a tutti gli utenti a cui vuoi consentire di creare ed eseguire job batch nel tuo progetto deve essere concessa l'autorizzazione per utilizzare uno di questi account di servizio. Non selezionare account di servizio con più autorizzazioni di quelle da concedere a questi utenti.

      L'account di servizio utilizzato da ogni job per impostazione predefinita è l'account di servizio predefinito di Compute Engine, ma puoi anche personalizzare l'account di servizio utilizzato da un job.

      A meno che tu non preveda di utilizzare solo la configurazione predefinita per gli account di servizio del job, concedi i seguenti ruoli IAM a tutti gli account di servizio che il tuo progetto utilizza per i job batch.

      • Reporter agente batch (roles/batch.agentReporter) nel progetto
      • Per consentire ai job di generare log in Cloud Logging: Writer log (roles/logging.logWriter) nel progetto

      L'account di servizio che utilizzi per un job potrebbe richiedere anche ruoli aggiuntivi in base alle opzioni di configurazione da utilizzare per i job. Consulta la documentazione di ogni attività per verificare se sono necessarie autorizzazioni aggiuntive. Per ulteriori informazioni su come concedere ruoli agli account di servizio, consulta Limitazione degli account di servizio e Gestire l'accesso agli account di servizio.

    3. Assicurati di conoscere l'agente di servizio Batch del tuo progetto:

      Dopo aver creato un job batch, l'agente di servizio Batch viene creato automaticamente per il tuo progetto con il seguente nome:

      service-PROJECT_NUMBER@gcp-sa-cloudbatch.iam.gserviceaccount.com
      

      Sostituisci PROJECT_NUMBER con il numero di progetto del tuo progetto.

      All'agente di servizio Batch viene concesso automaticamente il ruolo IAM di Agente di servizio batch Google (roles/batch.serviceAgent). Questa configurazione è necessaria affinché il tuo progetto utilizzi Batch.

      Tuttavia, alcuni casi d'uso, ad esempio l'esecuzione di un job su una VPC condiviso condivisa, richiedono la concessione di autorizzazioni aggiuntive all'agente di servizio batch del progetto.

      Per ulteriori informazioni, consulta Agenti di servizio.

Configurare Batch per un nuovo utente

Per iniziare a utilizzare Batch come utente:

  1. Per ottenere le autorizzazioni necessarie per utilizzare Batch, chiedi all'amministratore di concederti i ruoli IAM richiesti per il progetto. Fai riferimento alla documentazione di ogni attività per vedere le autorizzazioni richieste.

    Ad esempio, se vuoi iniziare a imparare a utilizzare Batch creando un job di base, valuta la possibilità di richiedere ruoli per le seguenti attività:

    • Per creare lavori:
    • Per elencare e descrivere i job: editor job batch (roles/batch.jobsEditor) o visualizzatore job batch (roles/batch.jobsViewer) nel progetto
    • Per visualizzare i log per i job: Visualizzatore log (roles/logging.viewer) nel progetto
    • Per eliminare i job: editor dei job batch (roles/batch.jobsEditor) nel progetto

    Per maggiori informazioni sulla concessione dei ruoli, consulta Gestire l'accesso.

  2. Se vuoi utilizzare esempi a riga di comando per Batch, configura Google Cloud CLI seguendo questi passaggi. Scopri di più sull'autenticazione per Google Cloud CLI.

    1. Installa Google Cloud CLI, quindi initialize eseguendo questo comando:

      gcloud init

    2. Opzione consigliata: imposta un progetto predefinito utilizzando il comando gcloud config set project:

      gcloud config set project PROJECT_ID
      

      Sostituisci PROJECT_ID con l'ID progetto del tuo progetto.

  3. Se vuoi utilizzare gli esempi di API o di librerie client per Batch, consulta Autenticazione in batch.

Richiedi assistenza

Puoi discutere di Batch con la community sui forum di Cloud.

In caso di problemi con Batch, consulta la documentazione per la risoluzione dei problemi.

Per ricevere assistenza o fornire feedback per Batch, utilizza le seguenti risorse:

  • In caso di problemi di fatturazione con Google Cloud, contatta l'assistenza per la fatturazione.

  • Se hai un pacchetto di assistenza a pagamento, contatta direttamente l'assistenza Google Cloud in caso di problemi con Batch.

    Google Cloud offre diversi pacchetti di assistenza per soddisfare esigenze diverse, come copertura 24 ore su 24, 7 giorni su 7, assistenza telefonica e accesso a un responsabile dell'assistenza tecnica. Per ulteriori informazioni, visita il sito dell'assistenza Google Cloud.

  • Per fornire feedback o richieste di funzionalità per Batch o per segnalare problemi relativi a Batch senza un pacchetto di assistenza a pagamento, fai clic sul pulsante Invia feedback, che puoi trovare all'inizio e alla fine di ogni pagina della documentazione di Batch. Poi seleziona una delle seguenti opzioni:

    • Per feedback sulla documentazione batch, seleziona "Feedback sulla documentazione".
    • Per tutti gli altri feedback su Batch, seleziona "Feedback sul prodotto".

Passaggi successivi