Esegui la migrazione a Batch da Cloud Life Sciences

Questa pagina descrive come eseguire la migrazione a Batch da Cloud Life Sciences.

Il 17 luglio 2023, Google Cloud ha annunciato il ritiro di Cloud Life Sciences, in versione beta, Il servizio non sarà più disponibile su Google Cloud dopo l'8 luglio 2025. Tuttavia, Batch è in disponibilità generale ed è un successore completo che supporta tutti i casi d'uso di Cloud Life Sciences.

Scopri di più su Batch, Cloud Life Sciences e fasi di lancio dei prodotti.

Confronto tra Cloud Life Sciences e batch

La migrazione da Cloud Life Sciences a Batch prevede la comprensione di come utilizzare Batch per i carichi di lavoro attualmente eseguiti eseguendo le pipeline di Cloud Life Sciences.

Per capire come puoi eseguire i tuoi carichi di lavoro di Cloud Life Sciences su Batch, consulta tutte le seguenti sezioni:

Panoramica

Una pipeline di Cloud Life Sciences descrive una sequenza di azioni (container) da eseguire e l'ambiente in cui eseguire i container.

Un job batch descrive un array di una o più attività e l'ambiente in cui eseguirle. Il carico di lavoro per un job è definito come una sequenza di uno o più eseguibili (container e/o script) da eseguire. Ogni attività per un job rappresenta un'esecuzione della sua sequenza di elementi eseguibili.

Le pipeline di Cloud Life Sciences possono essere espresse come job batch a singola attività.

Ad esempio, gli esempi seguenti descrivono una semplice pipeline di Cloud Life Sciences e il suo job batch equivalente:

Pipeline Cloud Life Sciences Job batch
  {
    "actions": [
      {
        "imageUri": "bash",
        "commands": [
          "-c",
          "echo Hello, world!"
        ]
      }
    ]
  }
  
    {
      "taskGroups" : [{
        "taskSpec" : {
          "runnables" : [{
            "container":{
              "imageUri": "bash",
              "commands": [
                "-c",
                "echo Hello, world!"
              ]
            }
          }]
        }
      }]
    }
    

I job batch con più attività sono simili alle pipeline di Cloud Life Sciences copiate.

A differenza di Cloud Life Sciences, Batch ti consente di pianificare automaticamente più esecuzioni del carico di lavoro. Indichi il numero di volte in cui vuoi eseguire la sequenza di elementi eseguibili per un job definendo il numero di attività. Quando un job ha più attività, puoi specificare in che modo vuoi che ogni esecuzione vari facendo riferimento all'indice dell'attività negli elementi eseguibili. Inoltre, puoi configurare le pianificazioni relative per le attività di un job, ad esempio se consentire l'esecuzione parallela di più attività o richiederne l'esecuzione in ordine sequenziale e una alla volta. Batch gestisce la pianificazione delle attività del job: quando un'attività viene completata, il job avvia automaticamente l'attività successiva, se presente.

Ad esempio, vedi il seguente job batch. Questo job di esempio ha 100 attività eseguite su 10 istanze di macchine virtuali (VM) Compute Engine, quindi ci sono circa 10 attività in esecuzione in parallelo in un dato momento. Ogni attività in questo job di esempio esegue solo un'esecuzione eseguibile: uno script che stampa un messaggio e l'indice dell'attività, che è definito dalla variabile di ambiente predefinita BATCH_TASK_INDEX.

{
  "taskGroups" : [{
    "taskSpec" : {
      "runnables" : [{
        "script":{
          "text": "echo Hello world! This is task ${BATCH_TASK_INDEX}."
        }
      }]
    },
    "taskCount": 100,
    "parallelism": 10
  }]
}

Workflows che prevedono la creazione e il monitoraggio di più pipeline simili di Cloud Life Sciences possono talvolta essere semplificati sfruttando la pianificazione integrata di Batch.

Operazioni di base

Questa sezione descrive le operazioni di base in Cloud Life Sciences e in batch.

La tabella seguente riassume le opzioni delle operazioni di base per Cloud Life Sciences e Batch.

Operazione di base Opzioni di Cloud Life Sciences Opzioni batch
Esegui un carico di lavoro.
  • Eseguire una pipeline.
  • Crea ed esegui un job.
Visualizza tutti i carichi di lavoro.
  • Elenca le operazioni a lunga esecuzione.
  • Visualizza un elenco delle tue offerte di lavoro.
Visualizza i dettagli e lo stato di un carico di lavoro.
  • Visualizza i dettagli di un'operazione a lunga esecuzione.
  • Eseguire il sondaggio su un'operazione a lunga esecuzione.
  • Visualizza i dettagli di un job.
  • Visualizza un elenco delle attività di un lavoro.
  • Visualizzare i dettagli di un'attività.
Arresta e rimuovi un carico di lavoro.
  • Annullare un'operazione a lunga esecuzione.
  • Eliminare (e annullare) un job.
  • Controlla lo stato di una richiesta di eliminazione di un job.

Le operazioni di base per Cloud Life Sciences e Batch presentano alcune differenze fondamentali.

In primo luogo, le risorse operazione a lunga esecuzione non svolgono lo stesso ruolo in batch che hanno in Cloud Life Sciences. Le risorse operative a lunga esecuzione (LRO) in Cloud Life Sciences sono la risorsa principale utilizzata per elencare e visualizzare le pipeline. Tuttavia, le risorse per le operazioni a lunga esecuzione in Batch e in altre API Google Cloud vengono utilizzate solo per monitorare lo stato di una richiesta il cui completamento richiede molto tempo. Nello specifico, in Batch, l'unica richiesta che restituisce una risorsa per un'operazione a lunga esecuzione è l'eliminazione di un job. Per ulteriori informazioni sulle risorse per le operazione a lunga esecuzione per Batch, consulta la documentazione di riferimento dell'API Batch per la risorsa REST projects.locations.operations. Anziché utilizzare risorse operazione a lunga esecuzione, Batch offre risorse dei job che puoi visualizzare ed eliminare per i tuoi carichi di lavoro.

In secondo luogo, la visualizzazione dei dettagli di un carico di lavoro in Batch coinvolge operazioni diverse rispetto a Cloud Life Sciences. Puoi visualizzare un job per vederne i dettagli e lo stato. Tuttavia, ogni attività di un job ha anche i propri dettagli e stati, che puoi vedere visualizzando un elenco di attività di un job e i relativi dettagli.

Per aiutarti a comprendere ulteriormente le operazioni di base per Cloud Life Sciences e Batch, le seguenti sezioni forniscono esempi di comandi Google Cloud CLI e percorsi di richieste API per alcune di queste operazioni di base.

Esempi di comandi gcloud CLI

Per gcloud CLI, i comandi di Cloud Life Sciences iniziano con gcloud beta lifesciences e i comandi Batch iniziano con gcloud batch. Ad esempio, vedi i seguenti comandi gcloud CLI.

  • Esempi di comandi dell'interfaccia a riga di comando gcloud CLI di Cloud Life Sciences:

    • Esegui una pipeline:

      gcloud beta lifesciences pipelines run \
        --project=PROJECT_ID \
        --regions=LOCATION \
        --pipeline-file=JSON_CONFIGURATION_FILE
      
    • Visualizza i dettagli di un'operazione a lunga esecuzione:

      gcloud beta lifesciences operations describe OPERATION_ID
      

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID progetto del tuo progetto.
    • LOCATION: la posizione della pipeline.
    • JSON_CONFIGURATION_FILE: il file di configurazione JSON per la pipeline.
    • OPERATION_ID: l'identificatore dell'operazione a lunga esecuzione, restituita dalla richiesta di eseguire la pipeline.
  • Esempi di comandi batch dell'interfaccia a riga di comando gcloud CLI:

    • Crea ed esegui un job:

      gcloud batch jobs submit JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION \
        --config=JSON_CONFIGURATION_FILE
      
    • Visualizza i dettagli di un job:

      gcloud batch jobs describe JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION \
      
    • Visualizza l'elenco delle attività di un lavoro:

      ​​gcloud batch tasks list \
        --project=PROJECT_ID \
        --location=LOCATION \
        --job=JOB_NAME
      
    • Visualizza i dettagli di un'attività:

      gcloud batch tasks describe TASK_INDEX \
        --project=PROJECT_ID \
        --location=LOCATION \
        --job=JOB_NAME \
        --task_group=TASK_GROUP
      
    • Elimina (e annulla) un job:

      gcloud batch jobs delete JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION
      

    Sostituisci quanto segue:

    • JOB_NAME: il nome del job.
    • PROJECT_ID: l'ID progetto del tuo progetto.
    • LOCATION: la località del job.
    • JSON_CONFIGURATION_FILE: il percorso di un file JSON con i dettagli di configurazione del job.
    • TASK_INDEX: l'indice dell'attività di cui vuoi visualizzare i dettagli. In un gruppo di attività, l'indice delle attività inizia da 0 per la prima attività e aumenta di 1 a ogni attività aggiuntiva. Ad esempio, un gruppo di attività contenente quattro attività ha gli indici 0, 1, 2 e 3.
    • TASK_GROUP_NAME: il nome del gruppo di attività di cui vuoi visualizzare i dettagli. Il valore deve essere impostato su group0.

Esempi di percorsi di richiesta dell'API

Per le API, Cloud Life Sciences utilizza lifesciences.googleapis.com percorsi di richiesta, mentre Batch utilizza batch.googleapis.com percorsi di richiesta. Ad esempio, consulta i seguenti percorsi di richiesta API. A differenza di Cloud Life Sciences, Batch non ha un'API RPC, ma solo un'API REST.

  • Percorsi di richiesta API di esempio per Cloud Life Sciences:

    • Esegui una pipeline:

      POST https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/pipelines:run
      
    • Visualizza i dettagli di un'operazione a lunga esecuzione:

      GET https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
      

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID progetto del tuo progetto.
    • LOCATION: la posizione della pipeline.
    • OPERATION_ID: l'identificatore dell'operazione a lunga esecuzione, restituita dalla richiesta di eseguire la pipeline.
  • Esempi di percorsi di richiesta API:

    • Crea ed esegui un job:

      POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
      
    • Visualizza i dettagli di un job:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
      
    • Visualizza l'elenco delle attività di un lavoro:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME/taskGroups/TASK_GROUP/tasks
      
    • Eliminazione di un job

      DELETE https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
      
    • Controlla lo stato della richiesta di eliminazione del job:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
      

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID progetto del tuo progetto.
    • LOCATION: la località del job.
    • JOB_NAME: il nome del job.
    • TASK_GROUP_NAME: il nome del gruppo di attività di cui vuoi visualizzare i dettagli. Il valore deve essere impostato su group0.
    • OPERATION_ID: l'identificatore dell'operazione a lunga esecuzione, restituita dalla richiesta di eliminazione del job.

Ruoli e autorizzazioni IAM

Questa sezione riassume le differenze tra i ruoli e le autorizzazioni di Identity and Access Management per Cloud Life Sciences e Batch. Per ulteriori informazioni sui ruoli e sulle relative autorizzazioni, consulta la documentazione di riferimento sui ruoli IAM di base e predefiniti.

La tabella seguente descrive i ruoli predefiniti e le relative autorizzazioni richiesti per gli utenti di Cloud Life Sciences.

Ruoli di Cloud Life Sciences Autorizzazioni

Uno dei seguenti:

  • Amministratore Cloud Life Sciences (roles/lifesciences.admin) del progetto
  • Editor Cloud Life Sciences (roles/lifesciences.editor) in merito al progetto
  • Cloud Life Sciences Workflows Runner (roles/lifesciences.workflowsRunner) in relazione al progetto
  • lifesciences.workflows.run
  • lifesciences.operations.cancel
  • lifesciences.operations.get
  • lifesciences.operations.list
Visualizzatore Cloud Life Sciences (roles/lifesciences.viewer) del progetto
  • lifesciences.operations.get
  • lifesciences.operations.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list

La tabella seguente descrive alcuni dei ruoli predefiniti e le relative autorizzazioni per Batch. A differenza di Cloud Life Sciences, Batch richiede di concedere le autorizzazioni agli utenti e all'account di servizio per un job. Per ulteriori informazioni sui requisiti IAM, consulta Prerequisiti per Batch.

Ruoli batch per gli utenti Autorizzazioni
Editor job batch (roles/batch.jobsEditor) sul progetto
  • batch.jobs.create
  • batch.jobs.delete
  • batch.jobs.get
  • batch.jobs.list
  • batch.locations.get
  • batch.locations.list
  • batch.operations.get
  • batch.operations.list
  • batch.tasks.get
  • batch.tasks.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Visualizzatore job batch (roles/batch.jobsViewer) nel progetto
  • batch.jobs.get
  • batch.jobs.list
  • batch.locations.get
  • batch.locations.list
  • batch.operations.get
  • batch.operations.list
  • batch.tasks.get
  • batch.tasks.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Utente account di servizio (roles/iam.serviceAccountUser) per l'account di servizio del job
  • iam.serviceAccounts.actAs
  • iam.serviceAccounts.get
  • iam.serviceAccounts.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Ruoli batch per account di servizio Autorizzazioni
Reporter agente batch (roles/batch.agentReporter) sul progetto
  • batch.states.report

Funzionalità corrispondenti

La seguente tabella descrive le funzionalità di Cloud Life Sciences, le funzionalità equivalenti per Batch e i dettagli sulle differenze tra loro.

Ogni caratteristica è rappresentata da una descrizione e dalla sintassi JSON. Puoi utilizzare la sintassi JSON quando accedi a Batch tramite l'API o quando specifichi un file di configurazione JSON tramite Google Cloud CLI. Tuttavia, tieni presente che puoi utilizzare le funzionalità Batch anche tramite altri metodi, ad esempio tramite i campi della console Google Cloud, i flag di gcloud CLI e le librerie client, descritti nella documentazione relativa ai batch.

Per ulteriori informazioni su ogni funzionalità e sulla relativa sintassi JSON, consulta quanto segue:

Funzionalità di Cloud Life Sciences Caratteristiche batch Dettagli
pipeline (pipeline) job (job) e relative attività (taskGroups[])

Un job batch consiste in un array di una o più attività che eseguono tutte gli stessi eseguibili. Una pipeline Cloud Life Sciences è simile a un job batch con una singola attività. Tuttavia, Cloud Life Sciences non ha un concetto equivalente per le attività (job con più), che sono in qualche modo simili alle ripetizioni di una pipeline.

Per maggiori informazioni su job e attività, consulta Panoramica per Batch.

azioni (actions[]) per una pipeline eseguibili (runnables[]) per le attività di un job

Un'azione Cloud Life Sciences descrive un container, ma un batch eseguibile può contenere un container o uno script.

credenziali (credentials) per un'azione

per un container eseguibile:

In Cloud Life Sciences le credenziali di un'azione devono essere un dizionario criptato di Cloud Key Management Service con coppie chiave-valore nome utente e password.

In Batch, il nome utente e la password per un container eseguibile sono in campi separati. Entrambi i campi possono essere specificati con testo normale o con il nome di un secret di Secret Manager.

per un'azione:

per un ambiente:

degli ambienti possibili:

Cloud Life Sciences consente di specificare le variabili di ambiente per un'azione formattata come testo normale o come dizionario criptato. In Batch, è simile ad avere l'ambiente per un elemento eseguibile (campo environment in runnables[]) che include variabili formattate come testo normale (variables) o un dizionario criptato (encryptedVariables).

Tuttavia, Batch offre anche più opzioni per specificare le variabili di ambiente:

  • In alternativa a specificare le variabili come testo normale o dizionario criptato, puoi specificare le variabili utilizzando i secret di Secret Manager mediante una variabile secret (secretVariables).
  • In alternativa a specificare una variabile di ambiente per un elemento eseguibile, puoi specificarne una per tutti gli elementi eseguibili utilizzando il campo environment in taskSpec.
  • In alternativa a specificare una variabile di ambiente che abbia lo stesso valore per ogni attività, puoi specificarne una che abbia un valore diverso per ogni attività utilizzando il campo taskEnvironments[] in taskGroups[].

Per maggiori informazioni, consulta Utilizzare le variabili di ambiente.

etichette per una richiesta per eseguire una pipeline (labels nel corpo della richiesta) etichette per un job (labels nella risorsa job)

A differenza di Cloud Life Sciences, Batch non include un campo etichette nella richiesta per creare un nuovo job. L'opzione più vicina per la modalità Batch è l'utilizzo di etichette associate solo al job.

Batch ha più tipi di etichette (labels campo) che puoi utilizzare durante la creazione di un job. Per maggiori informazioni, consulta Organizzare le risorse utilizzando le etichette.

regioni (regions[]) e zone (zones[]) per le risorse di una pipeline (resources) località consentite (allowedLocations) per il criterio di località delle risorse di un job (locationPolicy)

In Cloud Life Sciences, una pipeline viene eseguita su una singola VM, per la quale puoi specificare le regioni e/o le zone desiderate.

In batch, l'opzione equivalente sono le località consentite per un job, che puoi definire come una o più regioni o zone e che specifica dove è possibile creare le VM per un job. Tutte le VM di un singolo job batch appartengono a un singolo gruppo di istanze gestite che esiste in una determinata regione; tuttavia, le singole VM potrebbero trovarsi in zone diverse di quella regione.

In particolare, specificare il campo delle località consentite per un job è facoltativo perché è separato dalla località del job. A differenza della località del job, la località consentita non influisce su quella utilizzata per creare un job batch e archiviare i metadati del job. Per ulteriori informazioni, consulta la sezione Località in batch.

per le risorse di una pipeline (resources):

per il criterio delle risorse di un job (allocationPolicy):

In Cloud Life Sciences, puoi configurare una (una) VM su cui viene eseguita una pipeline.

In modalità batch, le stesse opzioni per le VM sono disponibili nei campi del criterio di allocazione delle risorse di un job (allocationPolicy):

  • L'account di servizio, le etichette e la configurazione di rete per le VM sono definiti nei campi dedicati.
  • Il campo VM (instances), che puoi definire direttamente o utilizzando un modello di istanza, include le opzioni di configurazione per il tipo di macchina, la piattaforma CPU minima consentita, il disco di avvio ed eventuali altri dischi collegati, nonché eventuali GPU e driver GPU.

per un'azione:

per un modello eseguibile:

Questi vari flag di comodità di Cloud Life Sciences sono equivalenti in modalità batch, tranne per il fatto che sono specificati per ogni eseguibile (che può contenere uno script o un container) anziché per ogni azione (container).

per un'azione:

  • per pubblicare porte esposte (publishExposedPorts)
  • per specificare lo spazio dei nomi dell'ID di processo (PID) (pidNamespace)
  • e possibilità di specificare le mappature delle porte dal container all'host (portMappings)
(options) per un container eseguibile

Queste opzioni di Cloud Life Sciences (e altre) sono supportate in batch tramite il campo delle opzioni (options) per un container eseguibile. Imposta il campo delle opzioni su qualsiasi flag che vuoi che Batch aggiunga al comando docker run, ad esempio -P --pid mynamespace -p 22:22.

per un'azione:

nessun equivalente

Il batch precarica le immagini ed elabora gli output di tutti gli elementi eseguibili in modo identico in base al criterio dei log del job (logsPolicy).

opzione per bloccare le reti esterne (blockExternalNetwork) per un'azione opzione per bloccare le reti esterne (blockExternalNetwork) per un container eseguibile

L'opzione Cloud Life Sciences per bloccare le reti esterne per un'azione è simile all'opzione Batch per bloccare le reti esterne per un container.

Batch ha anche molte altre opzioni di networking, ad esempio il blocco delle reti esterne per tutte le VM di un job. Per maggiori informazioni, consulta la panoramica del networking in batch.

montaggi (mounts[]) per un'azione volumi per tutti gli elementi eseguibili (volumes[] in taskSpec) e opzioni di volume per un container (volumes[] in container)

In modalità batch, puoi utilizzare il campo volumes[] in taskSpec per definire i volumi di un job e i relativi percorsi di montaggio. Il batch monta i volumi di archiviazione nelle VM del job e i volumi di archiviazione sono accessibili a tutti gli elementi eseguibili del job (script o container). Questo montaggio viene eseguito prima che la VM esegua qualsiasi attività o sia eseguibile.

Inoltre, Batch supporta opzioni di volume esplicite sugli elementi eseguibili dei container utilizzando il campo volumes[] in container. Queste opzioni di montaggio vengono passate al container come opzioni per il flag --volume del comando docker run. Ad esempio, il valore [ "/etc:/etc", "/foo:/bar" ] viene tradotto nel comando docker run --volume /etc:/etc --volume /foo:/bar sul container.

Per ulteriori informazioni sull'utilizzo dei volumi di archiviazione con Batch, consulta Creare ed eseguire un job che utilizza volumi di archiviazione.

per abilitare Cloud Storage FUSE (enableFuse) per un'azione nessun equivalente

Batch gestisce il montaggio di qualsiasi volume di archiviazione, ad esempio un bucket Cloud Storage, da te specificato per un job. Di conseguenza, non attivi strumenti di montaggio come Cloud Storage FUSE per Batch. Tuttavia, puoi specificare facoltativamente le opzioni di montaggio per i volumi di archiviazione utilizzando il campo mountOptions[].

Per ulteriori informazioni sull'utilizzo dei bucket Cloud Storage con Batch, consulta Creare ed eseguire un job che utilizza volumi di archiviazione.

Argomento Pub/Sub (pubSubTopic) per una richiesta di esecuzione di una pipeline

per le configurazioni delle notifiche di un job (notifications[]):

Batch consente una maggiore personalizzazione degli aggiornamenti di stato rispetto a Cloud Life Sciences. Ad esempio, gli utenti batch possono ricevere notifiche su un argomento Pub/Sub quando le singole attività cambiano stato o solo quando cambia lo stato del job complessivo.

Servizi per flussi di lavoro

Se utilizzi un servizio di flusso di lavoro con Cloud Life Sciences, il processo di migrazione comporta anche la configurazione di un servizio di flusso di lavoro da utilizzare con Batch. Questa sezione riassume i servizi di flusso di lavoro che puoi usare con Batch.

Batch supporta Workflows, un servizio di flusso di lavoro di Google Cloud. Se vuoi utilizzare Workflows con Workflows, vedi Eseguire un job batch utilizzando Workflows. In caso contrario, la tabella seguente descrive altri servizi per flussi di lavoro che potresti utilizzare per Cloud Life Sciences e che puoi utilizzare anche con Batch. Questa tabella elenca le principali differenze per l'utilizzo di ogni servizio di flusso di lavoro con Batch anziché con Cloud Life Sciences, e dettagli su dove scoprire di più sull'utilizzo di ciascun servizio con Batch.

Servizio flusso di lavoro Differenze principali Dettagli
Cromwell

Per utilizzare invece un file di configurazione Cromwell per l'API Cloud Life Sciences v2beta con l'API Batch, apporta le seguenti modifiche:

  1. Per il campo actor-factory, sostituisci cromwell.backend.google.pipelines.v2beta.PipelinesApiLifecycleActorFactory con cromwell.backend.google.batch.GcpBatchLifecycleActorFactory.
  2. Rimuovi il campo genomics.endpoint-url.
  3. Genera un nuovo file di configurazione.
Per scoprire di più su come utilizzare Batch con Cromwell, consulta la documentazione di Cromwell per Batch e il tutorial di Cromwell per Batch.
D-Sub

Per utilizzare invece un'esecuzione della pipeline dsub per Cloud Life Sciences con Batch, apporta le seguenti modifiche:

  • Per il campo provider, sostituisci google-cls-v2 con google-batch.
Per scoprire di più su come utilizzare Batch con dsub, consulta la documentazione di dsub per Batch.
Nextflow

Per utilizzare invece un file di configurazione Nextflow per Cloud Life Sciences con Batch, apporta le seguenti modifiche:

  1. Per il campo executor, sostituisci google-lifesciences con google-batch.
  2. Per qualsiasi prefisso config, sostituisci google.lifeScience con google.batch.
Per scoprire di più su come utilizzare Batch con Nextflow, consulta un tutorial per batch o un tutorial di Nextflow Per ulteriori informazioni sulle opzioni di configurazione, consulta la documentazione di Nextflow.
Serpente

Per utilizzare invece una pipeline Snakemake per l'API Cloud Life Sciences v2beta con l'API Batch, apporta le seguenti modifiche:

  1. Assicurati di utilizzare Snakemake versione 8 o successiva. Per maggiori informazioni, consulta Migrazione tra le versioni di Snakemake.
  2. Apporta le seguenti modifiche al comando snakemake:

    • Sostituisci il flag --google-lifesciences con quello --executor googlebatch.
    • Sostituisci eventuali flag aggiuntivi con il prefisso --google-lifesciences- per utilizzare il prefisso --googlebatch-.
Per scoprire di più su come utilizzare Batch con Snakemake, consulta la documentazione di Snakemake per Batch.

Passaggi successivi

  • Per configurare Batch per nuovi utenti e progetti, consulta Inizia.
  • Per scoprire come eseguire carichi di lavoro utilizzando Batch, consulta Creare un job.