Esegui la migrazione a Batch da Cloud Life Sciences

Questa pagina descrive come eseguire la migrazione a Batch da Cloud Life Sciences.

Il 17 luglio 2023, Google Cloud ha annunciato che Cloud Life Sciences, che era in versione beta, è stata ritirata. Il servizio non sarà più disponibile su Google Cloud dopo l'8 luglio 2025. Tuttavia, Batch è disponibile al pubblico ed è un successore completo che supporta tutti i casi d'uso per Cloud Life Sciences.

Scopri di più su Batch, Cloud Life Sciences e sulle fasi di lancio del prodotto.

Cloud Life Sciences e Batch

Migrazione da Cloud Life Sciences a batch implica principalmente la comprensione di come utilizzare Batch per i carichi di lavoro attualmente eseguiti eseguendo pipeline di Cloud Life Sciences.

Per capire come puoi eseguire Cloud Life Sciences carichi di lavoro standard su Batch, consulta le sezioni seguenti:

Panoramica

Una pipeline Cloud Life Sciences descrive una sequenza di azioni (container) da eseguire e l'ambiente in cui eseguire i container.

Un job batch descrive un array di una o più attività e il dell'ambiente in cui eseguire queste attività. Il carico di lavoro di un job viene definito come una sequenza di uno o più elementi eseguibili (container e/o script) da eseguire. Ogni attività per un job rappresenta un'esecuzione della relativa sequenza di elementi eseguibili.

Le pipeline di Cloud Life Sciences possono essere espresse come job batch a singola attività.

Ad esempio, i seguenti esempi descrivono una semplice Pipeline Cloud Life Sciences e equivalente Job batch:

Pipeline di Cloud Life Sciences Job batch
  {
    "actions": [
      {
        "imageUri": "bash",
        "commands": [
          "-c",
          "echo Hello, world!"
        ]
      }
    ]
  }
  
    {
      "taskGroups" : [{
        "taskSpec" : {
          "runnables" : [{
            "container":{
              "imageUri": "bash",
              "commands": [
                "-c",
                "echo Hello, world!"
              ]
            }
          }]
        }
      }]
    }
    

I job batch con più attività sono simili alle pipeline di Cloud Life Sciences copiate.

A differenza di Cloud Life Sciences, Batch ti consente di pianificare automaticamente più esecuzioni del tuo carico di lavoro. Indica il numero di volte in cui vuoi eseguire la sequenza di entità eseguibili per un job definendo il numero di attività. Quando un job ha più attività, specifichi in che modo ogni esecuzione deve variare fare riferimento all'indice dell'attività nei eseguibili. Inoltre, puoi configurare le pianificazioni relative alle attività di un job, ad esempio se consentire l'esecuzione in parallelo di più attività o richiederle essere eseguiti in ordine sequenziale e uno alla volta. Batch gestisce la pianificazione delle attività del job: quando un'attività termina, il job avvia automaticamente l'attività successiva, se esistente.

Ad esempio, consulta il seguente job batch. Questo esempio include 100 attività eseguite su 10 Compute Engine virtuali di macchine (VM), quindi ci sono circa 10 attività in esecuzione in parallelo in qualsiasi momento. Ogni attività in questo job di esempio esegue un solo eseguibile: uno script che stampa un messaggio e l'indice dell'attività, definito dalla variabile di ambiente predefinita BATCH_TASK_INDEX.

{
  "taskGroups" : [{
    "taskSpec" : {
      "runnables" : [{
        "script":{
          "text": "echo Hello world! This is task ${BATCH_TASK_INDEX}."
        }
      }]
    },
    "taskCount": 100,
    "parallelism": 10
  }]
}

Workflows che prevedono la creazione e il monitoraggio di più Le pipeline di Cloud Life Sciences a volte possono essere semplificate prendendo la pianificazione integrata di Batch.

Operazioni di base

Questa sezione descrive le operazioni di base in Cloud Life Sciences e Batch.

La tabella seguente riassume le opzioni di operazioni di base per Cloud Life Sciences e Batch.

Funzionamento di base Opzioni di Cloud Life Sciences Opzioni batch
Esegui un carico di lavoro.
  • Esegui una pipeline.
  • Crea ed esegui un job.
Visualizza tutti i tuoi carichi di lavoro.
  • Elenca le operazioni a lunga esecuzione.
  • Visualizzare un elenco dei tuoi job.
Visualizza i dettagli e lo stato di un carico di lavoro.
  • Visualizza i dettagli di un'operazione a lunga esecuzione.
  • Esegui il polling di un'operazione a lunga esecuzione.
  • Visualizza i dettagli di un job.
  • Visualizza un elenco delle attività di un job.
  • Visualizzare i dettagli di un'attività.
Arresta e rimuovi un carico di lavoro.
  • Annullare un'operazione a lunga esecuzione.
  • Eliminare (e annullare) un job.
  • Controlla lo stato di una richiesta di eliminazione di un job.

Le operazioni di base per Cloud Life Sciences e Batch hanno alcune differenze chiave.

In primo luogo, le risorse per le operazione a lunga esecuzione non svolgono lo stesso ruolo Batch che fanno in Cloud Life Sciences. Le risorse per le operazioni a lungo termine (LRO) in Cloud Life Sciences sono la risorsa principale utilizzata per elencare e visualizzare le pipeline. Ma risorse per operazioni a lunga esecuzione in Batch e in altre API Google Cloud vengono utilizzati solo per monitorare lo stato di una richiesta che richiede molto tempo completato. Nello specifico, in Batch l'unica richiesta che restituisce una risorsa di operazione a lungo termine è l'eliminazione di un job. Per ulteriori informazioni sulle risorse di operazioni a lungo termine per Batch, consulta la documentazione di riferimento dell'API Batch per la risorsa REST projects.locations.operations. Invece di utilizzare risorse operazione a lunga esecuzione, delle risorse dei job che visualizzi ed elimini per i carichi di lavoro.

In secondo luogo, la visualizzazione dei dettagli di un carico di lavoro in Batch comporta operazioni diverse rispetto a Cloud Life Sciences. Puoi visualizzare un job per sia i dettagli che lo stato. Tuttavia, ogni attività di un job ha anche i propri dettagli e il proprio stato, che puoi visualizzare consultando un elenco delle attività di un job e i dettagli di un'attività.

Per aiutarti a comprendere meglio le operazioni di base per Confronto tra Cloud Life Sciences e Batch, i seguenti forniscono esempi di comandi Google Cloud CLI e richieste API per alcune di queste operazioni di base.

Esempi di comandi della gcloud CLI

Per gcloud CLI, i comandi Cloud Life Sciences inizino con gcloud beta lifesciences e i comandi Batch inizino con gcloud batch. Ad esempio, vedi i seguenti comandi della gcloud CLI.

  • Esempi di comandi della gcloud CLI di Cloud Life Sciences:

    • Esegui una pipeline:

      gcloud beta lifesciences pipelines run \
        --project=PROJECT_ID \
        --regions=LOCATION \
        --pipeline-file=JSON_CONFIGURATION_FILE
      
    • Per visualizzare i dettagli di un'operazione a lunga esecuzione:

      gcloud beta lifesciences operations describe OPERATION_ID
      

    Sostituisci quanto segue:

    • PROJECT_ID: il ID progetto del tuo progetto.
    • LOCATION: la località una pipeline o un blocco note personalizzato.
    • JSON_CONFIGURATION_FILE: la configurazione JSON per la pipeline.
    • OPERATION_ID: l'identificatore del a operazione a lunga esecuzione, restituita dalla richiesta di eseguire una pipeline o un blocco note personalizzato.
  • Esempi di comandi batch dell'interfaccia alla gcloud CLI:

    • Crea ed esegui un job:

      gcloud batch jobs submit JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION \
        --config=JSON_CONFIGURATION_FILE
      
    • Visualizza i dettagli di un job:

      gcloud batch jobs describe JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION \
      
    • Visualizza l'elenco delle attività di un lavoro:

      ​​gcloud batch tasks list \
        --project=PROJECT_ID \
        --location=LOCATION \
        --job=JOB_NAME
      
    • Visualizza i dettagli di un'attività:

      gcloud batch tasks describe TASK_INDEX \
        --project=PROJECT_ID \
        --location=LOCATION \
        --job=JOB_NAME \
        --task_group=TASK_GROUP
      
    • Elimina (e annulla) un job:

      gcloud batch jobs delete JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION
      

    Sostituisci quanto segue:

    • JOB_NAME: il nome del job.
    • PROJECT_ID: il ID progetto del tuo progetto.
    • LOCATION: la località del lavoro.
    • JSON_CONFIGURATION_FILE: il percorso di un file JSON con i dettagli di configurazione del job.
    • TASK_INDEX: l'indice dell'attività che vuoi visualizzare i dettagli. In un gruppo di attività, l'indice delle attività inizia da 0 per la prima dell'attività e aumenta di 1 a ogni attività aggiuntiva. Ad esempio, un'attività gruppo che contiene quattro attività ha gli indici 0, 1, 2 e 3.
    • TASK_GROUP_NAME: il nome del gruppo di attività di cui vuoi visualizzare i dettagli. Il valore deve essere impostato su group0

Esempi di percorsi di richiesta dell'API

Per le API, Cloud Life Sciences utilizza i percorsi di richiestalifesciences.googleapis.com e Batch utilizza i percorsi di richiestabatch.googleapis.com. Ad esempio, consulta i seguenti percorsi di richiesta API. Non mi piace Cloud Life Sciences, Batch non ha un'API RPC, ha solo un'API REST.

  • Esempi di percorsi di richiesta dell'API Cloud Life Sciences:

    • Esegui una pipeline:

      POST https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/pipelines:run
      
    • Per visualizzare i dettagli di un'operazione a lunga esecuzione:

      GET https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
      

    Sostituisci quanto segue:

    • PROJECT_ID: il ID progetto del tuo progetto.
    • LOCATION: la località una pipeline o un blocco note personalizzato.
    • OPERATION_ID: l'identificatore dell'operazione a lunga esecuzione restituito dalla richiesta di esecuzione della pipeline.
  • Esempi di percorsi di richiesta API:

    • Crea ed esegui un job:

      POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
      
    • Visualizza i dettagli di un job:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
      
    • Visualizza l'elenco delle attività di un lavoro:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME/taskGroups/TASK_GROUP/tasks
      
    • Elimina un job

      DELETE https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
      
    • Controlla lo stato della richiesta di eliminazione del job:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
      

    Sostituisci quanto segue:

    • PROJECT_ID: il ID progetto del tuo progetto.
    • LOCATION: la località del lavoro.
    • JOB_NAME: il nome del job.
    • TASK_GROUP_NAME: il nome del gruppo di attività che di cui vuoi visualizzare i dettagli. Il valore deve essere impostato su group0
    • OPERATION_ID: l'identificatore del a operazione a lunga esecuzione, restituita dalla richiesta di eliminazione lavoro.

Ruoli e autorizzazioni IAM

Questa sezione riassume le differenze in Identity and Access Management ruoli e autorizzazioni per Cloud Life Sciences Batch. Per ulteriori informazioni su eventuali ruoli e sulle relative autorizzazioni, consulta il riferimento ai ruoli di base e predefiniti di IAM.

La tabella seguente descrive i ruoli predefiniti e le relative autorizzazioni obbligatorie per gli utenti di Cloud Life Sciences.

Ruoli Cloud Life Sciences Autorizzazioni

Uno dei seguenti:

  • Amministratore Cloud Life Sciences (roles/lifesciences.admin) del progetto
  • Editor Cloud Life Sciences (roles/lifesciences.editor) nel progetto
  • Cloud Life Sciences Workflows Runner (roles/lifesciences.workflowsRunner) nel progetto
  • lifesciences.workflows.run
  • lifesciences.operations.cancel
  • lifesciences.operations.get
  • lifesciences.operations.list
Visualizzatore Cloud Life Sciences (roles/lifesciences.viewer) del progetto
  • lifesciences.operations.get
  • lifesciences.operations.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list

La tabella seguente descrive alcuni dei ruoli predefiniti e le relative autorizzazioni per Batch. A differenza di Cloud Life Sciences, Batch richiede di concedere autorizzazioni agli utenti e all'account di servizio per un job. Per ulteriori informazioni sui requisiti IAM, consulta Prerequisiti per Batch.

Ruoli batch per gli utenti Autorizzazioni
Batch Job Editor (roles/batch.jobsEditor) nel progetto
  • batch.jobs.create
  • batch.jobs.delete
  • batch.jobs.get
  • batch.jobs.list
  • batch.locations.get
  • batch.locations.list
  • batch.operations.get
  • batch.operations.list
  • batch.tasks.get
  • batch.tasks.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Batch Job Viewer (roles/batch.jobsViewer) nel progetto
  • batch.jobs.get
  • batch.jobs.list
  • batch.locations.get
  • batch.locations.list
  • batch.operations.get
  • batch.operations.list
  • batch.tasks.get
  • batch.tasks.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Utente account di servizio (roles/iam.serviceAccountUser) per l'account di servizio del job
  • iam.serviceAccounts.actAs
  • iam.serviceAccounts.get
  • iam.serviceAccounts.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Ruoli batch per account di servizio Autorizzazioni
Reporter agente batch (roles/batch.agentReporter) sul progetto
  • batch.states.report

Caratteristiche corrispondenti

La tabella seguente descrive le funzionalità per Cloud Life Sciences, le funzionalità equivalenti per Batch, oltre ai dettagli sulle differenze.

Ogni caratteristica è rappresentata da una descrizione e dalla sintassi JSON. Puoi utilizzare la sintassi JSON per accedere Batch tramite l'API o quando si specifica una configurazione JSON tramite Google Cloud CLI. Tuttavia, tieni presente che puoi utilizzare le funzionalità di Batch anche tramite altri metodi, ad esempio tramite i campi della console Google Cloud, i flag dell'interfaccia a riga di comando gcloud e le librerie client, descritti nella documentazione di Batch.

Per ulteriori informazioni su ogni funzionalità e sulla relativa sintassi JSON, consulta quanto segue:

Funzionalità di Cloud Life Sciences Funzionalità batch Dettagli
pipeline (pipeline) job (job) e relative attività (taskGroups[])

Un job batch è costituito da un array di una o più attività che eseguono tutte le stesse eseguibili. Una pipeline Cloud Life Sciences è simile a un job Batch con un'attività. Tuttavia, Cloud Life Sciences non ha un concetto equivalente per le attività (offerte di lavoro con più), che sono un po' come le ripetizioni di una pipeline.

Per ulteriori informazioni su job e attività, vedi Panoramica per Batch.

azioni (actions[]) per una pipeline eseguibili (runnables[]) per le attività di un job

Un'azione Cloud Life Sciences descrive un container, ma un elemento eseguibile Batch può contenere un container o uno script.

credentials (credentials) per un'azione

per un container eseguibile:

In Cloud Life Sciences le credenziali di un'azione devono essere In un Cloud Key Management Service criptato un dizionario con coppie chiave-valore di nome utente e password.

In Batch, il nome utente e la password per un contenitore eseguibile sono in campi separati. Entrambi i campi possono essere specificati in testo normale o con il nome di un Secret di Secret Manager.

per un'azione:

per un ambiente:

possibili ambienti:

Cloud Life Sciences ti consente di specificare le variabili di ambiente per un'azione formattata come testo normale o come dizionario criptato. In Batch, è un po' come avere un ambiente per un elemento eseguibile (campo environment in runnables[]) includi variabili formattate come testo normale (variables) o dizionario criptato (encryptedVariables).

Ma Batch ha anche più opzioni per specificare variabili di ambiente:

  • In alternativa alla specifica di variabili come testo normale o un dizionario criptato, puoi specificare le variabili utilizzando Secret Manager utilizzando una variabile secret (secretVariables).
  • In alternativa a specificare una variabile di ambiente per un file eseguibile, puoi specificare una variabile di ambiente per tutti i file eseguibili utilizzando il campo environment in taskSpec.
  • In alternativa alla specifica di una variabile di ambiente che abbia stesso valore per ogni attività, puoi specificare una variabile di ambiente ha un valore diverso per ogni attività utilizzando il metodo campo taskEnvironments[] in taskGroups[].

Per ulteriori informazioni, consulta Utilizzare le variabili di ambiente.

etichette per una richiesta per eseguire una pipeline (labels nel corpo della richiesta) etichette per un job (labels nella risorsa job)

A differenza di Cloud Life Sciences, Batch non include un campo delle etichette nella richiesta per creare un nuovo job. L'opzione più simile per Batch è utilizzare etichette associate solo al job.

Il batch ha più tipi di etichette (campi labels) che puoi utilizzare per creare un job. Per ulteriori informazioni, consulta Organizzare le risorse utilizzando le etichette.

regioni (regions[]) e zone (zones[]) per le risorse (resources) di una pipeline località consentite (allowedLocations) per il criterio di posizione della risorsa (locationPolicy) di un job

In Cloud Life Sciences, una pipeline viene eseguita su una singola VM, per la quale puoi specificare le regioni e/o le zone desiderate.

In batch, l'opzione equivalente sono le località consentite per un job, che puoi definire come una o più regioni o zone e specifica dove è possibile creare le VM per un job. Tutte le VM di un singolo job batch appartengono a un solo gruppo di istanze gestite, esistente in una particolare regione; ma le singole VM potrebbero trovarsi in zone diverse della regione.

In particolare, specificare il campo delle località consentite per un job è facoltativo perché è separato dalla posizione del lavoro. A differenza della posizione del lavoro, la posizione consentita non influisce sulla località utilizzata per creare un Job batch e archiviazione dei metadati del job. Per ulteriori informazioni, consulta Località dei batch.

per le risorse di una pipeline (resources):

per il criterio delle risorse di un job (allocationPolicy):

In Cloud Life Sciences, puoi configurare la (una) VM che su cui viene eseguita la pipeline.

In Batch, le stesse opzioni per le VM sono disponibili nei campi del criterio di allocazione delle risorse di un job (allocationPolicy):

  • L'account di servizio, le etichette e la configurazione di rete per le VM definiti nei campi dedicati.
  • Il campo VM (instances), che puoi definire direttamente o utilizzando un modello di istanza, include le opzioni di configurazione per tipo di macchina, piattaforma CPU minima consentita, disco di avvio eventuali altri dischi collegati, GPU e driver GPU.

per un'azione:

per un elemento eseguibile:

Questi vari flag di convenienza di Cloud Life Sciences sono equivalenti in batch tranne per il fatto che sono specificati per ogni (che può contenere uno script o un container) anziché ogni azione (contenitore).

per un'azione:

  • Opzione per pubblicare le porte esposte (publishExposedPorts)
  • per specificare lo spazio dei nomi dell'ID di processo (PID) (pidNamespace)
  • e possibilità di specificare le mappature delle porte dal container all'host (portMappings)
(options) per un container eseguibile

Queste opzioni (e altre) di Cloud Life Sciences sono supportate in Batch tramite il campo opzioni (options) per un contenitore eseguibile. Imposta il campo delle opzioni su qualsiasi flag vuoi che Batch aggiunga al comando docker run, per esempio, -P --pid mynamespace -p 22:22.

per un'azione:

Nessun equivalente

Batch esegue il pre-caricamento delle immagini ed elabora gli output di tutti gli elementi eseguibili in modo identico in conformità con le norme relative ai log del job (logsPolicy).

Opzione per bloccare le reti esterne (blockExternalNetwork) per un'azione opzione per bloccare le reti esterne (blockExternalNetwork) per un container eseguibile

L'opzione Cloud Life Sciences per bloccare le reti esterne per un è simile all'opzione Batch per bloccare reti per un container.

Batch offre anche molte altre opzioni di rete, ad esempio la possibilità di bloccare le reti esterne per tutte le VM di un job. Per ulteriori informazioni, consulta la panoramica del networking in batch.

montaggi (mounts[]) per un'azione volumi per tutti i file eseguibili (volumes[] in taskSpec) e opzioni di volume per un container (volumes[] in container)

In Batch, puoi utilizzare Campo volumes[] in taskSpec per definire i volumi di un job e i relativi percorsi di montaggio. Batch monta i volumi di archiviazione sulle VM del job e i volumi di archiviazione sono accessibili a tutti gli eseguibili (script o container) del job. Il montaggio avviene prima che la VM esegue attività o elementi eseguibili.

Inoltre, Batch supporta opzioni di volume esplicite sui file eseguibili del contenitore utilizzando il campo volumes[] in container. Queste opzioni di montaggio vengono passate al contenitore come opzioni per il flag --volume del comando docker run. Ad esempio, il valore [ "/etc:/etc", "/foo:/bar" ] viene tradotto nel comando docker run --volume /etc:/etc --volume /foo:/bar sul contenitore.

Per ulteriori informazioni sull'utilizzo dei volumi di archiviazione con Batch, vedi Creare ed eseguire un job che utilizza volumi di archiviazione.

opzione per attivare Cloud Storage FUSE (enableFuse) per un'azione Nessun equivalente

Batch gestisce il montaggio di eventuali volumi di archiviazione, come un bucket Cloud Storage, specificati per un job. Di conseguenza, non attivi strumenti di montaggio come Cloud Storage FUSE. per Batch; ma puoi anche specificare di montaggio per i volumi di archiviazione, Campo mountOptions[]:

Per ulteriori informazioni sull'utilizzo dei bucket Cloud Storage con Batch, consulta Creare ed eseguire un job che utilizza volumi di archiviazione.

Argomento Pub/Sub (pubSubTopic) per una richiesta di esecuzione di una pipeline

per le configurazioni delle notifiche di un job (notifications[]):

La modalità batch consente una maggiore personalizzazione degli aggiornamenti di stato Cloud Life Sciences. Ad esempio, gli utenti in batch ricevere notifiche su un argomento Pub/Sub quando le singole attività cambiano stato o solo quando cambia stato il job complessivo.

Servizi per flussi di lavoro

Se utilizzi un servizio di flusso di lavoro con Cloud Life Sciences, la procedura di migrazione prevede anche la configurazione di un servizio di flusso di lavoro per il funzionamento con Batch. Questa sezione riassume i servizi di flusso di lavoro che puoi utilizzare con Batch.

Batch supporta Workflows, un servizio di flusso di lavoro di Google Cloud. Se vuoi utilizzare Workflows con Batch, consulta Eseguire un job Batch utilizzando Workflows. In caso contrario, la tabella seguente descrive altri servizi di flusso di lavoro che potresti utilizzare per Cloud Life Sciences e anche con Batch. Questa tabella elenca le differenze principali per l'utilizzo di ciascun servizio di flusso di lavoro con Batch anziché con Cloud Life Sciences e i dettagli su dove scoprire di più sull'utilizzo di ciascun servizio con Batch.

Servizio Workflow Differenze principali Dettagli
Cromwell

Per utilizzare un file di configurazione Cromwell per API Cloud Life Sciences v2beta con l'API Batch apporta le seguenti modifiche:

  1. Per il campo actor-factory, sostituisci cromwell.backend.google.pipelines.v2beta.PipelinesApiLifecycleActorFactory con cromwell.backend.google.batch.GcpBatchLifecycleActorFactory.
  2. Rimuovi il campo genomics.endpoint-url.
  3. Genera un nuovo file di configurazione.
Per ulteriori informazioni su come utilizzare Batch con Cromwell, consulta Documentazione di Croomwell per Batch e Cromwell tutorial per Batch.
dsub

Per utilizzare un'esecuzione della pipeline dsub per Cloud Life Sciences con Batch, apporta le seguenti modifiche:

  • Per il campo provider, sostituisci google-cls-v2 con google-batch.
Per scoprire di più su come utilizzare Batch con dsub, vedi il documentazione dsub per Batch.
Nextflow

Per utilizzare un file di configurazione Nextflow per Cloud Life Sciences con Batch, apporta le seguenti modifiche:

  1. Per il campo executor, sostituisci google-lifesciences con google-batch.
  2. Per qualsiasi prefisso config, sostituisci google.lifeScience con google.batch.
Per scoprire di più su come utilizzare Batch con Nextflow, consulta un Tutorial batch oppure Tutorial di Nextflow Per ulteriori informazioni sulle opzioni di configurazione, consulta Documentazione di Nextflow.
Snakemake

Per utilizzare una pipeline Snakemake per l'API Cloud Life Sciences v2beta con l'API Batch, apporta le seguenti modifiche:

  1. Assicurati di utilizzare Snakemake versione 8 o successiva. Per ulteriori informazioni, consulta la pagina Eseguire la migrazione tra le versioni di Snakemake.
  2. Apporta le seguenti modifiche al comando snakemake:

    • Sostituisci il flag --google-lifesciences con Flag --executor googlebatch.
    • Sostituisci eventuali flag aggiuntivi con il prefisso --google-lifesciences- in modo da utilizzare il prefisso --googlebatch-.
Per scoprire di più su come utilizzare Batch con Snakemake, vedi il Documentazione di Snakemake per Batch.

Passaggi successivi

  • Per configurare Batch per nuovi utenti e progetti, consulta Inizia.
  • Per scoprire come eseguire carichi di lavoro utilizzando Batch, consulta Crea un job.