Von Cloud Life Sciences zu Batch migrieren

Auf dieser Seite wird beschrieben, wie Sie von Cloud Life Sciences.

Am 17. Juli 2023 gab Google Cloud bekannt, dass Cloud Life Sciences, die sich bisher noch in der Betaphase befand. Der Dienst ist nach dem 8. Juli 2025 nicht mehr in Google Cloud verfügbar. Batch ist jedoch allgemein verfügbar und ein umfassender Nachfolger, der alle Anwendungsfälle für Cloud Life Sciences.

Weitere Informationen zu Batch Cloud Life Sciences und Produkteinführung Phasen.

Cloud Life Sciences im Vergleich zu Batch

Von Cloud Life Sciences zu Batch migrieren geht es in erster Linie darum, zu verstehen, wie Sie Batch für die Arbeitslasten, die Sie derzeit mit dem Cloud Life Sciences-Pipelines

In den folgenden Abschnitten erfahren Sie, wie Sie Ihre Cloud Life Sciences-Arbeitslasten in Batch ausführen:

Übersicht

Eine Pipeline von Cloud Life Sciences beschreibt eine Abfolge von Aktionen (Containern), die ausgeführt werden sollen, und die Umgebung, in der die Container ausgeführt werden sollen.

Ein Batchjob beschreibt ein Array aus einer oder mehreren Aufgaben und die Umgebung, in der diese Aufgaben ausgeführt werden. Sie definieren die Arbeitslast für einen Job Sequenz eines oder mehrerer auszuführender Runnables (Container und/oder Skripts) Jede Aufgabe für einen Job steht für eine Ausführung der zugehörigen Sequenz von Runnables.

Cloud Life Sciences-Pipelines können als Batchjobs mit einer einzelnen Aufgabe angegeben werden.

In den folgenden Beispielen wird z. B. eine einfache Cloud Life Sciences-Pipeline und ihr Äquivalent Batch job:

Cloud Life Sciences-Pipeline Batchjob
  {
    "actions": [
      {
        "imageUri": "bash",
        "commands": [
          "-c",
          "echo Hello, world!"
        ]
      }
    ]
  }
  
    {
      "taskGroups" : [{
        "taskSpec" : {
          "runnables" : [{
            "container":{
              "imageUri": "bash",
              "commands": [
                "-c",
                "echo Hello, world!"
              ]
            }
          }]
        }
      }]
    }
    

Batchjobs mit mehreren Aufgaben ähneln kopierten Cloud Life Sciences-Pipelines.

Im Gegensatz zu Cloud Life Sciences können Sie mit Batch mehrere Ausführungen Ihrer Arbeitslast automatisch planen. Sie geben an, wie oft die Abfolge der ausführbaren Elemente für einen Job ausgeführt werden soll, indem Sie die Anzahl der Aufgaben definieren. Wenn ein Job mehrere Aufgaben ausführen, legen Sie fest, wie die einzelnen Ausführungen in Ihren Runnables auf den Aufgabenindex verweisen. Außerdem können Sie die relativen Zeitpläne für die Aufgaben eines Jobs konfigurieren, z. B. ob mehrere Aufgaben parallel ausgeführt werden dürfen oder ob Aufgaben nacheinander und einzeln ausgeführt werden müssen. Batch verwaltet die Planung der Aufgaben des Jobs: Nach Abschluss einer Aufgabe startet der Job automatisch die nächste Aufgabe (falls vorhanden).

Sehen Sie sich beispielsweise den folgenden Batchjob an. Dieser Beispieljob umfasst 100 Aufgaben, die auf 10 Compute Engine-VM-Instanzen ausgeführt werden. Es werden also immer etwa 10 Aufgaben parallel ausgeführt. Jede Aufgabe in diesem Beispieljob führt nur ein Runnable aus: ein Skript, das eine Nachricht und den Index der Aufgabe ausgibt, der vom Vordefinierte Umgebungsvariable BATCH_TASK_INDEX.

{
  "taskGroups" : [{
    "taskSpec" : {
      "runnables" : [{
        "script":{
          "text": "echo Hello world! This is task ${BATCH_TASK_INDEX}."
        }
      }]
    },
    "taskCount": 100,
    "parallelism": 10
  }]
}

Workflows, bei denen mehrere ähnliche Cloud Life Sciences-Pipelines können manchmal vereinfacht werden, indem der integrierten Zeitplanung von Batch.

Grundlegende Vorgänge

In diesem Abschnitt werden die grundlegenden Vorgänge in Cloud Life Sciences im Vergleich zu Batch.

In der folgenden Tabelle sind die grundlegenden Vorgangsoptionen für Cloud Life Sciences und Batch.

Grundlegender Vorgang Cloud Life Sciences-Optionen Batch-Optionen
Arbeitslast ausführen.
  • Führen Sie eine Pipeline aus.
  • Erstellen Sie einen Job und führen Sie ihn aus.
Sehen Sie sich alle Ihre Arbeitslasten an.
  • Lange laufende Vorgänge auflisten.
  • Liste Ihrer Jobs aufrufen
Details und Status einer Arbeitslast aufrufen
  • Details zu einem lang andauernden Vorgang abrufen
  • Einen lang andauernden Vorgang abfragen
  • Rufen Sie die Details eines Jobs auf.
  • Sehen Sie sich eine Liste der Aufgaben eines Auftrags an.
  • Sehen Sie sich die Details einer Aufgabe an.
Beenden und entfernen Sie eine Arbeitslast.
  • Lange laufenden Vorgang abbrechen.
  • Jobs löschen (und abbrechen)
  • Prüfen Sie den Status einer Anfrage zum Löschen eines Jobs.

Grundlegende Vorgänge für Cloud Life Sciences und Batch gibt es einige wichtige Unterschiede.

Erstens: Ressourcen für langlaufende Vorgänge spielen in Batch keine Rolle wie in Cloud Life Sciences. Ressourcen mit langer Ausführungszeit in Cloud Life Sciences sind die primäre Ressource, die zum Auflisten und Aufrufen Ihrer Pipelines verwendet wird. Aber Ressourcen mit langer Ausführungszeit in Batch und anderen Google Cloud APIs werden nur verwendet, um den Status einer Anfrage zu überwachen, deren Verarbeitung lange dauert. abgeschlossen ist. Die einzige Anfrage, die in Batch gibt eine Vorgangsressource mit langer Ausführungszeit zurück, das Löschen eines Jobs. Weitere Informationen zu Ressourcen für langlaufende Vorgänge für Batch finden Sie in der Referenzdokumentation der Batch API für die REST-Ressource projects.locations.operations. Anstatt Ressourcen für lang laufende Vorgänge zu verwenden, gibt es in Batch Jobressourcen, die Sie für Ihre Arbeitslasten aufrufen und löschen können.

Wenn Sie sich die Details einer Arbeitslast in Batch ansehen, anderen Abläufen als Cloud Life Sciences. Sie können sich einen Job ansehen, um sowohl die Details als auch den Status zu sehen. Jede Aufgabe eines Jobs hat jedoch auch eigene Details und einen eigenen Status. Sie können sich diese in einer Liste der Aufgaben eines Jobs und in den Details einer Aufgabe ansehen.

Damit Sie die grundlegenden Vorgänge für Cloud Life Sciences und Batch besser verstehen, finden Sie in den folgenden Abschnitten Beispiele für Google Cloud CLI-Befehle und API-Anfragepfade für einige dieser grundlegenden Vorgänge.

Beispiele für gcloud-Befehle

Für die gcloud CLI und Cloud Life Sciences-Befehle mit gcloud beta lifesciences- und Batch-Befehlen beginnen mit gcloud batch beginnen. Sehen Sie sich beispielsweise die folgenden gcloud CLI-Befehle an.

  • gcloud CLI-Beispielbefehle für Cloud Life Sciences:

    • So führen Sie eine Pipeline aus:

      gcloud beta lifesciences pipelines run \
        --project=PROJECT_ID \
        --regions=LOCATION \
        --pipeline-file=JSON_CONFIGURATION_FILE
      
    • So rufen Sie Details zu einem lang andauernden Vorgang ab:

      gcloud beta lifesciences operations describe OPERATION_ID
      

    Ersetzen Sie Folgendes:

    • PROJECT_ID: die Projekt-ID Ihres Projekts.
    • LOCATION: der Standort für den zu erstellen.
    • JSON_CONFIGURATION_FILE: die JSON-Konfiguration für die Pipeline.
    • OPERATION_ID: die Kennung für den lang andauernden Vorgang, der von der Anfrage zurückgegeben wurde, zu erstellen.
  • Beispiele für gcloud-Befehlszeilenbefehle für Batches:

    • So erstellen und führen Sie einen Job aus:

      gcloud batch jobs submit JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION \
        --config=JSON_CONFIGURATION_FILE
      
    • So rufen Sie die Details eines Jobs auf:

      gcloud batch jobs describe JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION \
      
    • So rufen Sie die Aufgabenliste eines Jobs auf:

      ​​gcloud batch tasks list \
        --project=PROJECT_ID \
        --location=LOCATION \
        --job=JOB_NAME
      
    • So rufen Sie die Details einer Aufgabe auf:

      gcloud batch tasks describe TASK_INDEX \
        --project=PROJECT_ID \
        --location=LOCATION \
        --job=JOB_NAME \
        --task_group=TASK_GROUP
      
    • Jobs löschen (und abbrechen):

      gcloud batch jobs delete JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION
      

    Ersetzen Sie Folgendes:

    • JOB_NAME: der Name des Jobs.
    • PROJECT_ID: die Projekt-ID Ihres Projekts.
    • LOCATION: den Standort der Stelle.
    • JSON_CONFIGURATION_FILE: der Pfad zu einer JSON-Datei mit den Konfigurationsdetails des Jobs.
    • TASK_INDEX: Der Index der Aufgabe, deren Details Sie aufrufen möchten. In einer Aufgabengruppe beginnt der Aufgabenindex für die erste und erhöht sich bei jeder weiteren Aufgabe um 1. Eine Aufgabengruppe mit vier Aufgaben hat beispielsweise die Indizes 0, 1, 2 und 3.
    • TASK_GROUP_NAME: der Name der Aufgabengruppe, die die Sie aufrufen möchten. Der Wert muss auf group0

Beispiele für API-Anfragepfade

Für APIs verwendet Cloud Life Sciences lifesciences.googleapis.com-Anfragepfade und Batch-Verwendungen batch.googleapis.com-Anfragepfade. Sehen Sie sich beispielsweise die folgenden API-Anfragepfade an. Im Gegensatz zu Cloud Life Sciences bietet Batch keine RPC API, sondern nur eine REST API.

  • Cloud Life Sciences-Beispiel-API-Anfragepfade:

    • Führen Sie eine Pipeline aus:

      POST https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/pipelines:run
      
    • So rufen Sie Details zu einem lang andauernden Vorgang ab:

      GET https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
      

    Ersetzen Sie Folgendes:

    • PROJECT_ID: die Projekt-ID Ihres Projekts.
    • LOCATION: Der Speicherort der Pipeline.
    • OPERATION_ID: Die Kennzeichnung für den lang andauernden Vorgang, die von der Anfrage zum Ausführen der Pipeline zurückgegeben wurde.
  • Beispiele für API-Anfragepfade im Batch:

    • So erstellen und führen Sie einen Job aus:

      POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
      
    • So rufen Sie die Details eines Jobs auf:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
      
    • So rufen Sie die Aufgabenliste eines Jobs auf:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME/taskGroups/TASK_GROUP/tasks
      
    • Job löschen

      DELETE https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
      
    • Prüfen Sie den Status der Anfrage zum Löschen des Jobs:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
      

    Ersetzen Sie Folgendes:

    • PROJECT_ID: die Projekt-ID Ihres Projekts.
    • LOCATION: der Standort des Jobs.
    • JOB_NAME: der Name des Jobs.
    • TASK_GROUP_NAME: der Name der Aufgabengruppe, deren Details Sie aufrufen möchten. Der Wert muss auf group0
    • OPERATION_ID: Die Kennzeichnung für den lang andauernden Vorgang, die von der Anfrage zum Löschen des Jobs zurückgegeben wurde.

IAM-Rollen und -Berechtigungen

In diesem Abschnitt werden die Unterschiede bei den Rollen und Berechtigungen der Identitäts- und Zugriffsverwaltung für Cloud Life Sciences und Batch zusammengefasst. Weitere Informationen zu Rollen und ihren Berechtigungen finden Sie in der Referenz zu einfachen und vordefinierten IAM-Rollen.

In der folgenden Tabelle werden die vordefinierten Rollen und ihre Berechtigungen beschrieben, die für Nutzer von Cloud Life Sciences erforderlich sind.

Cloud Life Sciences-Rollen Berechtigungen

Eine der folgenden:

  • Cloud Life Sciences-Administrator (roles/lifesciences.admin) für das Projekt
  • Cloud Life Sciences-Bearbeiter (roles/lifesciences.editor) für das Projekt
  • Cloud Life Sciences-Workflows-Ausführer (roles/lifesciences.workflowsRunner) für das Projekt
  • lifesciences.workflows.run
  • lifesciences.operations.cancel
  • lifesciences.operations.get
  • lifesciences.operations.list
Cloud Life Sciences-Betrachter (roles/lifesciences.viewer) für das Projekt
  • lifesciences.operations.get
  • lifesciences.operations.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list

In der folgenden Tabelle werden einige der vordefinierten Rollen und ihre Berechtigungen für Batch beschrieben. Im Gegensatz zu Cloud Life Sciences müssen Sie in Batch Nutzern und dem Dienstkonto Berechtigungen für einen Job erteilen. Weitere Informationen zu den IAM-Anforderungen finden Sie unter Voraussetzungen für Batch.

Batchrollen für Nutzer Berechtigungen
Batch-Job-Bearbeiter (roles/batch.jobsEditor) für das Projekt
  • batch.jobs.create
  • batch.jobs.delete
  • batch.jobs.get
  • batch.jobs.list
  • batch.locations.get
  • batch.locations.list
  • batch.operations.get
  • batch.operations.list
  • batch.tasks.get
  • batch.tasks.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Batchjob-Betrachter (roles/batch.jobsViewer) für das Projekt
  • batch.jobs.get
  • batch.jobs.list
  • batch.locations.get
  • batch.locations.list
  • batch.operations.get
  • batch.operations.list
  • batch.tasks.get
  • batch.tasks.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Dienstkontonutzer (roles/iam.serviceAccountUser) für das Dienstkonto des Jobs
  • iam.serviceAccounts.actAs
  • iam.serviceAccounts.get
  • iam.serviceAccounts.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Batchrollen für Dienstkonten Berechtigungen
Batch-Agent-Melder (roles/batch.agentReporter) für das Projekt
  • batch.states.report

Entsprechende Funktionen

In der folgenden Tabelle werden die Funktionen von Cloud Life Sciences, die entsprechenden Funktionen sowie Details zu den Unterschieden.

Jede Funktion wird durch eine Beschreibung und ihre JSON-Syntax dargestellt. Sie können die JSON-Syntax verwenden, wenn Sie auf Batch über die API oder beim Angeben einer JSON-Konfiguration über die Google Cloud CLI. Sie können Batch-Funktionen aber auch mit anderen Methoden verwenden, z. B. über Felder in der Google Cloud Console, Flags in der gcloud CLI und Clientbibliotheken. Weitere Informationen finden Sie in der Batch-Dokumentation.

Weitere Informationen zu den einzelnen Funktionen und ihrer JSON-Syntax finden Sie hier:

Features von Cloud Life Sciences Batch-Funktionen Details
Pipeline (pipeline) Job (job) und seine Aufgaben (taskGroups[])

Ein Batch-Job besteht aus einem Array aus einer oder mehreren Aufgaben alle Runnables ausführen. Eine Cloud Life Sciences-Pipeline ähnelt einem Batch-Job mit einer Aufgabe. Cloud Life Sciences kein äquivalentes Konzept für (Jobs mit mehreren) Aufgaben, die den Wiederholungen einer Pipeline ähneln.

Weitere Informationen zu Jobs und Aufgaben finden Sie unter Übersicht für Batch

Aktionen (actions[]) für eine Pipeline Runnables (runnables[]) für die Aufgaben eines Jobs

Eine Cloud Life Sciences-Aktion beschreibt einen Container, aber ein Ein ausführbares Batch-Objekt kann entweder einen Container oder ein Skript enthalten.

Anmeldedaten (credentials) für eine Aktion

für ein ausführbares Container-Element fest:

In Cloud Life Sciences müssen die Anmeldedaten einer Aktion ein verschlüsseltes Cloud Key Management Service-Wörterbuch mit Nutzernamen und Passwort als Schlüssel/Wert-Paare sein.

In Batch befinden sich der Nutzername und das Passwort für einen ausführbaren Container in separaten Feldern. Jedes Feld kann mit Nur-Text oder mit dem Namen eines Secret Manager-Secret.

für eine Aktion:

für eine Umgebung:

mögliche Umgebungen:

Mit Cloud Life Sciences können Sie Umgebungsvariablen für eine Aktion, die als Nur-Text oder als verschlüsseltes Wörterbuch formatiert ist. In Batch ist dies ähnlich mit der Umgebung, für ein ausführbares Objekt (environment-Feld in runnables[]) Variablen enthalten, die folgendermaßen formatiert sind: Nur-Text (variables) oder ein verschlüsseltes Wörterbuch (encryptedVariables) gefunden.

Batch bietet aber auch mehr Optionen, Umgebungsvariablen:

  • Als Alternative zur Angabe von Variablen als Nur-Text oder einem verschlüsselten Wörterbuch verwenden, können Sie Variablen mit Secret Manager-Secrets mithilfe der eine geheime Variable (secretVariables)
  • Als Alternative zum Angeben einer Umgebungsvariable für ein ausführbares können Sie eine Umgebungsvariable für alle Runnables angeben, indem Sie mithilfe des Felds environment in taskSpec.
  • Als Alternative zur Angabe einer Umgebungsvariable, die den denselben Wert für jede Aufgabe hat, können Sie eine Umgebungsvariable angeben, einen anderen Wert für jede Aufgabe hat. Dazu verwenden Sie den Feld taskEnvironments[] in taskGroups[].

Weitere Informationen finden Sie unter Umgebungsvariablen verwenden.

Labels für eine Anfrage zum Ausführen einer Pipeline (labels im Anfragetext) Labels für einen Job (labels in der Jobressource)

Im Gegensatz zu Cloud Life Sciences enthält Batch in der Anfrage zum Erstellen eines neuen Jobs kein Label-Feld. Die nächstgelegene Option für Batch ist die Verwendung von Labels, die nur mit dem Job verknüpft sind.

Für Batch gibt es mehrere Arten von Labels (labels-Felder), die Sie beim Erstellen eines Jobs verwenden können. Weitere Informationen Siehe Ressourcen mithilfe von Labels organisieren.

Regionen (regions[]) und Zonen (zones[]) für die Ressourcen (resources) einer Pipeline Zulässige Standorte (allowedLocations) für die Richtlinie für Ressourcenstandorte (locationPolicy) eines Jobs

In Cloud Life Sciences wird eine Pipeline auf einer einzelnen VM ausgeführt, für die Sie die gewünschten Regionen und/oder Zonen angeben können.

In Batch entspricht dies der Option „Zulässige Standorte für einen Job“. Sie können eine oder mehrere Regionen oder Zonen angeben, an denen die VMs für einen Job erstellt werden können. Alle VMs für einen einzelnen Batchjob gehören zu einem verwaltete Instanzgruppe (MIG), die in einer bestimmten Region vorhanden ist Allerdings können sich einzelne VMs in verschiedenen Zonen der Region befinden.

Die Angabe des Felds „Zulässige Standorte“ für eine Stelle ist optional, da es sich von dem Standort der Stelle unterscheidet. Im Gegensatz zum Standort des Jobs wirkt sich der zulässige Standort nicht auf den Standort aus, der zum Erstellen eines Batchjobs und zum Speichern von Jobmetadaten verwendet wird. Weitere Informationen finden Sie unter Batch-Standorte.

für die Ressourcen einer Pipeline (resources):

für die Ressourcenrichtlinie eines Jobs (allocationPolicy):

In Cloud Life Sciences können Sie die (eine) VM konfigurieren, die ein auf der die Pipeline ausgeführt wird.

Im Stapel Dieselben Optionen für VMs sind in den Feldern einer Richtlinie für die Ressourcenzuweisung des Jobs (allocationPolicy):

  • Das Dienstkonto, die Labels und die Netzwerkkonfiguration für die VMs sind die in den entsprechenden Bereichen definiert sind.
  • Das VM-Feld (instances), das Sie entweder oder mithilfe einer Instanzvorlage, enthält die Konfigurationsoptionen für den Maschinentyp, die minimal zulässige CPU-Plattform, das Bootlaufwerk und alle anderen angeschlossenen Laufwerke sowie GPUs und GPU-Treiber.

für eine Aktion:

für ein Runnable:

Diese verschiedenen Convenience-Flags von Cloud Life Sciences im Batch gleich außer dass sie für jedes ausführbare (die ein Skript oder einen Container enthalten kann) anstelle jeder Aktion (Container).

für eine Aktion:

Optionen (options) für einen ausführbaren Container

Diese und andere Cloud Life Sciences-Optionen werden in Batch über das Optionsfeld (options) für einen ausführbaren Container unterstützt. Legen Sie im Feld "Optionen" alle Flags fest, die Sie möchten, dass Batch an den Befehl docker run angehängt wird – für Beispiel: -P --pid mynamespace -p 22:22.

für eine Aktion:

kein Äquivalent

Es ruft Bilder im Batch vorab ab und verarbeitet die Ausgaben aller Runnables in Übereinstimmung mit dem Job Logrichtlinie (logsPolicy)

Option zum Blockieren externer Netzwerke (blockExternalNetwork) für eine Aktion Option zum Blockieren externer Netzwerke (blockExternalNetwork) für einen ausführbaren Container

Die Cloud Life Sciences-Option zum Blockieren externer Netzwerke für eine Aktion ähnelt der Batch-Option zum Blockieren externer Netzwerke für einen Container.

Batch bietet auch viele andere Netzwerkoptionen, um externe Netzwerke für alle VMs eines Jobs zu blockieren. Weitere Informationen finden Sie unter Batch-Netzwerkübersicht.

Halterungen (mounts[]) für eine Aktion Volumes für alle ausführbaren Dateien (volumes[] in taskSpec) und Volume-Optionen für einen Container (volumes[] in container)

In Batch können Sie den Feld „volumes[]“ in taskSpec zum Definieren der Volumes eines Jobs und ihrer Bereitstellungspfade. Bei Batchjobs werden Speichervolumes auf den VMs des Jobs bereitgestellt. Diese sind für alle ausführbaren Elemente des Jobs (Scripts oder Container) zugänglich. Diese Bereitstellung erfolgt, bevor die VM Aufgaben oder ausführbare Dateien ausführt.

Außerdem werden Batch- unterstützt explizite Volume-Optionen für Container-Runnables mithilfe der Methode Feld volumes[] in container. Diese Montageoptionen als Optionen für die API an den Container übergeben. Flag --volume des Befehls docker run – für Beispiel: Der Wert [ "/etc:/etc", "/foo:/bar" ] ist in den Befehl docker run --volume /etc:/etc --volume /foo:/bar übersetzt. für den Container.

Weitere Informationen zur Verwendung von Speichervolumes mit Batch finden Sie unter Job erstellen und ausführen, der Speichervolumes verwendet.

Option zum Aktivieren von Cloud Storage FUSE (enableFuse) für eine Aktion kein Äquivalent

Batch stellt das Bereitstellen von Speicher-Volumes wie einen Cloud Storage-Bucket, den Sie für einen Job angeben. Daher aktivieren Sie keine Bereitstellungstools wie Cloud Storage FUSE. für Batch: Sie können jedoch optional für Ihre Speicher-Volumes mithilfe der Methode Feld mountOptions[].

Weitere Informationen zur Verwendung von Cloud Storage-Buckets mit Batch finden Sie unter Job erstellen und ausführen, der Speicher-Volumes verwendet.

Pub/Sub-Thema (pubSubTopic) für eine Anfrage zum Ausführen einer Pipeline

für die Benachrichtigungskonfigurationen eines Jobs (notifications[]):

Der Batch ermöglicht eine umfassendere Anpassung von Statusaktualisierungen als Cloud Life Sciences. Batch-Nutzer können beispielsweise über ein Pub/Sub-Thema benachrichtigt werden, wenn sich entweder der Status einzelner Aufgaben oder nur der Status des gesamten Jobs ändert.

Workflow-Dienste

Wenn Sie einen Workflow-Dienst mit Cloud Life Sciences verwenden, müssen Sie bei der Migration auch einen Workflow-Dienst für die Verwendung mit Batch konfigurieren. In diesem Abschnitt werden die Workflowdienste zusammengefasst. die Sie mit Batch verwenden können.

Batch unterstützt Workflows, Workflow-Dienst von Google Cloud. Wenn Sie Workflows mit Batch verwenden möchten, lesen Sie Einen Batchjob mit Workflows ausführen Andernfalls werden in der folgenden Tabelle andere Workflowdienste beschrieben. die Sie für Cloud Life Sciences nutzen können, die Sie auch mit Batch. In dieser Tabelle sind die wichtigsten Unterschiede Workflow-Dienst mit Batch anstelle von Cloud Life Sciences und Details dazu, wo Sie mehr über die Verwendung der einzelnen Dienste erfahren können mit Batch zu erstellen.

Workflow-Dienst Wichtige Unterschiede Details
Cromwell

Wenn Sie stattdessen eine Cromwell-Konfigurationsdatei für die Cloud Life Sciences API der Version v2beta mit der Batch API verwenden möchten, nehmen Sie die folgenden Änderungen vor:

  1. Ersetzen Sie im Feld actor-factory cromwell.backend.google.pipelines.v2beta.PipelinesApiLifecycleActorFactory durch cromwell.backend.google.batch.GcpBatchLifecycleActorFactory.
  2. Entfernen Sie das Feld genomics.endpoint-url.
  3. Erstellen Sie eine neue Konfigurationsdatei.
Weitere Informationen zur Verwendung von Batch mit Cromwell finden Sie in der Cromwell-Dokumentation für Batch und das Cromwell-Tutorial für Batch.
dsub

dsub-Pipeline für Cloud Life Sciences ausführen mit „Batch“ verwenden, nehmen Sie folgende Änderungen vor:

  • Ersetzen Sie im Feld provider das Zeichen google-cls-v2 durch google-batch.
Weitere Informationen zur Verwendung von Batch mit dsub finden Sie in der dsub-Dokumentation für Batch.
Logo: Nextflow

Wenn Sie stattdessen eine Nextflow-Konfigurationsdatei für Cloud Life Sciences mit Batch verwenden möchten, nehmen Sie die folgenden Änderungen vor:

  1. Ersetzen Sie im Feld executor google-lifesciences durch google-batch.
  2. Ersetzen Sie für alle config-Präfixe google.lifeScience durch google.batch.
Weitere Informationen zur Verwendung von Batch mit Nextflow finden Sie in den Batch- oder Nextflow-Anleitungen. Informationen zu den Konfigurationsoptionen finden Sie in der Nextflow-Dokumentation.
Snakemake

Wenn Sie stattdessen eine Snakemake-Pipeline für die Cloud Life Sciences API v2beta mit der Batch API verwenden möchten, nehmen Sie die folgenden Änderungen vor:

  1. Achten Sie darauf, dass Sie Snakemake Version 8 oder höher verwenden. Weitere Informationen finden Sie unter Migration zwischen Snakemake-Versionen.
  2. Nehmen Sie die folgenden Änderungen am snakemake-Befehl vor:

    • Ersetzen Sie das Flag --google-lifesciences durch das Flag --executor googlebatch.
    • Ersetzen Sie alle zusätzlichen Flags mit dem Präfix --google-lifesciences- durch das Präfix --googlebatch-.
Weitere Informationen zur Verwendung von Batch mit Snakemake sieh dir die Snakemake-Dokumentation für Batch.

Nächste Schritte

  • Informationen zum Konfigurieren von Batch für neue Nutzer und Projekte finden Sie unter Jetzt starten
  • Informationen zum Ausführen von Arbeitslasten mit Batch finden Sie unter Job erstellen