Auf dieser Seite wird beschrieben, wie Sie von Cloud Life Sciences.
Am 17. Juli 2023 gab Google Cloud bekannt, dass Cloud Life Sciences, die sich bisher noch in der Betaphase befand. Der Dienst ist nach dem 8. Juli 2025 nicht mehr in Google Cloud verfügbar. Batch ist jedoch allgemein verfügbar und ein umfassender Nachfolger, der alle Anwendungsfälle für Cloud Life Sciences.
Weitere Informationen zu Batch Cloud Life Sciences und Produkteinführung Phasen.
Cloud Life Sciences im Vergleich zu Batch
Von Cloud Life Sciences zu Batch migrieren geht es in erster Linie darum, zu verstehen, wie Sie Batch für die Arbeitslasten, die Sie derzeit mit dem Cloud Life Sciences-Pipelines
In den folgenden Abschnitten erfahren Sie, wie Sie Ihre Cloud Life Sciences-Arbeitslasten in Batch ausführen:
Übersicht
Eine Pipeline von Cloud Life Sciences beschreibt eine Abfolge von Aktionen (Containern), die ausgeführt werden sollen, und die Umgebung, in der die Container ausgeführt werden sollen.
Ein Batchjob beschreibt ein Array aus einer oder mehreren Aufgaben und die Umgebung, in der diese Aufgaben ausgeführt werden. Sie definieren die Arbeitslast für einen Job Sequenz eines oder mehrerer auszuführender Runnables (Container und/oder Skripts) Jede Aufgabe für einen Job steht für eine Ausführung der zugehörigen Sequenz von Runnables.
Cloud Life Sciences-Pipelines können als Batchjobs mit einer einzelnen Aufgabe angegeben werden.
In den folgenden Beispielen wird z. B. eine einfache Cloud Life Sciences-Pipeline und ihr Äquivalent Batch job:
Cloud Life Sciences-Pipeline | Batchjob |
---|---|
{ "actions": [ { "imageUri": "bash", "commands": [ "-c", "echo Hello, world!" ] } ] } |
{ "taskGroups" : [{ "taskSpec" : { "runnables" : [{ "container":{ "imageUri": "bash", "commands": [ "-c", "echo Hello, world!" ] } }] } }] } |
Batchjobs mit mehreren Aufgaben ähneln kopierten Cloud Life Sciences-Pipelines.
Im Gegensatz zu Cloud Life Sciences können Sie mit Batch mehrere Ausführungen Ihrer Arbeitslast automatisch planen. Sie geben an, wie oft die Abfolge der ausführbaren Elemente für einen Job ausgeführt werden soll, indem Sie die Anzahl der Aufgaben definieren. Wenn ein Job mehrere Aufgaben ausführen, legen Sie fest, wie die einzelnen Ausführungen in Ihren Runnables auf den Aufgabenindex verweisen. Außerdem können Sie die relativen Zeitpläne für die Aufgaben eines Jobs konfigurieren, z. B. ob mehrere Aufgaben parallel ausgeführt werden dürfen oder ob Aufgaben nacheinander und einzeln ausgeführt werden müssen. Batch verwaltet die Planung der Aufgaben des Jobs: Nach Abschluss einer Aufgabe startet der Job automatisch die nächste Aufgabe (falls vorhanden).
Sehen Sie sich beispielsweise den folgenden Batchjob an. Dieser Beispieljob umfasst 100 Aufgaben, die auf 10 Compute Engine-VM-Instanzen ausgeführt werden. Es werden also immer etwa 10 Aufgaben parallel ausgeführt. Jede Aufgabe in diesem Beispieljob führt nur ein Runnable aus:
ein Skript, das eine Nachricht und den Index der Aufgabe ausgibt, der vom
Vordefinierte Umgebungsvariable BATCH_TASK_INDEX
.
{
"taskGroups" : [{
"taskSpec" : {
"runnables" : [{
"script":{
"text": "echo Hello world! This is task ${BATCH_TASK_INDEX}."
}
}]
},
"taskCount": 100,
"parallelism": 10
}]
}
Workflows, bei denen mehrere ähnliche Cloud Life Sciences-Pipelines können manchmal vereinfacht werden, indem der integrierten Zeitplanung von Batch.
Grundlegende Vorgänge
In diesem Abschnitt werden die grundlegenden Vorgänge in Cloud Life Sciences im Vergleich zu Batch.
In der folgenden Tabelle sind die grundlegenden Vorgangsoptionen für Cloud Life Sciences und Batch.
Grundlegender Vorgang | Cloud Life Sciences-Optionen | Batch-Optionen |
---|---|---|
Arbeitslast ausführen. |
|
|
Sehen Sie sich alle Ihre Arbeitslasten an. |
|
|
Details und Status einer Arbeitslast aufrufen |
|
|
Beenden und entfernen Sie eine Arbeitslast. |
|
|
Grundlegende Vorgänge für Cloud Life Sciences und Batch gibt es einige wichtige Unterschiede.
Erstens: Ressourcen für langlaufende Vorgänge spielen in Batch keine Rolle wie in Cloud Life Sciences.
Ressourcen mit langer Ausführungszeit in Cloud Life Sciences
sind die primäre Ressource, die zum Auflisten und Aufrufen Ihrer Pipelines verwendet wird. Aber
Ressourcen mit langer Ausführungszeit in Batch und anderen Google Cloud APIs
werden nur verwendet, um den Status einer Anfrage zu überwachen, deren Verarbeitung lange dauert.
abgeschlossen ist. Die einzige Anfrage, die in Batch
gibt eine Vorgangsressource mit langer Ausführungszeit zurück, das Löschen eines Jobs.
Weitere Informationen zu Ressourcen für langlaufende Vorgänge für Batch finden Sie in der Referenzdokumentation der Batch API für die REST-Ressource projects.locations.operations
.
Anstatt Ressourcen für lang laufende Vorgänge zu verwenden, gibt es in Batch Jobressourcen, die Sie für Ihre Arbeitslasten aufrufen und löschen können.
Wenn Sie sich die Details einer Arbeitslast in Batch ansehen, anderen Abläufen als Cloud Life Sciences. Sie können sich einen Job ansehen, um sowohl die Details als auch den Status zu sehen. Jede Aufgabe eines Jobs hat jedoch auch eigene Details und einen eigenen Status. Sie können sich diese in einer Liste der Aufgaben eines Jobs und in den Details einer Aufgabe ansehen.
Damit Sie die grundlegenden Vorgänge für Cloud Life Sciences und Batch besser verstehen, finden Sie in den folgenden Abschnitten Beispiele für Google Cloud CLI-Befehle und API-Anfragepfade für einige dieser grundlegenden Vorgänge.
Beispiele für gcloud-Befehle
Für die gcloud CLI und Cloud Life Sciences-Befehle
mit gcloud beta lifesciences
- und Batch-Befehlen beginnen
mit gcloud batch
beginnen.
Sehen Sie sich beispielsweise die folgenden gcloud CLI-Befehle an.
gcloud CLI-Beispielbefehle für Cloud Life Sciences:
So führen Sie eine Pipeline aus:
gcloud beta lifesciences pipelines run \ --project=PROJECT_ID \ --regions=LOCATION \ --pipeline-file=JSON_CONFIGURATION_FILE
So rufen Sie Details zu einem lang andauernden Vorgang ab:
gcloud beta lifesciences operations describe OPERATION_ID
Ersetzen Sie Folgendes:
PROJECT_ID
: die Projekt-ID Ihres Projekts.LOCATION
: der Standort für den zu erstellen.JSON_CONFIGURATION_FILE
: die JSON-Konfiguration für die Pipeline.OPERATION_ID
: die Kennung für den lang andauernden Vorgang, der von der Anfrage zurückgegeben wurde, zu erstellen.
Beispiele für gcloud-Befehlszeilenbefehle für Batches:
So erstellen und führen Sie einen Job aus:
gcloud batch jobs submit JOB_NAME \ --project=PROJECT_ID \ --location=LOCATION \ --config=JSON_CONFIGURATION_FILE
So rufen Sie die Details eines Jobs auf:
gcloud batch jobs describe JOB_NAME \ --project=PROJECT_ID \ --location=LOCATION \
So rufen Sie die Aufgabenliste eines Jobs auf:
gcloud batch tasks list \ --project=PROJECT_ID \ --location=LOCATION \ --job=JOB_NAME
So rufen Sie die Details einer Aufgabe auf:
gcloud batch tasks describe TASK_INDEX \ --project=PROJECT_ID \ --location=LOCATION \ --job=JOB_NAME \ --task_group=TASK_GROUP
Jobs löschen (und abbrechen):
gcloud batch jobs delete JOB_NAME \ --project=PROJECT_ID \ --location=LOCATION
Ersetzen Sie Folgendes:
JOB_NAME
: der Name des Jobs.PROJECT_ID
: die Projekt-ID Ihres Projekts.LOCATION
: den Standort der Stelle.JSON_CONFIGURATION_FILE
: der Pfad zu einer JSON-Datei mit den Konfigurationsdetails des Jobs.TASK_INDEX
: Der Index der Aufgabe, deren Details Sie aufrufen möchten. In einer Aufgabengruppe beginnt der Aufgabenindex für die erste und erhöht sich bei jeder weiteren Aufgabe um 1. Eine Aufgabengruppe mit vier Aufgaben hat beispielsweise die Indizes0
,1
,2
und3
.TASK_GROUP_NAME
: der Name der Aufgabengruppe, die die Sie aufrufen möchten. Der Wert muss aufgroup0
Beispiele für API-Anfragepfade
Für APIs verwendet Cloud Life Sciences
lifesciences.googleapis.com
-Anfragepfade und Batch-Verwendungen
batch.googleapis.com
-Anfragepfade.
Sehen Sie sich beispielsweise die folgenden API-Anfragepfade an. Im Gegensatz zu Cloud Life Sciences bietet Batch keine RPC API, sondern nur eine REST API.
Cloud Life Sciences-Beispiel-API-Anfragepfade:
Führen Sie eine Pipeline aus:
POST https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/pipelines:run
So rufen Sie Details zu einem lang andauernden Vorgang ab:
GET https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
Ersetzen Sie Folgendes:
PROJECT_ID
: die Projekt-ID Ihres Projekts.LOCATION
: Der Speicherort der Pipeline.OPERATION_ID
: Die Kennzeichnung für den lang andauernden Vorgang, die von der Anfrage zum Ausführen der Pipeline zurückgegeben wurde.
Beispiele für API-Anfragepfade im Batch:
So erstellen und führen Sie einen Job aus:
POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
So rufen Sie die Details eines Jobs auf:
GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
So rufen Sie die Aufgabenliste eines Jobs auf:
GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME/taskGroups/TASK_GROUP/tasks
Job löschen
DELETE https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
Prüfen Sie den Status der Anfrage zum Löschen des Jobs:
GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
Ersetzen Sie Folgendes:
PROJECT_ID
: die Projekt-ID Ihres Projekts.LOCATION
: der Standort des Jobs.JOB_NAME
: der Name des Jobs.TASK_GROUP_NAME
: der Name der Aufgabengruppe, deren Details Sie aufrufen möchten. Der Wert muss aufgroup0
OPERATION_ID
: Die Kennzeichnung für den lang andauernden Vorgang, die von der Anfrage zum Löschen des Jobs zurückgegeben wurde.
IAM-Rollen und -Berechtigungen
In diesem Abschnitt werden die Unterschiede bei den Rollen und Berechtigungen der Identitäts- und Zugriffsverwaltung für Cloud Life Sciences und Batch zusammengefasst. Weitere Informationen zu Rollen und ihren Berechtigungen finden Sie in der Referenz zu einfachen und vordefinierten IAM-Rollen.
In der folgenden Tabelle werden die vordefinierten Rollen und ihre Berechtigungen beschrieben, die für Nutzer von Cloud Life Sciences erforderlich sind.
Cloud Life Sciences-Rollen | Berechtigungen |
---|---|
Eine der folgenden:
|
|
Cloud Life Sciences-Betrachter (roles/lifesciences.viewer ) für das Projekt |
|
In der folgenden Tabelle werden einige der vordefinierten Rollen und ihre Berechtigungen für Batch beschrieben. Im Gegensatz zu Cloud Life Sciences müssen Sie in Batch Nutzern und dem Dienstkonto Berechtigungen für einen Job erteilen. Weitere Informationen zu den IAM-Anforderungen finden Sie unter Voraussetzungen für Batch.
Batchrollen für Nutzer | Berechtigungen |
---|---|
Batch-Job-Bearbeiter (roles/batch.jobsEditor ) für das Projekt |
|
Batchjob-Betrachter (roles/batch.jobsViewer ) für das Projekt |
|
Dienstkontonutzer (roles/iam.serviceAccountUser ) für das Dienstkonto des Jobs |
|
Batchrollen für Dienstkonten | Berechtigungen |
Batch-Agent-Melder (roles/batch.agentReporter ) für das Projekt |
|
Entsprechende Funktionen
In der folgenden Tabelle werden die Funktionen von Cloud Life Sciences, die entsprechenden Funktionen sowie Details zu den Unterschieden.
Jede Funktion wird durch eine Beschreibung und ihre JSON-Syntax dargestellt. Sie können die JSON-Syntax verwenden, wenn Sie auf Batch über die API oder beim Angeben einer JSON-Konfiguration über die Google Cloud CLI. Sie können Batch-Funktionen aber auch mit anderen Methoden verwenden, z. B. über Felder in der Google Cloud Console, Flags in der gcloud CLI und Clientbibliotheken. Weitere Informationen finden Sie in der Batch-Dokumentation.
Weitere Informationen zu den einzelnen Funktionen und ihrer JSON-Syntax finden Sie hier:
Für Cloud Life Sciences finden Sie die Informationen in der Referenzdokumentation zur Cloud Life Sciences API für die REST-Ressource
projects.locations.pipelines
.Informationen zu Batch finden Sie in der Batch API-Referenzdokumentation für die REST-Ressource
projects.locations.jobs
Features von Cloud Life Sciences | Batch-Funktionen | Details |
---|---|---|
Pipeline (pipeline ) |
Job (job ) und seine Aufgaben (taskGroups[] ) |
Ein Batch-Job besteht aus einem Array aus einer oder mehreren Aufgaben alle Runnables ausführen. Eine Cloud Life Sciences-Pipeline ähnelt einem Batch-Job mit einer Aufgabe. Cloud Life Sciences kein äquivalentes Konzept für (Jobs mit mehreren) Aufgaben, die den Wiederholungen einer Pipeline ähneln. Weitere Informationen zu Jobs und Aufgaben finden Sie unter Übersicht für Batch |
Aktionen (actions[] ) für eine Pipeline |
Runnables (runnables[] ) für die Aufgaben eines Jobs |
Eine Cloud Life Sciences-Aktion beschreibt einen Container, aber ein Ein ausführbares Batch-Objekt kann entweder einen Container oder ein Skript enthalten. |
Anmeldedaten (credentials ) für eine Aktion |
für ein ausführbares Container-Element fest: |
In Cloud Life Sciences müssen die Anmeldedaten einer Aktion ein verschlüsseltes Cloud Key Management Service-Wörterbuch mit Nutzernamen und Passwort als Schlüssel/Wert-Paare sein. In Batch befinden sich der Nutzername und das Passwort für einen ausführbaren Container in separaten Feldern. Jedes Feld kann mit Nur-Text oder mit dem Namen eines Secret Manager-Secret. |
für eine Aktion:
|
für eine Umgebung:
mögliche Umgebungen:
|
Mit Cloud Life Sciences können Sie Umgebungsvariablen
für eine Aktion, die als Nur-Text oder als verschlüsseltes Wörterbuch formatiert ist.
In Batch ist dies
ähnlich mit der Umgebung,
für ein ausführbares Objekt ( Batch bietet aber auch mehr Optionen, Umgebungsvariablen:
Weitere Informationen finden Sie unter Umgebungsvariablen verwenden. |
Labels für eine Anfrage zum Ausführen einer Pipeline (labels im Anfragetext) |
Labels für einen Job (labels in der Jobressource) |
Im Gegensatz zu Cloud Life Sciences enthält Batch in der Anfrage zum Erstellen eines neuen Jobs kein Label-Feld. Die nächstgelegene Option für Batch ist die Verwendung von Labels, die nur mit dem Job verknüpft sind. Für Batch gibt es mehrere Arten von Labels ( |
Regionen (regions[] ) und Zonen (zones[] ) für die Ressourcen (resources ) einer Pipeline |
Zulässige Standorte (allowedLocations ) für die Richtlinie für Ressourcenstandorte (locationPolicy ) eines Jobs |
In Cloud Life Sciences wird eine Pipeline auf einer einzelnen VM ausgeführt, für die Sie die gewünschten Regionen und/oder Zonen angeben können. In Batch entspricht dies der Option „Zulässige Standorte für einen Job“. Sie können eine oder mehrere Regionen oder Zonen angeben, an denen die VMs für einen Job erstellt werden können. Alle VMs für einen einzelnen Batchjob gehören zu einem verwaltete Instanzgruppe (MIG), die in einer bestimmten Region vorhanden ist Allerdings können sich einzelne VMs in verschiedenen Zonen der Region befinden. Die Angabe des Felds „Zulässige Standorte“ für eine Stelle ist optional, da es sich von dem Standort der Stelle unterscheidet. Im Gegensatz zum Standort des Jobs wirkt sich der zulässige Standort nicht auf den Standort aus, der zum Erstellen eines Batchjobs und zum Speichern von Jobmetadaten verwendet wird. Weitere Informationen finden Sie unter Batch-Standorte. |
für die Ressourcen einer Pipeline (
|
für die Ressourcenrichtlinie eines Jobs (
|
In Cloud Life Sciences können Sie die (eine) VM konfigurieren, die ein auf der die Pipeline ausgeführt wird. Im Stapel
Dieselben Optionen für VMs sind in den Feldern einer
Richtlinie für die Ressourcenzuweisung des Jobs (
|
für eine Aktion:
|
für ein Runnable:
|
Diese verschiedenen Convenience-Flags von Cloud Life Sciences im Batch gleich außer dass sie für jedes ausführbare (die ein Skript oder einen Container enthalten kann) anstelle jeder Aktion (Container). |
für eine Aktion:
|
Optionen (options ) für einen ausführbaren Container |
Diese und andere Cloud Life Sciences-Optionen werden in Batch über das Optionsfeld ( |
für eine Aktion:
|
kein Äquivalent |
Es ruft Bilder im Batch vorab ab und verarbeitet die
Ausgaben aller Runnables in Übereinstimmung mit dem Job
Logrichtlinie ( |
Option zum Blockieren externer Netzwerke (blockExternalNetwork ) für eine Aktion |
Option zum Blockieren externer Netzwerke (blockExternalNetwork ) für einen ausführbaren Container |
Die Cloud Life Sciences-Option zum Blockieren externer Netzwerke für eine Aktion ähnelt der Batch-Option zum Blockieren externer Netzwerke für einen Container. Batch bietet auch viele andere Netzwerkoptionen, um externe Netzwerke für alle VMs eines Jobs zu blockieren. Weitere Informationen finden Sie unter Batch-Netzwerkübersicht. |
Halterungen (mounts[] ) für eine Aktion |
Volumes für alle ausführbaren Dateien (volumes[] in taskSpec ) und Volume-Optionen für einen Container (volumes[] in container ) |
In Batch können Sie den
Feld „ Außerdem werden Batch-
unterstützt explizite Volume-Optionen für Container-Runnables mithilfe der Methode
Feld Weitere Informationen zur Verwendung von Speichervolumes mit Batch finden Sie unter Job erstellen und ausführen, der Speichervolumes verwendet. |
Option zum Aktivieren von Cloud Storage FUSE (enableFuse ) für eine Aktion |
kein Äquivalent |
Batch stellt das
Bereitstellen von Speicher-Volumes
wie einen Cloud Storage-Bucket, den Sie für einen Job angeben.
Daher aktivieren Sie keine Bereitstellungstools wie Cloud Storage FUSE.
für Batch: Sie können jedoch optional
für Ihre Speicher-Volumes mithilfe der Methode
Feld Weitere Informationen zur Verwendung von Cloud Storage-Buckets mit Batch finden Sie unter Job erstellen und ausführen, der Speicher-Volumes verwendet. |
Pub/Sub-Thema (pubSubTopic ) für eine Anfrage zum Ausführen einer Pipeline |
für die Benachrichtigungskonfigurationen eines Jobs (
|
Der Batch ermöglicht eine umfassendere Anpassung von Statusaktualisierungen als Cloud Life Sciences. Batch-Nutzer können beispielsweise über ein Pub/Sub-Thema benachrichtigt werden, wenn sich entweder der Status einzelner Aufgaben oder nur der Status des gesamten Jobs ändert. |
Workflow-Dienste
Wenn Sie einen Workflow-Dienst mit Cloud Life Sciences verwenden, müssen Sie bei der Migration auch einen Workflow-Dienst für die Verwendung mit Batch konfigurieren. In diesem Abschnitt werden die Workflowdienste zusammengefasst. die Sie mit Batch verwenden können.
Batch unterstützt Workflows, Workflow-Dienst von Google Cloud. Wenn Sie Workflows mit Batch verwenden möchten, lesen Sie Einen Batchjob mit Workflows ausführen Andernfalls werden in der folgenden Tabelle andere Workflowdienste beschrieben. die Sie für Cloud Life Sciences nutzen können, die Sie auch mit Batch. In dieser Tabelle sind die wichtigsten Unterschiede Workflow-Dienst mit Batch anstelle von Cloud Life Sciences und Details dazu, wo Sie mehr über die Verwendung der einzelnen Dienste erfahren können mit Batch zu erstellen.
Workflow-Dienst | Wichtige Unterschiede | Details |
---|---|---|
Cromwell |
Wenn Sie stattdessen eine Cromwell-Konfigurationsdatei für die Cloud Life Sciences API der Version v2beta mit der Batch API verwenden möchten, nehmen Sie die folgenden Änderungen vor:
|
Weitere Informationen zur Verwendung von Batch mit Cromwell finden Sie in der Cromwell-Dokumentation für Batch und das Cromwell-Tutorial für Batch. |
dsub |
dsub-Pipeline für Cloud Life Sciences ausführen mit „Batch“ verwenden, nehmen Sie folgende Änderungen vor:
|
Weitere Informationen zur Verwendung von Batch mit dsub finden Sie in der dsub-Dokumentation für Batch. |
Logo: Nextflow |
Wenn Sie stattdessen eine Nextflow-Konfigurationsdatei für Cloud Life Sciences mit Batch verwenden möchten, nehmen Sie die folgenden Änderungen vor:
|
Weitere Informationen zur Verwendung von Batch mit Nextflow finden Sie in den Batch- oder Nextflow-Anleitungen. Informationen zu den Konfigurationsoptionen finden Sie in der Nextflow-Dokumentation. |
Snakemake |
Wenn Sie stattdessen eine Snakemake-Pipeline für die Cloud Life Sciences API v2beta mit der Batch API verwenden möchten, nehmen Sie die folgenden Änderungen vor:
|
Weitere Informationen zur Verwendung von Batch mit Snakemake sieh dir die Snakemake-Dokumentation für Batch. |
Nächste Schritte
- Informationen zum Konfigurieren von Batch für neue Nutzer und Projekte finden Sie unter Jetzt starten
- Informationen zum Ausführen von Arbeitslasten mit Batch finden Sie unter Job erstellen