In dieser Anleitung erfahren Sie, wie Sie einen Workflow erstellen, der mit dem Cloud Translation API-Connector Dateien im asynchronen Batchmodus in andere Sprachen übersetzt. So erhalten Sie eine Echtzeitausgabe, während die Eingaben verarbeitet werden.
Lernziele
In dieser Anleitung werden Sie:
- Erstellen Sie einen Cloud Storage-Eingabe-Bucket.
- Erstellen Sie zwei Dateien auf Englisch und laden Sie sie in den Eingabe-Bucket hoch.
- Erstellen Sie einen Workflow, der die beiden Dateien mit dem Cloud Translation API-Connector ins Französische und Spanische übersetzt und die Ergebnisse in einem Ausgabe-Bucket speichert.
- Stellen Sie den Workflow zur Orchestrierung des gesamten Prozesses bereit und führen Sie ihn aus.
Kosten
In diesem Dokument verwenden Sie die folgenden kostenpflichtigen Komponenten von Google Cloud:
Mit dem Preisrechner können Sie eine Kostenschätzung für Ihre voraussichtliche Nutzung vornehmen.
Hinweise
Von Ihrer Organisation definierte Sicherheitsbeschränkungen verhindern möglicherweise, dass die folgenden Schritte ausgeführt werden. Informationen zur Fehlerbehebung finden Sie unter Anwendungen in einer eingeschränkten Google Cloud-Umgebung entwickeln.
- Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
- Installieren Sie die Google Cloud CLI.
-
Führen Sie folgenden Befehl aus, um die gcloud CLI zu initialisieren:
gcloud init
-
Create or select a Google Cloud project.
-
Create a Google Cloud project:
gcloud projects create PROJECT_ID
Replace
PROJECT_ID
with a name for the Google Cloud project you are creating. -
Select the Google Cloud project that you created:
gcloud config set project PROJECT_ID
Replace
PROJECT_ID
with your Google Cloud project name.
-
-
Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.
-
Aktivieren Sie die Cloud Storage, Translation, and Workflows APIs:
gcloud services enable storage.googleapis.com
translate.googleapis.com workflows.googleapis.com - Installieren Sie die Google Cloud CLI.
-
Führen Sie folgenden Befehl aus, um die gcloud CLI zu initialisieren:
gcloud init
-
Create or select a Google Cloud project.
-
Create a Google Cloud project:
gcloud projects create PROJECT_ID
Replace
PROJECT_ID
with a name for the Google Cloud project you are creating. -
Select the Google Cloud project that you created:
gcloud config set project PROJECT_ID
Replace
PROJECT_ID
with your Google Cloud project name.
-
-
Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.
-
Aktivieren Sie die Cloud Storage, Translation, and Workflows APIs:
gcloud services enable storage.googleapis.com
translate.googleapis.com workflows.googleapis.com - Aktualisieren Sie die gcloud-Komponenten:
gcloud components update
- Melden Sie sich mit Ihrem Konto an:
gcloud auth login
- Legen Sie den Standardspeicherort fest, der in dieser Anleitung verwendet wird:
gcloud config set workflows/location us-central1
Da in dieser Anleitung das AutoML Translation-Standardmodell verwendet wird, das sich in
us-central1
befindet, müssen Sie den Standort aufus-central1
festlegen.Wenn Sie ein anderes AutoML Translation-Modell oder -Glossar als das Standardmodell verwenden, müssen Sie darauf achten, dass es sich am selben Standort wie der Aufruf des Connectors befindet. Andernfalls wird der Fehler
INVALID_ARGUMENT (400)
zurückgegeben. Weitere Informationen finden Sie in der batchTranslateText-Methode.
Cloud Storage-Eingabe-Bucket und -Dateien erstellen
Sie können Cloud Storage zum Speichern von Objekten verwenden. Objekte sind unveränderliche Datenelemente, die aus einer Datei mit einem beliebigen Format bestehen, und werden in Containern gespeichert, die als Buckets bezeichnet werden.
Erstellen Sie einen Cloud Storage-Bucket für die zu übersetzenden Dateien:
BUCKET_INPUT=${GOOGLE_CLOUD_PROJECT}-input-files gsutil mb gs://${BUCKET_INPUT}
Erstellen Sie zwei Dateien auf Englisch und laden Sie sie in den Eingabe-Bucket hoch:
echo "Hello World!" > file1.txt gsutil cp file1.txt gs://${BUCKET_INPUT} echo "Workflows connectors simplify calling services." > file2.txt gsutil cp file2.txt gs://${BUCKET_INPUT}
Workflow bereitstellen und ausführen
Ein Workflow besteht aus einer Reihe von Schritten, die mit der Workflows-Syntax beschrieben werden. Diese kann entweder im YAML- oder JSON-Format geschrieben werden. Dies ist die Definition des Workflows. Nachdem Sie einen Workflow erstellt haben, stellen Sie ihn bereit, um ihn für die Ausführung verfügbar zu machen.
Erstellen Sie eine Textdatei mit dem Dateinamen
workflow.yaml
und folgendem Inhalt:Der Workflow weist Variablen zu, erstellt einen Ausgabe-Bucket, initiiert die Übersetzung der Dateien und speichert die Ergebnisse im Ausgabe-Bucket.
Nachdem Sie den Workflow erstellt haben, stellen Sie ihn bereit:
gcloud workflows deploy batch-translation --source=workflow.yaml
Führen Sie den Workflow aus:
gcloud workflows execute batch-translation
Zum Anzeigen des Workflowstatus können Sie den zurückgegebenen Befehl ausführen. Beispiel:
gcloud workflows executions describe eb4a6239-cffa-4672-81d8-d4caef7d8424 / --workflow batch-translation / --location us-central1
Der Workflow sollte
ACTIVE
lauten. Nach einigen Minuten werden die übersetzten Dateien (auf Französisch und Spanisch) in den Ausgabe-Bucket hochgeladen.
Objekte im Ausgabe-Bucket auflisten
Sie können prüfen, ob der Workflow wie erwartet funktioniert, indem Sie die Objekte im Ausgabe-Bucket auflisten.
Rufen Sie den Namen des Ausgabe-Buckets ab:
gsutil ls
Die Ausgabe sieht in etwa so aus:
gs://PROJECT_ID-input-files/ gs://PROJECT_ID-output-files-TIMESTAMP/
Objekte in Ihrem Bucket auflisten:
gsutil ls -r gs://PROJECT_ID-output-files-TIMESTAMP/**
Nach einigen Minuten werden die übersetzten Dateien (zwei davon auf Französisch und Spanisch) aufgeführt.
Bereinigen
Wenn Sie ein neues Projekt für diese Anleitung erstellt haben, löschen Sie das Projekt. Wenn Sie ein vorhandenes Projekt verwendet haben und es beibehalten möchten, ohne die Änderungen in dieser Anleitung hinzuzufügen, löschen Sie die für die Anleitung erstellten Ressourcen.
Projekt löschen
Am einfachsten vermeiden Sie weitere Kosten durch Löschen des für die Anleitung erstellten Projekts.
So löschen Sie das Projekt:
- Wechseln Sie in der Google Cloud Console zur Seite Ressourcen verwalten.
- Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
- Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.
Anleitungsressourcen löschen
Entfernen Sie die gcloud-Standardkonfiguration, die Sie während der Einrichtung der Anleitung hinzugefügt haben.
gcloud config unset workflows/location
Löschen Sie den in dieser Anleitung erstellten Workflow:
gcloud workflows delete WORKFLOW_NAME
Löschen Sie die in dieser Anleitung erstellten Buckets:
gsutil rm -r gs://BUCKET_NAME
Dabei ist
BUCKET_NAME
der Name des zu löschenden Buckets. Beispiel:my-bucket
.Die Antwort ähnelt dem folgenden Beispiel.
Removing gs://my-bucket/...
Nächste Schritte
- Weitere Informationen zu Workflows finden Sie unter Workflows verstehen.
- Weitere Informationen zur Workflow-Syntax finden Sie in der Referenz zur Workflow-Syntax.
- Weitere Informationen zu Workflow-Connectors finden Sie unter Informationen zu Connectors.