Media Translation übersetzt den Inhalt einer Audiodatei oder eines Spracheingabestreams in Text einer anderen Sprache. Diese Seite enthält Codebeispiele, die zeigen, wie Audiostreams mithilfe von Media Translation-Clientbibliotheken in Text übersetzt werden.
Projekt einrichten
Bevor Sie Media Translation verwenden können, müssen Sie ein Google Cloud-Projekt einrichten und die Media Translation API für dieses Projekt aktivieren.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Media Translation API.
-
Create a service account:
-
In the Google Cloud console, go to the Create service account page.
Go to Create service account - Select your project.
-
In the Service account name field, enter a name. The Google Cloud console fills in the Service account ID field based on this name.
In the Service account description field, enter a description. For example,
Service account for quickstart
. - Click Create and continue.
-
Grant the Project > Owner role to the service account.
To grant the role, find the Select a role list, then select Project > Owner.
- Click Continue.
-
Click Done to finish creating the service account.
Do not close your browser window. You will use it in the next step.
-
-
Create a service account key:
- In the Google Cloud console, click the email address for the service account that you created.
- Click Keys.
- Click Add key, and then click Create new key.
- Click Create. A JSON key file is downloaded to your computer.
- Click Close.
-
Set the environment variable
GOOGLE_APPLICATION_CREDENTIALS
to the path of the JSON file that contains your credentials. This variable applies only to your current shell session, so if you open a new session, set the variable again. - Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
- Installieren Sie die Clientbibliothek für die gewünschte Sprache.
Spracheingabe übersetzen
Die folgenden Codebeispiele zeigen, wie Sprache aus einer Datei mit bis zu fünf Minuten Audio oder live über ein Mikrofon übersetzt wird. Unter Best Practices finden Sie Empfehlungen zur Bereitstellung von Sprachdaten für eine optimale Erkennungsgenauigkeit.
Die wichtigsten Schritte sind unabhängig von der Audioquelle identisch:
Initialisieren Sie einen
SpeechTranslationServiceClient
-Client zum Senden von Anfragen an Media Translation.Sie können denselben Client für mehrere Anfragen verwenden.
Erstellen Sie ein
StreamingTranslateSpeechConfig
-Anfrageobjekt, das angibt, wie die Audiodaten verarbeitet werden.Das
StreamingTranslateSpeechConfig
-Objekt besteht aus einemTranslateSpeechConfig
-Objekt, das Informationen zur Audioquelldatei bereitstellt, und einersingle_utterance
-Eigenschaft, die angegibt, ob Media Translation die Übersetzung fortsetzt, wenn der Sprecher pausiert.Das
TranslateSpeechConfig
-Objekt stellt technische Daten für die Audioquelle bereit (z. B. Codierung und Abtastrate), legt die Quell- und Zielsprachen für die Übersetzung mit den jeweiligen BCP-47-Sprachcodes fest und definiert, welches Übersetzungsmodell von Media Translation für die Transkription verwendet wird.Senden Sie eine Sequenz von
StreamingTranslateSpeechRequest
-Anfrageobjekten.Sie senden eine Abfolge von Anfragen für jede Audiodatei, die Sie übersetzen möchten. Mit der ersten Anfrage wird das
StreamingTranslateSpeechConfig
-Objekt gesendet und mit den folgenden Anfragen der Audiostream.StreamingTranslateSpeechResult
-Anwortobjekt erhalten.Jede Antwort mit dem Wert
text_translation_result.is_final
vonfalse
wird empfangen, aber das neueste übersetzte Ergebnis überschreibt das vorherige Ergebnis.Wenn Media Translation ein Endergebnis hat, wird das Feld
text_translation_result.is_final
auftrue
gesetzt. Alle nachfolgenden erhaltenen Übersetzungsergebnisse werden an das vorherige Ergebnis angehängt. In diesem Fall wird das vorherige Ergebnis nicht überschrieben. Sie können die fertige Übersetzung ausgeben und mit einem neuen Abschnitt für den nächsten Teil der Transkription und der entsprechenden Audiodaten beginnen.Wenn der Lautsprecher gestoppt wurde und das Feld
single_utterance
imStreamingTranslateSpeechConfig
-Anfrageobjekt auf "true" festgelegt ist, gibt Media Translation einEND_OF_SINGLE_UTTERANCE
-Ereignis für dasspeech_event_type
in der Antwort zurück. Der Client sendet keine Anfragen mehr, erhält jedoch weiterhin Antworten, bis die Übersetzung fertig ist.Das Streaming ist auf 5 Minuten begrenzt. Bei Überschreitung dieses Limits wird der Fehler OUT_OF_RANGE zurückgegeben.
Codebeispiele
Sprache aus einer Audiodatei übersetzen
Java
Informationen zum Installieren und Verwenden der Clientbibliothek für Media Translation finden Sie unter Media Translation-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Media Translation API für Java.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Media Translation zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Informationen zum Installieren und Verwenden der Clientbibliothek für Media Translation finden Sie unter Media Translation-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Media Translation API für Node.js.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Media Translation zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Informationen zum Installieren und Verwenden der Clientbibliothek für Media Translation finden Sie unter Media Translation-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Media Translation API für Python.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Media Translation zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Sprache aus Mikrofoneingabe übersetzen
Java
Informationen zum Installieren und Verwenden der Clientbibliothek für Media Translation finden Sie unter Media Translation-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Media Translation API für Java.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Media Translation zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Informationen zum Installieren und Verwenden der Clientbibliothek für Media Translation finden Sie unter Media Translation-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Media Translation API für Node.js.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Media Translation zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Informationen zum Installieren und Verwenden der Clientbibliothek für Media Translation finden Sie unter Media Translation-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Media Translation API für Python.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Media Translation zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.