Über die Befehlszeile Audioinhalte aus Text erstellen

In diesem Dokument wird beschrieben, wie Sie eine Text-to-Speech-Anfrage über die Befehlszeile stellen. Weitere Informationen zu den grundlegenden Konzepten von Text-to-Speech finden Sie unter Grundlagen von Text-to-Speech.

Vorbereitung

Bevor Sie eine Anfrage an die Text-to-Speech API senden können, müssen Sie die folgenden Aktionen ausgeführt haben. Weitere Informationen finden Sie auf der Seite Vorbereitung.

Aktivieren Sie Text-to-Speech in einem GCP-Projekt.
Prüfen Sie, ob die Abrechnung für Text-to-Speech aktiviert ist.
Installieren Sie die Google Cloud CLI und melden Sie sich dann mit Ihrer föderierten Identität in der gcloud CLI an. Nach der Anmeldung initialisieren Sie die Google Cloud CLI mit folgendem Befehl:
```
gcloud init
```

Audioinhalte aus Text synthetisieren

Sie können Text in Audioinhalte umwandeln, wenn Sie eine HTTP-POST-Anfrage an den Endpunkt https://texttospeech.googleapis.com/v1/text:synthesize senden. Geben Sie dazu im Hauptteil des POST-Befehls im Konfigurationsabschnitt voice die Art der zu synthetisierenden Stimme an, im Abschnitt input im Feld text den zu synthetisierenden Text und im Abschnitt audioConfig die Art der zu erstellenden Audioinhalte.

Führen Sie unten in der Befehlszeile die REST-Anfrage aus, um mithilfe von Text-to-Speech Audioinhalte aus Text zu synthetisieren. Der Befehl ruft mit dem Befehl gcloud auth application-default print-access-token ein Autorisierungstoken für die Anfrage ab.

Ersetzen Sie Folgendes in den Anfragedaten:
- PROJECT_ID: die alphanumerische ID Ihres Google Cloud -Projekts
HTTP-Methode und URL:
```
POST https://texttospeech.googleapis.com/v1/text:synthesize
```
JSON-Text der Anfrage:
```
{
  "input": {
    "text": "Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets."
  },
  "voice": {
    "languageCode": "en-gb",
    "name": "en-GB-Standard-A",
    "ssmlGender": "FEMALE"
  },
  "audioConfig": {
    "audioEncoding": "MP3"
  }
}
```
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
curl (Linux, macOS oder Cloud Shell)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt haben, die Sie automatisch bei der gcloud CLI anmeldet. Um zu prüfen, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
```
curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: PROJECT_ID" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://texttospeech.googleapis.com/v1/text:synthesize"
```
PowerShell (Windows)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben, indem Sie gcloud init oder gcloud auth login ausgeführt haben. Um zu prüfen, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
```
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "PROJECT_ID" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://texttospeech.googleapis.com/v1/text:synthesize" | Select-Object -Expand Content
```
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
```
{
  "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.."
}
```
Die JSON-Ausgabe für den REST-Befehl enthält die synthetisierten Audioinhalte im Base64-codierten Format. Kopieren Sie den Inhalt des Felds audioContent in eine neue Datei mit dem Namen synthesize-output-base64.txt. Die neue Datei sieht etwa so aus:
```
//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o
...
VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
```
Decodieren Sie den Inhalt der Datei synthesize-output-base64.txt in eine neue Datei mit dem Namen synthesized-audio.mp3. Informationen zum Decodieren von Base64-codierten Inhalten finden Sie unter Base64-codierte Audioinhalte decodieren.
Linux
1. Kopieren Sie nur die Base64-codierten Inhalte in eine Textdatei.
2. Decodieren Sie die Datei, die den Quelltext enthält, mit dem Base64-Befehlszeilentool mit dem Flag -d:
```
    $ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
```
Mac OSX
1. Kopieren Sie nur die Base64-codierten Inhalte in eine Textdatei.
2. Decodieren Sie die Datei, die den Quelltext enthält, mit dem base64-Befehlszeilentool:
```
    $ base64 --decode SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
```
Windows
1. Kopieren Sie nur die Base64-codierten Inhalte in eine Textdatei.
2. Decodieren Sie die Datei, die den Quelltext enthält, mit dem Befehl certutil.
```
   certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE
```
Geben Sie den Inhalt von synthesized-audio.mp3 in einer Audioanwendung oder auf einem Audiogerät wieder. Sie können die Datei synthesized-audio.mp3 auch im Chrome-Browser öffnen, um die Audioinhalte abzuspielen. Gehen Sie hierfür zum Ordner mit der Datei, z. B. file://my_file_path/synthesized-audio.mp3.

Bereinigen

Wenn Sie das Projekt nicht mehr benötigen, löschen Sie es mit derGoogle Cloud console , um unnötige Kosten für die Google Cloud Platform zu vermeiden.

Weitere Informationen

Grundlagen der Cloud Text-to-Speech API
Liste der für synthetische Sprache verfügbaren Stimmen

Über die Befehlszeile Audioinhalte aus Text erstellen

Vorbereitung

Audioinhalte aus Text synthetisieren

curl (Linux, macOS oder Cloud Shell)

PowerShell (Windows)

Linux

Mac OSX

Windows

Bereinigen

Weitere Informationen