Kontingente und Limits

In diesem Dokument sind die aktuell gültigen Einschränkungen und Nutzungslimits für die Cloud Speech-to-Text API aufgeführt. Bei Änderungen der Einschränkungen und Nutzungslimits wird die Seite entsprechend aktualisiert. Wir behalten uns das Recht vor, diese Limits zu ändern.

Sie können gegebenenfalls eine Kontingenterhöhung anfordern. Weitere Informationen zum Anzeigen und Verwalten Ihres Kontingents finden Sie auf der Seite „Kontingente“ von Google Cloud.

Wenn Sie Ihre Anfrage eingereicht haben, bittet Google Sie möglicherweise um weitere Informationen und teilt Ihnen mit, ob Ihre Anfrage erfolgreich war.

Limits für Inhalte

Inhalte werden in Form von Audiodaten entweder direkt im Feld content der Anfrage an Speech-to-Text übergeben oder es wird darauf in einem Google Cloud Storage-URI im Feld uri der Anfrage verwiesen. Bei allen Einzelanfragen, die in lokalen Dateien an die API gesendet werden, gilt ein Limit von 10 MB. Bei den Methoden Recognize und LongRunningRecognize gilt dieses Limit für die Größe der gesendeten Anfrage. Bei der Methode StreamingRecognize gilt das Limit von 10 MB sowohl für die anfängliche StreamingRecognize-Anfrage als auch die Größe jeder einzelnen Nachricht im Stream. Ein Überschreiten des Limits führt zu einem Fehler. Bei Anfragen, die mithilfe von Audiodaten in einem Google Cloud Storage-Bucket gesendet werden, besteht kein Größenlimit.

Bei der API gelten die folgenden Limits für die Größe des Inhalts (Änderungen vorbehalten):

Limit für Inhalte Audiolänge
Synchrone Anfragen ~ 1 Minute
Asynchrone Anfragen ~ 480 Minuten*
Streaminganfragen ~ 5 Minuten**

* Bei Audioinhalten, die länger als ~ 1 Minute sind, muss das Feld uri auf eine Audiodatei in Google Cloud Storage verweisen.
** Falls Sie Inhalte streamen müssen, die länger als 5 Minuten sind, lesen Sie die Anleitung für Endlos-Streaming.

Bei StreamingRecognize-Anfragen muss der Audioinhalt annähernd in Echtzeit gesendet werden.

Der Versuch, Inhalte über diese Limits für Inhalte hinaus zu verarbeiten, führt zu einem Fehler. Weitere Informationen finden Sie unter Fehlermeldungen und Fehlerbehebung.

Zusammen mit einer Anfrage können Sie auch eine PhraseSet-Ressource mit einer Liste der für die Anfrage spezifischen Wortgruppen bereitstellen. Einzelne Wörter zählen hierbei ebenfalls als Wortgruppe. Für einen solchen Kontext gelten folgende Limits.

Limit für die Sprachanpassung Wert
Wortgruppen pro Anfrage 5.000
Gesamtzeichen pro Anfrage 100.000
Zeichen pro Wortgruppe 100

Anfragelimits

Für Text-to-Speech gelten aktuell die folgenden API-Nutzungslimits (Änderungen vorbehalten):

Art des Limits Nutzungslimit
Anfragen pro 60 Sekunden* 900
Verarbeitung pro Tag 480 Stunden Audio

* Jede StreamingRecognize-Sitzung wird als separate Anfrage behandelt, auch wenn sie mehrere Frames von StreamingRecognizeRequest-Audio im Stream enthält.

Anfragen und/oder Versuche der Audioverarbeitung über diese Limits hinaus führen zu einem Fehler. Weitere Informationen finden Sie unter Fehlermeldungen und Fehlerbehebung.

Diese Limits gelten für alle Speech-to-Text-Entwicklerprojekte sowie für alle Anwendungen und IP-Adressen, die von einem bestimmten Entwicklerprojekt verwendet werden.