Speech-to-Text – Preise
Die Preise für Speech-to-Text basieren auf der Menge an Audiodaten, die pro Monat vom Dienst erfolgreich verarbeitet wurden, in Schritten von einer Sekunde. Wenn die API eine Antwort zurückgibt, wurde das in der Anfrage gesendete Audio erfolgreich verarbeitet. Die Antwort enthält eine leere Antwort. Dies bedeutet, dass die API den Audioinhalt verarbeitet, aber nicht transkribieren konnte. Anfragen, die zu einem Serverfehler führen, zählen nicht als erfolgreich verarbeitet und verursachen somit keine Kosten.
Sie können Ihren aktuellen Abrechnungsstatus, einschließlich der Nutzung und Ihrer aktuellen Rechnung, in der Google Cloud Console aufrufen. Weitere Informationen zur Kontoverwaltung finden Sie in der Dokumentation zu Cloud Billing und unter Cloud Billing Support.
Preistabelle
Die Preise in der folgenden Tabelle beziehen sich auf die Höhe der verarbeiteten Audiominuten pro Monat.
Kategorie | Modelle | Preise | |
---|---|---|---|
0–60 Minuten/Monat | Mehr als 60 Minuten/Monat | ||
Spracherkennung (ohne Daten-Logging – Standard) | Standard 1 | Kostenlos | 0,024 $ / Minute ** |
Medizinisch2 | Kostenlos | 0,078 $ / Minute ** | |
Spracherkennung (mit Daten-Logging) | Standard 1 | Kostenlos | 0,016 $ / Minute ** |
Standard1-Modelle sind: default
, command_and_search
, latest_short
, latest_long
, phone_call
, video
.
Medizinische Modelle sind: medical_conversation
, medical_dictation
.
** Jede Anfrage wird auf den nächsten 1-Sekunden-Schritt aufgerundet.
Preisfaktoren
Die Preise für Speech-to-Text werden durch die folgenden Faktoren bestimmt:
- Aktivierung von Daten-Logging
- Anzahl der in den Audiodaten erkannten Kanäle
- Länge und Menge der gesendeten Audioinhalte
Daten-Logging
Wenn Sie Daten-Logging aktivieren, kann Google die an Speech-to-Text gesendeten Audiodaten aufzeichnen. Damit können wiederum die Modelle für maschinelles Lernen verbessert werden, die zur Sprachtranskription verwendet werden. Kunden, die das Daten-Logging aktivieren, können Speech-to-Text zu einem vergünstigten Preis nutzen.
Mehrere Kanäle
Jeder Audiokanal wird separat abgerechnet. Wenn Sie Anfragen mit mehreren Kanälen senden, erfolgt die Abrechnung anhand der Gesamtlänge der verarbeiteten Audiodaten von allen Kanälen zusammen. Diese zeitbasierte Abrechnung unterscheidet sich von der Erfassung monatlicher Nutzungslimits. Bei Nutzungslimits wird nicht berücksichtigt, ob es mehrere Kanäle gibt, sondern es kommt nur auf die Länge der Audiodatei an. Wenn Sie beispielsweise eine Anfrage mit 30 Sekunden Audiolänge und 4 Kanälen senden, werden Ihnen 120 Sekunden in Rechnung gestellt, aber nur 30 Sekunden zählen für Ihr monatliches Kontingent. Weitere Details finden Sie unter Kontingente und Limits.
Große Arbeitslasten
Für Kunden mit sehr großen Arbeitslasten können zusätzliche Mengenrabatte verfügbar sein. Weitere Informationen erhalten Sie vom Vertrieb.
Google Cloud Platform-Kosten
Wenn Sie Audiodateien für die Erkennung in Google Cloud Storage speichern oder andere Google Cloud Platform-Ressourcen wie Google App Engine-Instanzen zusammen mit der Speech-to-Text API verwenden, wird Ihnen auch die Nutzung dieser Dienste in Rechnung gestellt. Im Google Cloud Platform-Preisrechner können Sie die weiteren Kosten gemäß den aktuellen Preisen ermitteln.
Nächste Schritte
- Lesen Sie die Speech-to-Text-Dokumentation.
- Erste Schritte mit Speech-to-Text.
- Preisrechner ausprobieren
- Mehr über Speech-to-Text-Lösungen und Anwendungsfälle.