Preise

Die Preise für Cloud Speech-to-Text werden monatlich auf der Grundlage der vom Dienst erfolgreich verarbeiteten Audiolänge berechnet, wobei die verarbeiteten Mengen auf jeweils 15 Sekunden aufgerundet werden.

Ihren aktuellen Abrechnungsstatus einschließlich Nutzung und Ihrer aktuellen Rechnung finden Sie in der Cloud Console auf der Abrechnungsseite. Weitere Informationen zur Kontoverwaltung finden Sie in der Cloud Billing-Dokumentation und unter Support zu Abrechnung und Zahlungen.

Preistabelle

Funktion Standardmodelle
(alle Modelle bis auf erweiterte Telefonanrufe und Video)
Premiummodelle*
(erweiterte Telefonanrufe, Video)
0 bis 60 Minuten Über 60 bis 1 Million Minuten 0 bis 60 Minuten Über 60 bis 1 Million Minuten
Spracherkennung (ohne Daten-Logging – Standard) Kostenlos 0,006 $/15 Sekunden** Kostenlos 0,009 $/15 Sekunden**
Spracherkennung (mit optionalem Daten-Logging) Kostenlos 0,004 $/15 Sekunden** Kostenlos 0,006 $/15 Sekunden**

* Diese Modelle sind momentan nur für den US-amerikanischen Markt verfügbar.

** Jede Anfrage wird auf die nächsten vollen 15 Sekunden aufgerundet.

Der Preis für Speech-to-Text wird primär durch zwei Faktoren beeinflusst:

  • Das verwendete Spracherkennungsmodell: Standard oder Premium
  • Daten-Logging: Aktiviert oder nicht aktiviert

Für die Spracherkennung von Speech-to-Text können unterschiedliche Modelle für maschinelles Lernen eingesetzt werden. Die zwei Modelle "erweiterte Telefonanrufe" und "Video" bieten beispielsweise eine optimierte Spracherkennung. Jedes Modell ist auf einen konkreten Anwendungsfall zugeschnitten. Bei richtiger Nutzung können so qualitativ hochwertige Ergebnisse geliefert werden.

Wenn Kunden Daten-Logging aktivieren, erlauben sie Google dadurch, die an Speech-to-Text gesendeten Audiodaten zu speichern. Mit diesen Daten kann Google wiederum die Modelle für maschinelles Lernen verbessern, die zur Sprachtranskription verwendet werden. Kunden, die das Daten-Logging aktivieren, können Speech-to-Text zu einem vergünstigten Preis nutzen.

Diese Preise gelten für Apps auf privaten Systemen (z. B. Smartphones, Tablets, Laptops, Desktops). Bitte kontaktieren Sie uns, um eine Genehmigung und die Preise für die Nutzung der Speech-to-Text API auf eingebetteten Geräten zu erhalten (z. B. Fahrzeugen, Fernsehgeräten, Haushaltsgeräten oder Lautsprechern).

Jede Anfrage wird auf die nächsten vollen 15 Sekunden aufgerundet. Wenn Sie beispielsweise drei separate Anfragen mit jeweils sieben Sekunden Audio senden, werden insgesamt 0,018 $ für 45 Sekunden Audio (3 × 15 Sekunden) berechnet. Die Aufrundung auf den nächsten 15-Sekunden-Schritt erfolgt auch bei Bruchteilen von Sekunden. Für 15,14 Sekunden werden z. B. 30 Sekunden in Rechnung gestellt.

Die monatliche Nutzung ist auf 1 Million Minuten beschränkt. Bei einer Nutzung von mehr als 1 Million Minuten Audio monatlich möchten wir gern mehr über Ihren Bedarf erfahren. Senden Sie uns in diesem Fall für Ihr Projekt eine Kontingentanfrage für die Cloud Speech-to-Text API.

Google Cloud Platform-Kosten

Wenn Sie Audiodateien für die Erkennung in Google Cloud Storage speichern oder andere Google Cloud Platform-Ressourcen wie Google App Engine-Instanzen zusammen mit der Speech-to-Text API verwenden, wird Ihnen auch die Nutzung dieser Dienste in Rechnung gestellt. Im Google Cloud Platform-Preisrechner können Sie die weiteren Kosten anhand der aktuellen Preise ermitteln.

Hat Ihnen diese Seite weitergeholfen? Teilen Sie uns Ihr Feedback mit:

Feedback geben zu...

Cloud Speech-to-Text API – Dokumentation