Speech-to-Text – Preise

Vertrieb kontaktieren Zur Console

Die Kosten für Speech-to-Text basieren auf der Menge an Audiodaten, die pro Monat vom Dienst erfolgreich verarbeitet wurden, und werden im Sekundentakt abgerechnet. Wenn die API eine Antwort zurückgibt, wurde das in der Anfrage gesendete Audiomaterial erfolgreich verarbeitet. Dies beinhaltet eine leere Antwort, die darauf hinweist, dass die API die Audiodaten verarbeitet hat, sie jedoch nicht transkribieren konnte. Anfragen, die zu einem Serverfehler führen, gelten nicht als erfolgreich verarbeitet und verursachen daher keine Kosten.

Ihren aktuellen Abrechnungsstatus einschließlich der Nutzung und Ihrer aktuellen Rechnung finden Sie in der Google Cloud Console. Weitere Informationen zur Kontoverwaltung finden Sie in der Cloud Billing-Dokumentation oder im Cloud Billing-Support.

Speech-to-Text V2 API

Die Preise in der folgenden Tabelle gelten für Minuten Audio, die pro Monat für die Speech-to-Text v2 API verarbeitet werden.

Standarderkennungsmodelle

Kategorie	Modell	0 Minuten bis 500.000 Minuten	500.000 Minuten bis 1.000.000 Minuten	1.000.000 Minuten bis 2.000.000 Minuten	2.000.000 Minuten und mehr
Wiedererkennung (SKU:3099-B70F-0949)	Standard	0,016 $ / 1 minute, per 1 month / account	0,01 $ / 1 minute, per 1 month / account	0,008 $ / 1 minute, per 1 month / account	0,004 $ / 1 minute, per 1 month / account
Erkennung (protokolliert) (SKU:4292-8666-5DBB)	Standard	0,012 $ / 1 minute, per 1 month / account	0,0075 $ / 1 minute, per 1 month / account	0,006 $ / 1 minute, per 1 month / account	0,003 $ / 1 minute, per 1 month / account

Kategorie

Modell

0 Minuten bis 500.000 Minuten

500.000 Minuten bis 1.000.000 Minuten

1.000.000 Minuten bis 2.000.000 Minuten

2.000.000 Minuten und mehr

Wiedererkennung

(SKU:3099-B70F-0949)

Standard

0,016 $ / 1 minute, per 1 month / account

0,01 $ / 1 minute, per 1 month / account

0,008 $ / 1 minute, per 1 month / account

0,004 $ / 1 minute, per 1 month / account

Erkennung (protokolliert)

(SKU:4292-8666-5DBB)

Standard

0,012 $ / 1 minute, per 1 month / account

0,0075 $ / 1 minute, per 1 month / account

0,006 $ / 1 minute, per 1 month / account

0,003 $ / 1 minute, per 1 month / account

Medizinische Modelle

Kategorie	Modell	0 Minuten bis 60 Minuten	60 Minuten und länger
Medizinisches Diktat (SKU:6649-62EF-CB8F)	Medizin²	0 $ (Free) / 1 minute, per 1 month / account	0,078 $ / 1 minute, per 1 month / account
Medizinisches Gespräch (SKU:7247-19E1-FB4D)	Medizin²	0 $ (Free) / 1 minute, per 1 month / account	0,078 $ / 1 minute, per 1 month / account

Kategorie

Modell

0 Minuten bis 60 Minuten

60 Minuten und länger

Medizinisches Diktat

(SKU:6649-62EF-CB8F)

Medizin²

0 $ (Free) / 1 minute, per 1 month / account

0,078 $ / 1 minute, per 1 month / account

Medizinisches Gespräch

(SKU:7247-19E1-FB4D)

Medizin²

0 $ (Free) / 1 minute, per 1 month / account

0,078 $ / 1 minute, per 1 month / account

Dynamische Standard-Batcherkennung

Kategorie	Modell	Pro Minute
Dynamische Batcherkennung (SKU:7700-6778-EF8E)	Standard¹	0,003 $ / 1 minute, per 1 month / account
Dynamische Batcherkennung (protokolliert) (SKU:1315-DEF9-28A6)	Standard¹	0,00225 $ / 1 minute, per 1 month / account

Kategorie

Modell

Pro Minute

Dynamische Batcherkennung

(SKU:7700-6778-EF8E)

Standard¹

0,003 $ / 1 minute, per 1 month / account

Dynamische Batcherkennung (protokolliert)

(SKU:1315-DEF9-28A6)

Standard¹

0,00225 $ / 1 minute, per 1 month / account

Standard¹-Modelle umfassen: „default“, „command_and_search“, „ latest_short“, „ latest_long“, „phone_call“, „video“ und „chirp“ (nur Speech-to-Text V2)
Medical²-Modelle umfassen: Medical_conversation, Medical_dictation
Jede Anfrage wird auf die nächste volle 1 Sekunde aufgerundet.

Speech-to-Text V1 API

Die Preise in der folgenden Tabelle gelten für Minuten Audio, die pro Monat für die Speech-to-Text v1 API verarbeitet werden.

Kategorie	Modell	0 Minuten bis 60 Minuten	60 Minuten und länger
Spracherkennung (mit Daten-Logging) Artikelnummer:67F5-A183-E319	Standard¹	0 $ (Free) / 1 minute, per 1 month / account	0,016 $ / 1 minute, per 1 month / account
Spracherkennung (ohne Daten-Logging) SKU:FD95-66F5-3F5F	Standard¹	0 $ (Free) / 1 minute, per 1 month / account	0,024 $ / 1 minute, per 1 month / account
Spracherkennung (ohne Daten-Logging) SKU:6649-62EF-CB8F	Medizin²	0 $ (Free) / 1 minute, per 1 month / account	0,078 $ / 1 minute, per 1 month / account

Kategorie

Modell

0 Minuten bis 60 Minuten

60 Minuten und länger

Spracherkennung (mit Daten-Logging)

Artikelnummer:67F5-A183-E319

Standard¹

0 $ (Free) / 1 minute, per 1 month / account

0,016 $ / 1 minute, per 1 month / account

Spracherkennung (ohne Daten-Logging)

SKU:FD95-66F5-3F5F

Standard¹

0 $ (Free) / 1 minute, per 1 month / account

0,024 $ / 1 minute, per 1 month / account

Spracherkennung (ohne Daten-Logging)

SKU:6649-62EF-CB8F

Medizin²

0 $ (Free) / 1 minute, per 1 month / account

0,078 $ / 1 minute, per 1 month / account

Standard¹-Modelle umfassen: „default“, „command_and_search“, „ latest_short“, „ latest_long“, „phone_call“, „video“ und „chirp“ (nur Speech-to-Text V2)
Medical²-Modelle umfassen: Medical_conversation, Medical_dictation
Jede Anfrage wird auf die nächste volle 1 Sekunde aufgerundet.

Preisfaktoren

Die Preise für Speech-to-Text werden durch die folgenden Faktoren bestimmt:

Anzahl der in den Audiodaten erkannten Kanäle
Länge und Menge der gesendeten Audiodaten
Das von Ihnen verwendete Erkennungsmodell
Die von Ihnen verwendete Batch-Methode
Die von Ihnen verwendete API-Version

Mehrere Kanäle

Jeder Audiokanal wird separat abgerechnet. Wenn Sie Anfragen mit mehreren Kanälen senden, erfolgt die Abrechnung anhand der Gesamtlänge der verarbeiteten Audiodaten von allen Kanälen zusammen. Diese zeitbasierte Abrechnung unterscheidet sich von der Erfassung monatlicher Nutzungslimits. Bei Nutzungslimits wird nicht berücksichtigt, ob es mehrere Kanäle gibt, sondern es kommt nur auf die Länge der Audiodatei an. Wenn Sie beispielsweise eine Anfrage mit 30 Sekunden Audiolänge und 4 Kanälen senden, werden Ihnen 120 Sekunden in Rechnung gestellt, aber nur 30 Sekunden zählen für Ihr monatliches Kontingent. Weitere Informationen finden Sie auf der Seite Kontingente und Limits.

Dynamischer Batch

Die Speech-to-Text V2 API bietet eine Option zur Verwendung von dynamischem Batch. Dynamische Batchverarbeitung von Audioinhalten mit geringerer Dringlichkeit. Wenn Sie dynamische Batches aktivieren, wird Ihnen ein reduzierter Preis in Rechnung gestellt.

Große Arbeitslasten

Für Kunden mit sehr großen Arbeitslasten sind möglicherweise zusätzliche Mengenrabatte verfügbar. Kontaktieren Sie unser Vertriebsteam, um mehr zu erfahren.

Google Cloud-Preise

Wenn Sie Audiodateien für die Erkennung in Google Cloud Storage speichern oder andere Google Cloud-Ressourcen wie Google App Engine-Instanzen zusammen mit Speech-to-Text verwenden, wird Ihnen auch die Nutzung dieser Dienste in Rechnung gestellt. Im Preisrechner von Google Cloud können Sie die weiteren Kosten gemäß den aktuellen Preisen ermitteln.

Nächste Schritte

Speech-to-Text-Dokumentation.
Erste Schritte mit Speech-to-Text.
Preisrechner ausprobieren
Mehr über Speech-to-Text-Lösungen und Anwendungsfälle.

Individuelles Angebot einholen

Mit den „Pay as you go“-Preisen von Google Cloud bezahlen Sie nur für die Dienste, die Sie nutzen. Wenden Sie sich an unser Vertriebsteam, wenn Sie ein individuelles Angebot für Ihr Unternehmen erhalten möchten.

Vertrieb kontaktieren Zur Console