Speech-to-Text – Preise

Die Kosten für Speech-to-Text basieren auf der Menge an Audiodaten, die pro Monat vom Dienst erfolgreich verarbeitet wurden, und werden im Sekundentakt abgerechnet. Wenn die API eine Antwort zurückgibt, wurde das in der Anfrage gesendete Audiomaterial erfolgreich verarbeitet. Dies beinhaltet eine leere Antwort, die darauf hinweist, dass die API die Audiodaten verarbeitet hat, sie jedoch nicht transkribieren konnte. Anfragen, die zu einem Serverfehler führen, gelten nicht als erfolgreich verarbeitet und verursachen daher keine Kosten.

Ihren aktuellen Abrechnungsstatus einschließlich der Nutzung und Ihrer aktuellen Rechnung finden Sie in der Google Cloud Console. Weitere Informationen zur Kontoverwaltung finden Sie in der Cloud Billing-Dokumentation oder im Cloud Billing-Support.

Speech-to-Text V2 API

Die Preise in der folgenden Tabelle gelten für Minuten Audio, die pro Monat für die Speech-to-Text v2 API verarbeitet werden.

Standarderkennungsmodelle

Kategorie

Modell

0 Minuten bis 500.000 Minuten

500.000 Minuten bis 1.000.000 Minuten

1.000.000 Minuten bis 2.000.000 Minuten

2.000.000 Minuten und mehr

Wiedererkennung

(SKU:3099-B70F-0949)

Standard

0,016 $ / 1 minute, per 1 month / account0,01 $ / 1 minute, per 1 month / account0,008 $ / 1 minute, per 1 month / account0,004 $ / 1 minute, per 1 month / account

Erkennung (protokolliert)

(SKU:4292-8666-5DBB)

Standard

0,012 $ / 1 minute, per 1 month / account0,0075 $ / 1 minute, per 1 month / account0,006 $ / 1 minute, per 1 month / account0,003 $ / 1 minute, per 1 month / account

Medizinische Modelle

Kategorie

Modell

0 Minuten bis 60 Minuten

60 Minuten und länger

Medizinisches Diktat

(SKU:6649-62EF-CB8F)

Medizin²

0 $ (Free) / 1 minute, per 1 month / account0,078 $ / 1 minute, per 1 month / account

Medizinisches Gespräch

(SKU:7247-19E1-FB4D)

Medizin²

0 $ (Free) / 1 minute, per 1 month / account0,078 $ / 1 minute, per 1 month / account

Dynamische Standard-Batcherkennung

Kategorie

Modell

Pro Minute

Dynamische Batcherkennung

(SKU:7700-6778-EF8E)

Standard¹

0,003 $ / 1 minute, per 1 month / account

Dynamische Batcherkennung (protokolliert)

(SKU:1315-DEF9-28A6)


Standard¹

0,00225 $ / 1 minute, per 1 month / account
  • Standard¹-Modelle umfassen: „default“, „command_and_search“, „ latest_short“, „ latest_long“, „phone_call“, „video“ und „chirp“ (nur Speech-to-Text V2)
  • Medical²-Modelle umfassen: Medical_conversation, Medical_dictation
  • Jede Anfrage wird auf die nächste volle 1 Sekunde aufgerundet.

Speech-to-Text V1 API

Die Preise in der folgenden Tabelle gelten für Minuten Audio, die pro Monat für die Speech-to-Text v1 API verarbeitet werden.

Kategorie

Modell

0 Minuten bis 60 Minuten

60 Minuten und länger

Spracherkennung (mit Daten-Logging)

Artikelnummer:67F5-A183-E319

Standard¹

0 $ (Free) / 1 minute, per 1 month / account0,016 $ / 1 minute, per 1 month / account

Spracherkennung (ohne Daten-Logging)

SKU:FD95-66F5-3F5F

Standard¹

0 $ (Free) / 1 minute, per 1 month / account0,024 $ / 1 minute, per 1 month / account

Spracherkennung (ohne Daten-Logging)

SKU:6649-62EF-CB8F

Medizin²

0 $ (Free) / 1 minute, per 1 month / account0,078 $ / 1 minute, per 1 month / account
  • Standard¹-Modelle umfassen: „default“, „command_and_search“, „ latest_short“, „ latest_long“, „phone_call“, „video“ und „chirp“ (nur Speech-to-Text V2)
  • Medical²-Modelle umfassen: Medical_conversation, Medical_dictation
  • Jede Anfrage wird auf die nächste volle 1 Sekunde aufgerundet.

Preisfaktoren

Die Preise für Speech-to-Text werden durch die folgenden Faktoren bestimmt:

Mehrere Kanäle

Jeder Audiokanal wird separat abgerechnet. Wenn Sie Anfragen mit mehreren Kanälen senden, erfolgt die Abrechnung anhand der Gesamtlänge der verarbeiteten Audiodaten von allen Kanälen zusammen. Diese zeitbasierte Abrechnung unterscheidet sich von der Erfassung monatlicher Nutzungslimits. Bei Nutzungslimits wird nicht berücksichtigt, ob es mehrere Kanäle gibt, sondern es kommt nur auf die Länge der Audiodatei an. Wenn Sie beispielsweise eine Anfrage mit 30 Sekunden Audiolänge und 4 Kanälen senden, werden Ihnen 120 Sekunden in Rechnung gestellt, aber nur 30 Sekunden zählen für Ihr monatliches Kontingent. Weitere Informationen finden Sie auf der Seite Kontingente und Limits.

Dynamischer Batch

Die Speech-to-Text V2 API bietet eine Option zur Verwendung von dynamischem Batch. Dynamische Batchverarbeitung von Audioinhalten mit geringerer Dringlichkeit. Wenn Sie dynamische Batches aktivieren, wird Ihnen ein reduzierter Preis in Rechnung gestellt.

Große Arbeitslasten

Für Kunden mit sehr großen Arbeitslasten sind möglicherweise zusätzliche Mengenrabatte verfügbar. Kontaktieren Sie unser Vertriebsteam, um mehr zu erfahren.

Google Cloud-Preise

Wenn Sie Audiodateien für die Erkennung in Google Cloud Storage speichern oder andere Google Cloud-Ressourcen wie Google App Engine-Instanzen zusammen mit Speech-to-Text verwenden, wird Ihnen auch die Nutzung dieser Dienste in Rechnung gestellt. Im Preisrechner von Google Cloud können Sie die weiteren Kosten gemäß den aktuellen Preisen ermitteln.

Nächste Schritte

Individuelles Angebot einholen

Mit den „Pay as you go“-Preisen von Google Cloud bezahlen Sie nur für die Dienste, die Sie nutzen. Wenden Sie sich an unser Vertriebsteam, wenn Sie ein individuelles Angebot für Ihr Unternehmen erhalten möchten.


Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Console
Google Cloud