Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Dies ist die gRPC-API-Referenz für Speech-to-Text. Sie ist eine der vortrainierten Vertex AI APIs, die auf der Google Distributed Cloud Air-Gapped Appliance (GDC) verfügbar sind.
In diesem Leitfaden erfahren Sie, wie Sie Spracherkennungstechnologien programmatisch in Entwickleranwendungen einbinden. Sie können Audiodaten senden und eine Texttranskription vom Vertex AI Speech-to-Text API-Dienst empfangen. Wenn Sie beispielsweise Audio auf Spanisch einreichen, erhalten Sie eine entsprechende Texttranskription auf Spanisch.
Speech-to-Text-Methoden
In GDC stehen zwei Methoden zur Verfügung:
Recognize: Führt eine synchrone Spracherkennung durch. Recognize erhält Ergebnisse, nachdem alle Audiodaten gesendet und verarbeitet wurden.
StreamingRecognize: Führt bidirektionale Streamingspracherkennung durch. StreamingRecognize erhält Ergebnisse, während Audiodaten gesendet werden.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-12 (UTC)."],[],[],null,[]]