In diesem Abschnitt wird gezeigt, wie Sie Streamingaudio, das z. B. mit einem Mikrofon aufgenommen wurde, in Text transkribieren können.
Mit einer Streamingspracherkennung können Sie Audiodaten zu Speech-to-Text streamen. Sie erhalten dann bei der Verarbeitung dieser Audiodaten die Ergebnisse der Streamingspracherkennung in Echtzeit. Weitere Informationen zu Anfragen für die Streamingspracherkennung finden Sie unter Audiobeschränkungen. Die Streamingspracherkennung ist nur über gRPC verfügbar.
Streamingspracherkennung für eine lokale Datei ausführen
Im Folgenden finden Sie ein Beispiel für eine Streamingspracherkennung für eine lokale Audiodatei. Für alle an die API gesendeten Streaminganfragen gilt eine Begrenzung von 10 MB. Dieses Limit gilt sowohl für die erste StreamingRecognize
-Anfrage als auch für die Größe jeder einzelnen Nachricht im Stream. Ein Überschreiten des Limits führt zu einem Fehler.
Go
Informationen zum Installieren und Verwenden der Clientbibliothek für Speech-to-Text finden Sie unter Speech-to-Text-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Speech-to-Text Go API.
Richten Sie zur Authentifizierung bei Speech-to-Text Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Informationen zum Installieren und Verwenden der Clientbibliothek für Speech-to-Text finden Sie unter Speech-to-Text-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Speech-to-Text Java API.
Richten Sie zur Authentifizierung bei Speech-to-Text Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Informationen zum Installieren und Verwenden der Clientbibliothek für Speech-to-Text finden Sie unter Speech-to-Text-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Speech-to-Text Node.js API.
Richten Sie zur Authentifizierung bei Speech-to-Text Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Informationen zum Installieren und Verwenden der Clientbibliothek für Speech-to-Text finden Sie unter Speech-to-Text-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Speech-to-Text Python API.
Richten Sie zur Authentifizierung bei Speech-to-Text Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Weitere Sprachen
C#: Folgen Sie der Anleitung zur Einrichtung von C# auf der Seite "Clientbibliotheken" und rufen Sie dann die Speech-to-Text-Referenzdokumentation für .NET auf.
PHP: Folgen Sie der Anleitung zur Einrichtung von PHP auf der Seite "Clientbibliotheken" und rufen Sie dann die Speech-to-Text-Referenzdokumentation für PHP auf.
Ruby: Folgen Sie der Anleitung zur Einrichtung von Ruby auf der Seite "Clientbibliotheken" und rufen Sie dann die Speech-to-Text-Referenzdokumentation für Ruby auf.
Sie können zwar eine lokale Audiodatei an die Speech-to-Text API streamen, für Ergebnisse im Batchmodus wird allerdings die synchrone oder asynchrone Audioerkennung empfohlen.
Streamingspracherkennung für einen Audiostream ausführen
Speech-to-Text kann die Erkennung auch beim Streaming von Audiodaten in Echtzeit durchführen.
Hier ist ein Beispiel für die Durchführung der Streamingspracherkennung für einen Audiostream, der von einem Mikrofon empfangen wird:
Go
Informationen zum Installieren und Verwenden der Clientbibliothek für Speech-to-Text finden Sie unter Speech-to-Text-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Speech-to-Text Go API.
Richten Sie zur Authentifizierung bei Speech-to-Text Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Informationen zum Installieren und Verwenden der Clientbibliothek für Speech-to-Text finden Sie unter Speech-to-Text-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Speech-to-Text Python API.
Richten Sie zur Authentifizierung bei Speech-to-Text Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Informationen zum Installieren und Verwenden der Clientbibliothek für Speech-to-Text finden Sie unter Speech-to-Text-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Speech-to-Text Java API.
Richten Sie zur Authentifizierung bei Speech-to-Text Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Für dieses Beispiel ist die SoX erforderlich, das in $PATH
verfügbar sein muss.
- Für MacOS:
brew install sox
. - Für die meisten Linux-Distributionen:
sudo apt-get install sox libsox-fmt-all
. - Bei Windows: Laden Sie die Binärdateien herunter.
Weitere Informationen zum Installieren und Erstellen eines Speech-to-Text-Clients finden Sie unter Speech-to-Text-Clientbibliotheken.
Weitere Sprachen
C#: Folgen Sie der Anleitung zur Einrichtung von C# auf der Seite "Clientbibliotheken" und rufen Sie dann die Speech-to-Text-Referenzdokumentation für .NET auf.
PHP: Folgen Sie der Anleitung zur Einrichtung von PHP auf der Seite "Clientbibliotheken" und rufen Sie dann die Speech-to-Text-Referenzdokumentation für PHP auf.
Ruby: Folgen Sie der Anleitung zur Einrichtung von Ruby auf der Seite "Clientbibliotheken" und rufen Sie dann die Speech-to-Text-Referenzdokumentation für Ruby auf.
Endlos-Streamingspracherkennung ausführen
Hier ist ein Beispiel für die Durchführung der Streamingspracherkennung für einen endlosen Audiostream, der von einem Mikrofon empfangen wird:
Python
Informationen zum Installieren und Verwenden der Clientbibliothek für Speech-to-Text finden Sie unter Speech-to-Text-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Speech-to-Text Python API.
Richten Sie zur Authentifizierung bei Speech-to-Text Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Java
Informationen zum Installieren und Verwenden der Clientbibliothek für Speech-to-Text finden Sie unter Speech-to-Text-Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Speech-to-Text Java API.
Richten Sie zur Authentifizierung bei Speech-to-Text Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Für dieses Beispiel ist die SoX erforderlich, das in $PATH
verfügbar sein muss.
- Für MacOS:
brew install sox
. - Für die meisten Linux-Distributionen:
sudo apt-get install sox libsox-fmt-all
. - Bei Windows: Laden Sie die Binärdateien herunter.
Weitere Informationen zum Installieren und Erstellen eines Speech-to-Text-Clients finden Sie unter Speech-to-Text-Clientbibliotheken.
Nächste Schritte
Überzeugen Sie sich selbst
Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie einfach ein Konto, um die Leistungsfähigkeit von Speech-to-Text in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
Speech-to-Text kostenlos testen