Bei der Texterkennung wird eine Optische Zeichenerkennung (OCR) durchgeführt, die Text in einem Eingabevideo erkennt und extrahiert.
Die Texterkennung ist für alle Sprachen verfügbar, die von der Cloud Vision API unterstützt werden.
Texterkennung für ein Video in Google Cloud Storage anfordern
Die folgenden Beispiele zeigen die Texterkennung für eine Datei in Cloud Storage.
REST
Anfrage zur Annotation eines Videos senden
Im Folgenden wird gezeigt, wie eine POST-Anfrage an die Methode videos:annotate
gesendet wird. In diesem Beispiel wird die Google Cloud CLI verwendet, um ein Zugriffstoken zu erstellen. Eine Anleitung zur Installation der gcloud CLI finden Sie in der Kurzanleitung zur Video Intelligence API.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- INPUT_URI: Ein Cloud Storage-Bucket, der die Datei enthält, die Sie annotieren möchten, einschließlich des Dateinamens. Muss mit
gs://
beginnen.
Beispiel:"inputUri": "gs://cloud-videointelligence-demo/assistant.mp4",
- LANGUAGE_CODE: [Optional] Beispiel: "en-US"
- PROJECT_NUMBER: Die numerische Kennung für Ihr Google Cloud-Projekt
HTTP-Methode und URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
JSON-Text anfordern:
{ "inputUri": "INPUT_URI", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten in etwa folgende JSON-Antwort erhalten:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Wenn die Antwort erfolgreich ist, gibt die Video Intelligence API den name
für Ihren Vorgang zurück. Das Beispiel oben zeigt eine solche Antwort, wobei project-number
die Nummer Ihres Projekts und operation-id
die ID des lang andauernden Vorgangs ist, der für die Anfrage erstellt wurde.
- PROJECT_NUMBER: Die Nummer Ihres Projekts
- LOCATION_ID: Die Cloud-Region, in der die Annotation stattfinden soll. Unterstützte Cloud-Regionen sind:
us-east1
,us-west1
,europe-west1
,asia-east1
. Wenn keine Region angegeben ist, wird eine Region basierend auf dem Speicherort der Videodatei festgelegt. - OPERATION_ID: Die ID des lang andauernden Vorgangs, der für die Anfrage erstellt und in der Antwort beim Start des Vorgangs angegeben wurde, z. B.
12345...
Ruft Annotationsergebnisse ab
Um das Ergebnis des Vorgangs abzurufen, führen Sie eine GET-Anfrage mithilfe des Vorgangsaufrufs, der vom Aufruf an Videos:Annotieren zurückgegeben wurde, wie im folgenden Beispiel gezeigt.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- OPERATION_NAME: Der von der Video Intelligence API zurückgegebene Name des Vorgangs. Der Vorgangsname hat das Format
projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID
. - PROJECT_NUMBER: Die numerische Kennung für Ihr Google Cloud-Projekt
HTTP-Methode und URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
Anmerkungen der Texterkennung werden in der ListetextAnnotations
zurückgegeben.
Hinweis: Das Feld done wird nur zurückgegeben, wenn sein Wert True ist.
Es ist nicht in Antworten enthalten, für die der Vorgang nicht abgeschlossen wurde.
Annotationsergebnisse herunterladen
Kopieren Sie die Annotation aus der Quelle in den Ziel-Bucket (siehe Dateien und Objekte kopieren)
gcloud storage cp gcs_uri gs://my-bucket
Hinweis: Wenn der Nutzer den Ausgabe-gcs-URI vom Nutzer bereitstellt, wird die Annotation in diesem gcs-uri gespeichert.
Go
Java
Richten Sie zur Authentifizierung bei Video Intelligence die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
Richten Sie zur Authentifizierung bei Video Intelligence die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Richten Sie zur Authentifizierung bei Video Intelligence die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Weitere Sprachen
C#: Folgen Sie der Anleitung zur Einrichtung von C# auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für .NET auf.
PHP: Folgen Sie der Anleitung zur Einrichtung von PHP auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für PHP auf.
Ruby: Folgen Sie der Anleitung zur Einrichtung von Ruby auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für Ruby auf.
Texterkennung für ein Video aus einer lokalen Datei anfordern
Die folgenden Beispiele zeigen die Texterkennung für eine lokal gespeicherte Datei.
REST
Anfrage zur Annotation eines Videos senden
Wenn Sie in einer lokalen Videodatei Annotationen erstellen möchten, codieren Sie den Inhalt der Videodatei mit Base64.
Fügen Sie den Base64-codierten Inhalt in das Feld inputContent
der Anfrage ein.
Informationen zum Base64-Codieren des Inhalts einer Videodatei finden Sie unter Base64-Codierung.
Das folgende Beispiel zeigt, wie Sie eine POST-Anfrage an die Methode videos:annotate
senden.
In diesem Beispiel wird die Google Cloud CLI verwendet, um ein Zugriffstoken zu erstellen.
Eine Anleitung zur Installation der Google Cloud CLI finden Sie in der Kurzanleitung zur Video Intelligence API.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- "inputContent": BASE64_ENCODED_CONTENT
Beispiel:
"UklGRg41AwBBVkkgTElTVAwBAABoZHJsYXZpaDgAAAA1ggAAxPMBAAAAAAAQCAA..."
- LANGUAGE_CODE: [Optional] Beispiel: "en-US"
- PROJECT_NUMBER: Die numerische Kennung für Ihr Google Cloud-Projekt
HTTP-Methode und URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
JSON-Text anfordern:
{ "inputContent": "BASE64_ENCODED_CONTENT", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten in etwa folgende JSON-Antwort erhalten:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Wenn die Antwort erfolgreich ist, gibt die Video Intelligence API den name
Ihres Vorgang zurück. Das Beispiel oben zeigt eine solche Antwort, wobei project-number
der Name Ihres Projekts und operation-id
die ID des lang andauernden Vorgangs ist, der für die Anfrage erstellt wurde.
- OPERATION_ID: Wird in der Antwort beim Start des Vorgangs angegeben, z. B.
12345...
Ruft Annotationsergebnisse ab
Um das Ergebnis des Vorgangs abzurufen, führen Sie eine GET-Anfrage mithilfe des Vorgangsaufrufs, der vom Aufruf an Videos:Annotieren zurückgegeben wurde, wie im folgenden Beispiel gezeigt.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_NUMBER: Die numerische Kennung für Ihr Google Cloud-Projekt
HTTP-Methode und URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
Annotationen der Texterkennung werden in der Liste textAnnotations
zurückgegeben.
Hinweis: Das Feld done wird nur zurückgegeben, wenn sein Wert True ist.
Es ist nicht in Antworten enthalten, für die der Vorgang nicht abgeschlossen wurde.
Go
Java
Node.js
Richten Sie zur Authentifizierung bei Video Intelligence die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
Weitere Sprachen
C#: Folgen Sie der Anleitung zur Einrichtung von C# auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für .NET auf.
PHP: Folgen Sie der Anleitung zur Einrichtung von PHP auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für PHP auf.
Ruby: Folgen Sie der Anleitung zur Einrichtung von Ruby auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für Ruby auf.