Bei der Texterkennung wird eine Optische Zeichenerkennung (OCR) durchgeführt, die Text in einem Eingabevideo erkennt und extrahiert.
Die Texterkennung ist für alle Sprachen verfügbar, die von der Cloud Vision API unterstützt werden.
Texterkennung für ein Video in Google Cloud Storage anfordern
Die folgenden Beispiele zeigen die Texterkennung für eine Datei in Cloud Storage.
REST & CMD LINE
Anfrage zur Annotation eines Videos senden
Im Folgenden wird gezeigt, wie eine POST-Anfrage an die Methode videos:annotate
gesendet wird. In diesem Beispiel wird das Zugriffstoken für ein Dienstkonto verwendet, das mit dem Cloud SDK eingerichtet wurde. Anleitungen zur Installation des Cloud SDK, zur Einrichtung eines Projekts mit einem Dienstkonto und zur Anforderung eines Zugriffstokens finden Sie in der Kurzanleitung zur Video Intelligence API.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- INPUT_URI: Ein Cloud Storage-Bucket, der die Datei enthält, die Sie annotieren möchten, einschließlich des Dateinamens. Muss mit
gs://
beginnen.
Beispiel:"inputUri": "gs://cloud-videointelligence-demo/assistant.mp4",
- LANGUAGE_CODE: [Optional] Beispiel: "en-US"
HTTP-Methode und URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
JSON-Text anfordern:
{ "inputUri": "INPUT_URI", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten in etwa folgende JSON-Antwort erhalten:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Wenn die Antwort erfolgreich ist, gibt die Video Intelligence API den name
für Ihren Vorgang zurück. Das Beispiel oben zeigt eine solche Antwort, wobei project-number
die Nummer Ihres Projekts und operation-id
die ID des lang andauernden Vorgangs ist, der für die Anfrage erstellt wurde.
- PROJECT_NUMBER: Die Nummer Ihres Projekts
- LOCATION_ID: Die Cloud-Region, in der die Annotation stattfinden soll. Unterstützte Cloud-Regionen sind:
us-east1
,us-west1
,europe-west1
,asia-east1
. Wenn keine Region angegeben ist, wird eine Region basierend auf dem Speicherort der Videodatei festgelegt. - OPERATION_ID: Die ID des lang andauernden Vorgangs, der für die Anfrage erstellt und in der Antwort beim Start des Vorgangs angegeben wurde, z. B.
12345...
Ruft Annotationsergebnisse ab
Um das Ergebnis des Vorgangs abzurufen, führen Sie eine GET-Anfrage mithilfe des Vorgangsaufrufs, der vom Aufruf an Videos:Annotieren zurückgegeben wurde, wie im folgenden Beispiel gezeigt.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- OPERATION_NAME: Der von der Video Intelligence API zurückgegebene Name des Vorgangs. Der Vorgangsname hat das Format
projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID
.
HTTP-Methode und URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten in etwa folgende JSON-Antwort erhalten:
Anmerkungen der Texterkennung werden alstextAnnotations
-Liste zurückgegeben.
Hinweis: Das Feld done wird nur zurückgegeben, wenn sein Wert True ist.
Es ist nicht in Antworten enthalten, für die der Vorgang nicht abgeschlossen wurde.
Annotationsergebnisse herunterladen
Kopieren Sie die Annotation aus der Quelle in den Ziel-Bucket (siehe Dateien und Objekte kopieren)
gsutil cp gcs_uri gs://my-bucket
Hinweis: Wenn der Nutzer den Ausgabe-gcs-URI vom Nutzer bereitstellt, wird die Annotation in diesem gcs-uri gespeichert.
Go
Java
Node.js
Python
Weitere Sprachen
C#: Folgen Sie der Anleitung zur Einrichtung von C# auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für .NET auf.
PHP: Folgen Sie der Anleitung zur Einrichtung von PHP auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für PHP auf.
Ruby: Folgen Sie der Anleitung zur Einrichtung von Ruby auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für Ruby auf.
Texterkennung für ein Video aus einer lokalen Datei anfordern
Die folgenden Beispiele zeigen die Texterkennung für eine lokal gespeicherte Datei.
REST & CMD LINE
Anfrage zur Annotation eines Videos senden
Wenn Sie in einer lokalen Videodatei Annotationen erstellen möchten, codieren Sie den Inhalt der Videodatei mit Base64.
Fügen Sie den Base64-codierten Inhalt in das Feld inputContent
der Anfrage ein.
Informationen zum Base64-Codieren des Inhalts einer Videodatei finden Sie unter Base64-Codierung.
Das folgende Beispiel zeigt, wie Sie eine POST-Anfrage an die Methode videos:annotate
senden.
In diesem Beispiel wird das Zugriffstoken für ein Dienstkonto verwendet, das mit dem Cloud SDK eingerichtet wurde.
Anleitungen zur Installation des Cloud SDK, zur Einrichtung eines Projekts mit einem Dienstkonto und zur Anforderung eines Zugriffstokens finden Sie in der Kurzanleitung zur Video Intelligence API.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- "inputContent": BASE64_ENCODED_CONTENT
Beispiel:
"UklGRg41AwBBVkkgTElTVAwBAABoZHJsYXZpaDgAAAA1ggAAxPMBAAAAAAAQCAA..."
- LANGUAGE_CODE: [Optional] Beispiel: "en-US"
HTTP-Methode und URL:
POST https://videointelligence.googleapis.com/v1/videos:annotate
JSON-Text anfordern:
{ "inputContent": "BASE64_ENCODED_CONTENT", "features": ["TEXT_DETECTION"], "videoContext": { "textDetectionConfig": { "languageHints": ["LANGUAGE_CODE"] } } }
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten in etwa folgende JSON-Antwort erhalten:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/operations/OPERATION_ID" }
Wenn die Antwort erfolgreich ist, gibt die Video Intelligence API den name
Ihres Vorgang zurück. Das Beispiel oben zeigt eine solche Antwort, wobei project-number
der Name Ihres Projekts und operation-id
die ID des lang andauernden Vorgangs ist, der für die Anfrage erstellt wurde.
- OPERATION_ID: Wird in der Antwort beim Start des Vorgangs angegeben, z. B.
12345...
Ruft Annotationsergebnisse ab
Um das Ergebnis des Vorgangs abzurufen, führen Sie eine GET-Anfrage mithilfe des Vorgangsaufrufs, der vom Aufruf an Videos:Annotieren zurückgegeben wurde, wie im folgenden Beispiel gezeigt.
HTTP-Methode und URL:
GET https://videointelligence.googleapis.com/v1/OPERATION_NAME
Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:
Sie sollten in etwa folgende JSON-Antwort erhalten:
Annotationen der Texterkennung werden in der Liste textAnnotations
zurückgegeben.
Hinweis: Das Feld done wird nur zurückgegeben, wenn sein Wert True ist.
Es ist nicht in Antworten enthalten, für die der Vorgang nicht abgeschlossen wurde.
Go
Java
Node.js
Python
Weitere Sprachen
C#: Folgen Sie der Anleitung zur Einrichtung von C# auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für .NET auf.
PHP: Folgen Sie der Anleitung zur Einrichtung von PHP auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für PHP auf.
Ruby: Folgen Sie der Anleitung zur Einrichtung von Ruby auf der Seite der Clientbibliotheken und rufen Sie dann die Video Intelligence-Referenzdokumentation für Ruby auf.