Diese Seite wurde von der Cloud Translation API übersetzt.

Texterkennung

Bei der Texterkennung wird die visuelle Zeichenerkennung (OCR) verwendet, um sichtbaren Text aus Frames in einem Video oder Videosegmenten zu erkennen. Der erkannte Text wird zusammen mit Informationen zur Position und zum Zeitstempel auf Frameebene im Video für diesen Text zurückgegeben.

Die Texterkennung ist besonders nützlich für Medien- und Unterhaltungszwecke, z. B. um Besetzungslisten am Ende von Fernsehsendungen und Filmen zu erkennen und zu extrahieren oder um eingebrannte Untertitel zu erkennen.

Die Texterkennung ist für die Sprachen verfügbar, die von der Cloud Vision API unterstützt werden.

Rufen Sie die Methode annotate auf und geben Sie TEXT_DETECTION in das Feld features an, um sichtbaren Text aus einem Video oder Videosegment zu erkennen.

Sehen Sie sich den Video Intelligence API-Visualisierer an, um diese Funktion in Aktion zu sehen.

Beispiele für das Anfordern der Texterkennung und das Abrufen der annotierten Ergebnisse finden Sie unter Texterkennung.