Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Bei der Texterkennung wird die visuelle Zeichenerkennung (OCR) verwendet, um sichtbaren Text aus Frames in einem Video oder Videosegmenten zu erkennen. Der erkannte Text wird zusammen mit Informationen zur Position und zum Zeitstempel auf Frameebene im Video für diesen Text zurückgegeben.
Die Texterkennung ist besonders nützlich für Medien- und Unterhaltungszwecke, z. B. um Besetzungslisten am Ende von Fernsehsendungen und Filmen zu erkennen und zu extrahieren oder um eingebrannte Untertitel zu erkennen.
Die Texterkennung ist für die Sprachen verfügbar, die von der Cloud Vision API unterstützt werden.
Rufen Sie die Methode annotate auf und geben Sie TEXT_DETECTION in das Feld features an, um sichtbaren Text aus einem Video oder Videosegment zu erkennen.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-01-31 (UTC)."],[],[]]