Mit Objekt-Tracking können in einem Eingabevideo oder Videosegmenten mehrere Objekte erkannt werden. Hierbei werden Labels (Tags) sowie die Position der Entitäten im Objekt Frame zurückgegeben.
Objekt-Tracking unterscheidet sich von der Labelerkennung. Während die Labelerkennung Labels für das gesamte Einzelbild ohne Markierungsrahmen bereitstellt, erkennt Objekt-Tracking einzelne Objekte und stellt ein Label zusammen mit einem Begrenzungsrahmen bereit, der die Position des Frames für jedes Objekt beschreibt. Beispielsweise können in einem Video, in dem Fahrzeuge eine Kreuzung überqueren, Labels wie "Auto", "Lkw", "Fahrrad", "Autoreifen", "Lichter", "Fenster" usw. erstellt werden. Jedes Label enthält eine Reihe von Markierungsrahmen, die die Stelle des Objekts im Einzelbild angeben. Jeder Markierungsrahmen enthält außerdem ein Zeitsegment mit einem Zeitversatz (Zeitstempel) für jedes Label, das den Zeitpunkt ab Beginn des Videos angibt. Die Annotation enthält außerdem zusätzliche Elementinformationen wie eine Element-ID, mit der Sie weitere Informationen zu diesem Element in der Google Knowledge Graph Search API finden können.
Rufen Sie die Methode annotate
auf und geben Sie OBJECT_TRACKING
in der features
an.
Sehen Sie sich den Video Intelligence API-Visualisierer an, um diese Funktion in Aktion zu sehen.
Ein Beispiel finden Sie in der Anleitung zum Objekt-Tracking und in der Anleitung Szenenwechsel erkennen.