Vorhersageergebnisse von Video-Aktionserkennungsmodellen interpretieren

Nach der Anforderung einer Vorhersage gibt Vertex AI Ergebnisse basierend auf dem Ziel Ihres Modells zurück. Vorhersagen aus einem Aktionserkennungsmodell geben Momente von Aktionen gemäß Ihren eigenen definierten Labels zurück. Das Modell weist jeder Vorhersage einen Konfidenzwert zu. Dieser gibt an, wie sicher das Modell eine Aktion korrekt identifiziert hat. Je höher die Zahl, desto höher die Konfidenz des Modells in Bezug auf die Richtigkeit der Vorhersage.

Beispielausgabe für eine Batchvorhersage

Das folgende Beispiel ist das vorhergesagte Ergebnis für ein Modell, das die "swing"- und "jump"-Aktionen in einem Video identifiziert. Jedes Ergebnis enthält ein Label ("swing" oder "jump") für die identifizierte Aktion, ein Zeitsegment mit derselben Start- und Endzeit, das den Moment der Aktion angibt, sowie einen Konfidenzwert.

{
  "instance": {
   "content": "gs://bucket/video.mp4",
    "mimeType": "video/mp4",
    "timeSegmentStart": "1s",
    "timeSegmentEnd": "5s"
  }
  "prediction": [{
    "id": "1",
    "displayName": "swing",
    "timeSegmentStart": "1.2s",
    "timeSegmentEnd": "1.2s",
    "confidence": 0.7
  }, {
    "id": "2",
    "displayName": "jump",
    "timeSegmentStart": "3.4s",
    "timeSegmentEnd": "3.4s",
    "confidence": 0.5
  }]
}