Vorhersageergebnisse von Videoklassifizierungsmodellen interpretieren

Nach der Anforderung einer Vorhersage gibt Vertex AI Ergebnisse basierend auf dem Ziel Ihres Modells zurück. Vorhersagen eines Klassifizierungsmodells geben Aufnahmen und Segmente in Ihren Videos zurück, die entsprechend Ihren eigenen definierten Labels klassifiziert wurden. Jeder Vorhersage wird ein Konfidenzwert zugewiesen.

Der Konfidenzwert gibt an, wie stark Ihr Modell die einzelnen Klassen oder Labels mit einem Testelement verknüpft. Je höher die Zahl, desto höher die Konfidenz des Modells, dass das Label auf dieses Element angewendet werden sollte. Sie entscheiden, wie hoch der Konfidenzwert für die Annahme der Ergebnisse des Modells sein muss.

Schieberegler für Punktzahl-Schwellenwert

In der Google Cloud Console bietet Vertex AI einen Schieberegler, mit dem der Konfidenschwellenzwert für alle Klassen oder Labels oder für eine einzelne Klasse oder ein einzelnes Label angepasst wird. Der Schieberegler ist auf der Detailseite eines Modells im Tab Bewerten verfügbar. Der Konfidenzschwellenwert ist das Konfidenzniveau, das das Modell haben muss, um einem Testelement eine Klasse oder ein Label zuzuweisen. Wenn Sie den Schwellenwert anpassen, können Sie sehen, wie sich die Genauigkeit und die Trefferquote des Modells ändern. Höhere Schwellenwerte erhöhen normalerweise die einzelne und verringern den Recall.

Beispielausgabe für eine Batchvorhersage

Das folgende Beispiel ist das vorhergesagte Ergebnis für ein Modell, das Katzen und Hunde in einem Video identifiziert. Das Ergebnis enthält Segment-, Aufnahme- und einsekündige Intervallklassifizierungen.

{
  "instance": {
   "content": "gs://bucket/video.mp4",
    "mimeType": "video/mp4",
    "timeSegmentStart": "1s",
    "timeSegmentEnd": "5s"
  }
  "prediction": [{
    "id": "1",
    "displayName": "cat",
    "type": "segment-classification",
    "timeSegmentStart": "1s",
    "timeSegmentEnd": "5s",
    "confidence": 0.7
  }, {
    "id": "1",
    "displayName": "cat",
    "type": "shot-classification",
    "timeSegmentStart": "1s",
    "timeSegmentEnd": "4s",
    "confidence": 0.9
  }, {
    "id": "2",
    "displayName": "dog",
    "type": "shot-classification",
    "timeSegmentStart": "4s",
    "timeSegmentEnd": "5s",
    "confidence": 0.6
  }, {
    "id": "1",
    "displayName": "cat",
    "type": "one-sec-interval-classification",
    "timeSegmentStart": "1s",
    "timeSegmentEnd": "1s",
    "confidence": 0.95
  }, {
    "id": "1",
    "displayName": "cat",
    "type": "one-sec-interval-classification",
    "timeSegmentStart": "2s",
    "timeSegmentEnd": "2s",
    "confidence": 0.9
  }, {
    "id": "1",
    "displayName": "cat",
    "type": "one-sec-interval-classification",
    "timeSegmentStart": "3s",
    "timeSegmentEnd": "3s",
    "confidence": 0.85
  }, {
    "id": "2",
    "displayName": "dog",
    "type": "one-sec-interval-classification",
    "timeSegmentStart": "4s",
    "timeSegmentEnd": "4s",
    "confidence": 0.6
  }]
}