Interpretare i risultati delle previsioni dai modelli di monitoraggio degli oggetti video

Dopo aver richiesto una previsione, Vertex AI restituisce i risultati in base all'obiettivo del modello. Le previsioni da un modello di monitoraggio degli oggetti restituiscono l'ora e la posizione degli oggetti da monitorare, in base alle etichette definite. Il modello assegna un punteggio di affidabilità a ogni previsione, che comunica il livello di affidabilità con cui il modello ha identificato e monitorato accuratamente un oggetto. Più alto è il numero, maggiore è l'affidabilità del modello nella correttezza della previsione.

Esempio di output di previsione batch

Il seguente esempio è il risultato previsto per un modello che tiene traccia di cani e gatti in un video. Ciascun risultato include un'etichetta (cat o dog) per l'oggetto monitorato, un segmento di tempo che specifica quando e per quanto tempo l'oggetto viene monitorato e un riquadro di delimitazione che descrive la posizione dell'oggetto.

{
  "instance": {
   "content": "gs://bucket/video.mp4",
    "mimeType": "video/mp4",
    "timeSegmentStart": "1s",
    "timeSegmentEnd": "5s"
  }
  "prediction": [{
    "id": "1",
    "displayName": "cat",
    "timeSegmentStart": "1.2s",
    "timeSegmentEnd": "3.4s",
    "frames": [{
      "timeOffset": "1.2s",
      "xMin": 0.1,
      "xMax": 0.2,
      "yMin": 0.3,
      "yMax": 0.4
    }, {
      "timeOffset": "3.4s",
      "xMin": 0.2,
      "xMax": 0.3,
      "yMin": 0.4,
      "yMax": 0.5,
    }],
    "confidence": 0.7
  }, {
    "id": "1",
    "displayName": "cat",
    "timeSegmentStart": "4.8s",
    "timeSegmentEnd": "4.8s",
    "frames": [{
      "timeOffset": "4.8s",
      "xMin": 0.2,
      "xMax": 0.3,
      "yMin": 0.4,
      "yMax": 0.5,
    }],
    "confidence": 0.6
  }, {
    "id": "2",
    "displayName": "dog",
    "timeSegmentStart": "1.2s",
    "timeSegmentEnd": "3.4s",
    "frames": [{
      "timeOffset": "1.2s",
      "xMin": 0.1,
      "xMax": 0.2,
      "yMin": 0.3,
      "yMax": 0.4
    }, {
      "timeOffset": "3.4s",
      "xMin": 0.2,
      "xMax": 0.3,
      "yMin": 0.4,
      "yMax": 0.5,
    }],
    "confidence": 0.5
  }]
}