Interpretare i risultati delle previsioni dai modelli di riconoscimento delle azioni video

Dopo aver richiesto una previsione, Vertex AI restituisce i risultati in base all'obiettivo del modello. Le previsioni da un modello di riconoscimento delle azioni restituiscono momenti di azioni, in base alle etichette che hai definito. Il modello assegna un punteggio di affidabilità a ogni previsione, che comunica il grado di affidabilità del modello che ha identificato accuratamente un'azione. Più elevato è il numero, maggiore è l'affidabilità del modello rispetto alla correttezza della previsione.

Esempio di output di previsione batch

Il seguente esempio è il risultato previsto per un modello che identifica le azioni "swing" e "jump" in un video. Ogni risultato include un'etichetta ("swing" o "jump") per l'azione identificata, un segmento di tempo con la stessa ora di inizio e di fine che specifica il momento dell'azione e un punteggio di affidabilità.

{
  "instance": {
   "content": "gs://bucket/video.mp4",
    "mimeType": "video/mp4",
    "timeSegmentStart": "1s",
    "timeSegmentEnd": "5s"
  }
  "prediction": [{
    "id": "1",
    "displayName": "swing",
    "timeSegmentStart": "1.2s",
    "timeSegmentEnd": "1.2s",
    "confidence": 0.7
  }, {
    "id": "2",
    "displayName": "jump",
    "timeSegmentStart": "3.4s",
    "timeSegmentEnd": "3.4s",
    "confidence": 0.5
  }]
}