Interpréter les résultats des prédictions à partir de modèles de reconnaissance d'actions dans les vidéos

Une fois que vous avez demandé une prédiction, Vertex AI renvoie les résultats en fonction de l'objectif du modèle. Les prédictions d'un modèle de reconnaissance des actions renvoient des moments d'actions sur la base de vos propres étiquettes. Le modèle attribue à chaque prédiction un score de confiance qui indique le degré de confiance avec lequel votre modèle a correctement identifié une action. Plus le score est élevé, plus le niveau de confiance du modèle est élevé.

Exemple de résultat de prédiction par lot

L'exemple suivant est un résultat de prédiction obtenu avec un modèle qui identifie les actions "swing" (balancement) et "jump" (saut) dans une vidéo. Chaque résultat inclut une étiquette ("swing" ou "jump") pour l'action identifiée, un segment de temps qui inclut des horodatages de début et de fin indiquant le moment de l'action et un score de confiance.

{
  "instance": {
   "content": "gs://bucket/video.mp4",
    "mimeType": "video/mp4",
    "timeSegmentStart": "1s",
    "timeSegmentEnd": "5s"
  }
  "prediction": [{
    "id": "1",
    "displayName": "swing",
    "timeSegmentStart": "1.2s",
    "timeSegmentEnd": "1.2s",
    "confidence": 0.7
  }, {
    "id": "2",
    "displayName": "jump",
    "timeSegmentStart": "3.4s",
    "timeSegmentEnd": "3.4s",
    "confidence": 0.5
  }]
}