Guida al rilevatore di persone/veicoli

Scheda del modello di rilevamento di persone e veicoli nella console

Il modello Rilevatore di persone/veicoli consente di rilevare e conteggiare persone o veicoli* nelle inquadrature dei video. Il modello accetta uno stream video come input e genera un buffer di protocollo con il conteggio di persone e veicoli rilevati in ogni fotogramma. Il modello viene eseguito a 6 FPS.

* Auto, autobus, camion, biciclette, motociclette e ambulanze.

Output del modello

Il modello di rilevamento di persone/veicoli mostra il numero di persone e veicoli rilevati nell'attuale frame elaborato. Di seguito è riportata la definizione del buffer di protocollo dell'output del modello. La frequenza dello stream di output è costante: un frame al secondo.

// The prediction result proto for Person/Vehicle Detection.
message OccupancyCountingPredictionResult {

 // Current timestamp.
 google.protobuf.Timestamp current_time = 1;

 // The entity info for annotations from the model.
 message Entity {
   // Label id.
   int64 label_id = 1;
   // Human readable string of the label.
   string label_string = 2;
 }

 // Identified box contains location and the entity of the object.
 message IdentifiedBox {
   // An unique id for this box.
   int64 box_id = 1;
   // Bounding Box in the normalized coordinates.
   message NormalizedBoundingBox {
     // Min in x coordinate.
     float xmin = 1;
     // Min in y coordinate.
     float ymin = 2;
     // Width of the bounding box.
     float width = 3;
     // Height of the bounding box.
     float height = 4;
   }
   // Bounding Box in the normalized coordinates.
   NormalizedBoundingBox normalized_bounding_box = 2;
   // Confidence score associated with this box.
   float score = 3;
   // Entity of this box.
   Entity entity = 4;
 }

 // A list of identified boxes.
 repeated IdentifiedBox identified_boxes = 2;

 // The statistics info for annotations from the model.
 message Stats {
   // The object info and count for annotations from the model.
   message ObjectCount {
     // Entity of this object.
     Entity entity = 1;
     // Count of the object.
     int32 count = 2;
   }
   // Counts of the full frame.
   repeated ObjectCount full_frame_count = 1;
 }

 // Detection statistics.
 Stats stats = 3;
}

Best practice e limitazioni

  • Evita punti di vista insoliti della videocamera (ad esempio una vista dall'alto) in cui persone e veicoli appaiono diversamente rispetto a una vista standard o comune. La qualità del rilevamento può essere influenzata in modo significativo da visualizzazioni insolite.
  • Assicurati che le persone e i veicoli siano completamente o quasi visibili. La qualità del rilevamento può essere influenzata dall'occlusione parziale di altri oggetti.
  • Il rilevatore di persone/veicoli ha una dimensione minima dell'oggetto rilevabile. Questa dimensione equivale a circa il 2% rispetto alle dimensioni della visuale della fotocamera. Assicurati che le persone e i veicoli di destinazione non siano troppo lontani dalla videocamera. Le dimensioni visibili di questi oggetti chiave devono essere sufficientemente grandi.
  • Le aree di interesse devono essere adeguatamente illuminate.
  • Assicurati che l'obiettivo della videocamera di origine sia pulito.
  • Assicurati che le entità (diverse da persone o auto) non ostruiscano alcuna parte del campo visivo della videocamera.
  • I seguenti fattori potrebbero peggiorare le prestazioni del modello. Tieni conto di questi fattori quando selezioni i dati:
    • Condizioni di scarsa illuminazione.
    • Folla e occlusioni di oggetti.
    • Punti di vista insoliti.
    • Dimensioni ridotte degli oggetti.