Leitfaden für Personen-/Fahrzeugdetektoren

Modellkarte für Personen-/Fahrzeugdetektor in der Console

Mit dem Modell Personen-/Fahrzeugdetektor können Sie Personen oder Fahrzeuge* in Videoframes erkennen und zählen. Das Modell nimmt einen Videostream als Eingabe entgegen und gibt einen Protokollpuffer mit der Anzahl der Personen und Fahrzeuge aus, die in jedem Frame erkannt wurden. Das Modell läuft mit 6 FPS.

* Autos, Busse, Lkw, Fahrräder, Motorräder und Krankenwagen.

Modellausgabe

Das Modell „Personen-/Fahrzeugdetektor“ zeigt die Anzahl der Personen und Fahrzeuge an, die im aktuell verarbeiteten Frame erkannt wurden. Unten finden Sie die Protokoll-Buffer-Definition der Modellausgabe. Die Frequenz des Ausgabestreams ist konstant: ein Frame pro Sekunde.

// The prediction result proto for Person/Vehicle Detection.
message OccupancyCountingPredictionResult {

 // Current timestamp.
 google.protobuf.Timestamp current_time = 1;

 // The entity info for annotations from the model.
 message Entity {
   // Label id.
   int64 label_id = 1;
   // Human readable string of the label.
   string label_string = 2;
 }

 // Identified box contains location and the entity of the object.
 message IdentifiedBox {
   // An unique id for this box.
   int64 box_id = 1;
   // Bounding Box in the normalized coordinates.
   message NormalizedBoundingBox {
     // Min in x coordinate.
     float xmin = 1;
     // Min in y coordinate.
     float ymin = 2;
     // Width of the bounding box.
     float width = 3;
     // Height of the bounding box.
     float height = 4;
   }
   // Bounding Box in the normalized coordinates.
   NormalizedBoundingBox normalized_bounding_box = 2;
   // Confidence score associated with this box.
   float score = 3;
   // Entity of this box.
   Entity entity = 4;
 }

 // A list of identified boxes.
 repeated IdentifiedBox identified_boxes = 2;

 // The statistics info for annotations from the model.
 message Stats {
   // The object info and count for annotations from the model.
   message ObjectCount {
     // Entity of this object.
     Entity entity = 1;
     // Count of the object.
     int32 count = 2;
   }
   // Counts of the full frame.
   repeated ObjectCount full_frame_count = 1;
 }

 // Detection statistics.
 Stats stats = 3;
}

Best Practices und Einschränkungen

  • Vermeiden Sie ungewöhnliche Kameraperspektiven (z. B. eine Vogelperspektive), bei denen Personen und Fahrzeuge anders erscheinen als bei einer Standard- oder gängigen Ansicht. Ungewöhnliche Aufrufe können sich stark auf die Erkennungsqualität auswirken.
  • Achten Sie darauf, dass Personen und Fahrzeuge vollständig oder größtenteils sichtbar sind. Die Qualität der Erkennung kann durch teilweises Verdecken durch andere Objekte beeinträchtigt werden.
  • Der Personen-/Fahrzeugdetektor hat eine minimale Objektgröße, die erkannt werden kann. Das entspricht etwa 2% der Größe der Kameraansicht. Die Personen und Fahrzeuge, die Sie erfassen möchten, dürfen nicht zu weit von der Kamera entfernt sein. Die Sichtbarkeit dieser wichtigen Objekte muss ausreichend groß sein.
  • Die Bereiche von Interesse müssen ausreichend beleuchtet sein.
  • Achten Sie darauf, dass das Kameraobjektiv der Videoquelle sauber ist.
  • Achten Sie darauf, dass keine Objekte (außer Personen oder Autos) das Sichtfeld der Kamera verdecken.
  • Die folgenden Faktoren können die Leistung des Modells beeinträchtigen. Berücksichtigen Sie bei der Auswahl von Datenquellen die folgenden Faktoren:
    • Schlechte Lichtverhältnisse
    • Überfüllung und Objektausblendungen
    • Ungewöhnliche Perspektiven
    • Kleine Objektgrößen