Um einen Monitoringjob zu starten, muss das Modellmonitoring das Schema Ihres tabellarischen Datasets kennen, damit es die Eingabenutzlast korrekt parsen kann.
Bei AutoML-Modellen parst das Modellmonitoring das Schema automatisch, da Vertex AI bereits Zugriff auf Ihre Trainingsdaten hat.
Für benutzerdefiniert trainierte Modelle:
Das Modellmonitoring kann Schemas automatisch für Modelle parsen, die ein Standardformat für Schlüssel/Wert-Paare verwenden.
Für benutzerdefinierte Modelle, die kein Eingabeformat für Schlüssel/Wert-Paare verwenden, müssen Sie beim Erstellen Ihres Monitoringjobs möglicherweise ein Schema angeben.
Die Schemagenerierung hängt davon ab, ob Sie das Modellmonitoring für einen Onlinevorhersage-Endpunkt oder für Batchvorhersagen aktivieren.
Schemaparsen für Onlinevorhersage-Endpunkte
Bei Endpunkten für Onlinevorhersagen kann Model Monitoring das Schema automatisch parsen oder ein Schema hochladen, wenn Sie einen Monitoringjob erstellen.
Automatisches Schema-Parsing
Nachdem Sie die Abweichungen- oder Drifterkennung für einen Online-Endpunkt aktiviert haben, kann Model Monitoring das Eingabeschema normalerweise automatisch parsen. Zum automatischen Parsen des Schemas analysiert Model Monitoring die ersten 1.000 Eingabeanfragen, um das Schema zu bestimmen.
Das automatische Parsen des Schemas funktioniert am besten, wenn die Eingabeanfragen als Schlüssel/Wert-Paare formatiert sind, wobei "key"
der Name des Features und "value"
der Wert des Features ist. Beispiel:
"key":"value"
{"TenYearCHD":"0", "glucose":"5.4", "heartRate":"1", "age":"30", "prevalentStroke":"0", "gender":"f", "ethnicity":"latin american"}
Wenn die Eingaben nicht das Format "key":"value"
haben, versucht Model Monitoring, den Datentyp jedes Features zu ermitteln, und weist jeder Eingabe automatisch einen Standardnamen zu.
Benutzerdefinierte Instanzschemas
Sie können ein eigenes Eingabeschema angeben, wenn Sie einen Modell-Monitoring-Job erstellen, um sicherzustellen, dass das Modell-Monitoring die Eingaben Ihres Modells korrekt parst.
Dieses Schema wird als Analyseinstanzschema bezeichnet. Die Schemadatei gibt das Format der Eingabenutzlast, die Namen der einzelnen Funktionen und den Typ der einzelnen Merkmale an.
Das Schema muss als YAML-Datei im Open API-Format geschrieben werden. Das folgende Beispiel bezieht sich auf eine Vorhersageanfrage mit dem Format object
:
type: object properties: age: type: string BMI: type: number TenYearCHD: type: string cigsPerDay: type: array items: type: string BPMeds: type: string required: - age - BMI - TenYearCHD - cigsPerDay - BPMeds
type
gibt an, ob Ihre Vorhersageanfrage in einem der folgenden Formate vorliegt:object
: Schlüssel/Wert-Paarearray
: array-ähnlichstring
: CSV-String
properties
gibt den Typ der einzelnen Features an.Wenn die Anfrage im Array- oder CSV-Stringformat vorliegt, geben Sie die Reihenfolge an, in der die Merkmale in jeder Anfrage unter dem Feld
required
aufgeführt sind.
Wenn Ihre Vorhersageanfrage im Array- oder CSV-Stringformat vorliegt, stellen Sie alle fehlenden Features als Nullwerte dar. Betrachten Sie beispielsweise eine Vorhersageanfrage mit fünf Features:
[feature_a, feature_b, feature_c, feature_d, feature_e]
Wenn feature_c
fehlende Werte zulässt, würde eine Beispielanfrage ohne feature_c
so lauten: {[1, 2, , 4, 6]}
. Die Listenlänge beträgt weiterhin 5, mit einem Nullwert in der Mitte.
Schemaparsen für Batchvorhersagen
Bei Batchvorhersagen können Sie bestimmen, dass Model Monitoring das Schema automatisch parst oder ein Schema hochlädt, wenn Sie einen Monitoringjob erstellen.
Automatisches Schema-Parsing
Wenn Sie beim Erstellen des Monitoringjobs kein Schema angeben, leitet Model Monitoring die Datentypen Ihrer Features ab und generiert das Schema anhand Ihrer Trainingsdaten.
Model Monitoring muss auch wissen, welches Feature die Zielspalte ist, also welches Feature vorhergesagt wird. Die Zielspalte ist aus dem Schema- und Feature-Abweichungs-Messwert ausgeschlossen. Sie können die Zielspalte beim Erstellen eines Monitoring-Jobs angeben.
Spezifikation der Zielspalte
Wenn Sie beim Erstellen eines Monitoringjobs die Zielspalte nicht angeben, kennzeichnet Model Monitoring den letzten Featurenamen in den Trainingsdaten als Zielspalte.
Beispiel: Das Modellmonitoring kennzeichnet column_c
in diesen CSV-Trainingsdaten als Zielspalte, da sich column_c
am Ende der ersten Zeile befindet:
column_a, column_b, column_d, column_c 1,"a", 2, "c" 2,"b", 342, "d"
Das Modellmonitoring kennzeichnet column_c
in dieser JSONL-Datei als Zielspalte, da sich column_c
am Ende der ersten Zeile befindet:
{"column_a": 1, "column_b": "a", "column_d": 2, "column_c": "c" } {"column_a": 2, "column_b": "b", "column_c": "d", "column_d": 342}
In beiden Beispielen enthält das endgültige Schema nur column_a
, column_b
und column_d
.
Benutzerdefinierte Schemas
Ihr benutzerdefiniertes Schema gibt das Format der Eingabenutzlast, die Namen der einzelnen Funktionen und den Typ der einzelnen Merkmale an.
Das Schema muss als YAML-Datei mit der Open API-Syntax geschrieben werden. Das folgende Beispiel bezieht sich auf eine Vorhersageanfrage mit dem Format object
:
type: object properties: age: type: string BMI: type: number TenYearCHD: type: string cigsPerDay: type: array items: type: string BPMeds: type: string required: - age - BMI - TenYearCHD - cigsPerDay - BPMeds
Model Monitoring berechnet die Funktionsabweichung auf Basis der Batchvorhersageausgabe der JSON-Zeilen. Wenn Ihr Datentyp ein Array enthält, muss die Länge des Arrays in den Eingabedaten der Zahl der in der YAML-Datei angegebenen Features entsprechen. Andernfalls schließt Model Monitoring die Vorhersageinstanz mit der falschen Arraylänge aus der Berechnung der Featureabweichung aus.
Beispielsweise enthalten die Arrays in folgenden Datentypen zwei Funktionen:
Array:
{[[1, 2]]}
"Schlüssel"/"Wert":
{"key": 0, "values": [[1, 2]]}
Das entsprechende Schema muss außerdem zwei Funktionen angeben:
type: object properties: name: type: string age: type: number required: - name - age
Nächste Schritte
- Erkennung von Abweichungen und Drift für Ihre Modelle aktivieren.
- Sie können das Beispielnotebook in Colab ausführen oder auf GitHub ansehen.