BigQuery ML-Modellgewichtungen

In diesem Dokument wird beschrieben, wie BigQuery ML die Sichtbarkeit von Modellgewichtungen für ML-Modelle unterstützt.

Ein ML-Modell ist ein Artefakt, das nach dem Ausführen eines ML-Algorithmus für Trainingsdaten gespeichert wird. Das Modell stellt die Regeln, Zahlen und andere algorithmusspezifische Datenstrukturen dar, die für Vorhersagen erforderlich sind. Einige Beispiele:

  • Ein lineares Regressionsmodell besteht aus einem Vektor von Koeffizienten mit bestimmten Werten.
  • Ein Entscheidungsbaummodell besteht aus einer oder mehreren Baumstrukturen von Wenn-dann-Anweisungen, die bestimmte Werte haben.
  • Ein neuronales Deep-Learning-Netzwerkmodell besteht aus einer Graphenstruktur mit Vektoren oder Matrizen von Gewichtungen, die bestimmte Werte haben.

In BigQuery ML wird der Begriff Modellgewichtung verwendet, um die Komponenten zu beschreiben, aus denen ein Modell besteht.

Informationen zu den unterstützten SQL-Anweisungen und -Funktionen für die einzelnen Modelltypen finden Sie unter End-to-End-Nutzerpfad für jedes Modell.

Modellgewichtungsangebote in BigQuery ML

BigQuery ML bietet mehrere Funktionen, mit denen Sie die Modellgewichtungen für verschiedene Modelle abrufen können.

Modellkategorie Modelltypen Modellgewichtungsfunktionen Was die Funktion tut
Beaufsichtigte Modelle Lineare und logistische Regression ML.WEIGHTS Ruft die Featurekoeffizienten und den Interception ab.
Nicht überwachte Modelle Kmeans ML.CENTROIDS Ruft die Featurekoeffizienten für alle Schwerpunkte ab.
Matrix Factorization ML.WEIGHTS Ruft die Gewichtung aller latenten Faktoren ab. Sie stellen die beiden zerlegten Matrizen dar: die Nutzer- und die Elementmatrix.
PCA ML.PRINCIPAL_COMPONENTS Ruft die Merkmalskoeffizienten für alle Hauptkomponenten ab, die auch als Eigenvektoren bezeichnet werden.
ML.PRINCIPAL_COMPONENT_INFO Ruft die Statistiken der einzelnen Hauptkomponenten ab, z. B. eigenvalue.
Zeitreihenmodelle ARIMA_PLUS ML.ARIMA_COEFFICIENTS Ruft die Koeffizienten des ARIMA-Modells ab, mit dem die Trendkomponente der Eingabezeitachse modelliert wird. Um Informationen zu anderen Komponenten zu erhalten, z. B. saisonalen Mustern, die in der Zeitreihe vorhanden sind, verwenden Sie ML.ARIMA_EVALUATE.

BigQuery ML unterstützt keine Modellgewichtungsfunktionen für die folgenden Modelltypen:

Wenn Sie die Gewichtung aller Modelltypen mit Ausnahme von AutoML Tables-Modellen sehen möchten, exportieren Sie das Modell aus BigQuery ML nach Cloud Storage. Sie können dann die XGBoost-Bibliothek zur Visualisierung der Baumstruktur für Boosted Tree- und Random Forest-Modelle oder die TensorFlow-Bibliothek zur Visualisierung der Graphenstruktur für DNN- und Wide-and-Deep-Modelle verwenden. Es gibt keine Methode zum Abrufen von Informationen zur Modellgewichtung für AutoML Tables-Modelle.

Weitere Informationen zum Exportieren eines Modells finden Sie unter EXPORT MODEL-Anweisung und BigQuery ML-Modell für Onlinevorhersagen exportieren.