Mit BigQuery ML Empfehlungen auf Basis von Filmbewertungen abgeben

Diese Anleitung bietet eine Einführung zum Matrixfaktorisierungsmodell von BigQuery ML für Datenanalysten. Mit BigQuery ML haben Nutzer die Möglichkeit, mit SQL-Abfragen Modelle für maschinelles Lernen in BigQuery zu erstellen und auszuführen. Da SQL-Experten mithilfe von BigQuery ML Modelle mit bereits vorhandenen Tools erstellen und schneller entwickeln können, da sie dabei Daten nicht verschieben müssen, wird das maschinelle Lernen demokratisiert.

In dieser Anleitung wird gezeigt, wie Sie mithilfe des Datasets movielens1m ein Modell mit explizitem Feedback erstellen, um mithilfe einer Film-ID und einer Nutzer-ID Empfehlungen abzugeben.

Das MovieLens-Dataset enthält die von Nutzern abgegebenen Bewertungen zu Filmen auf einer Skala von 1 bis 5 sowie Metadaten zum Film, z. B. sein Genre.

Lernziele

In dieser Anleitung verwenden Sie Folgendes:

  • BigQuery ML zum Erstellen eines expliziten Empfehlungsmodells mithilfe der CREATE MODEL-Anweisung
  • Die ML.EVALUATE-Funktion zum Bewerten der ML-Modelle
  • Die ML.WEIGHTS-Funktion zum Prüfen der während des Trainings generierten Gewichtungen für latente Faktoren
  • Die ML.RECOMMEND-Funktion zum Erstellen von Empfehlungen für einen Nutzer

Kosten

In dieser Anleitung werden kostenpflichtige Komponenten der Cloud Platform verwendet, darunter:

  • BigQuery
  • BigQuery ML

Weitere Informationen zu den Kosten für BigQuery finden Sie auf der Seite BigQuery-Preise.

Weitere Informationen zu den Kosten für BigQuery ML finden Sie auf der Seite BigQuery ML – Preise.

Vorbereitung

  1. Melden Sie sich bei Ihrem Google-Konto an.

    Wenn Sie noch kein Konto haben, registrieren Sie sich hier für ein neues Konto.

  2. Wählen Sie in der Cloud Console auf der Projektauswahlseite ein Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  3. Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein. So prüfen Sie, ob die Abrechnung für Ihr Projekt aktiviert ist.

  4. BigQuery ist in neuen Projekten automatisch aktiviert. Zum Aktivieren von BigQuery in einem vorhandenen Projekt wechseln Sie zu Aktivieren Sie die BigQuery API.

    Aktivieren Sie die API

    .

Schritt 1: Dataset erstellen

Im ersten Schritt erstellen Sie ein BigQuery-Dataset, um Ihr ML-Modell zu speichern. So legen Sie ein Dataset an:

  1. Rufen Sie in der Cloud Console die BigQuery-Web-UI auf.

    Zur BigQuery-Web-UI

  2. Klicken Sie im Abschnitt Ressourcen auf Ihren Projektnamen.

  3. Klicken Sie im Detailbereich auf Dataset erstellen.

    Dataset erstellen

  4. Führen Sie auf der Seite Create Dataset (Dataset erstellen) die folgenden Schritte aus:

    • Geben Sie unter Dataset ID (Dataset-ID) bqml_tutorial ein.
    • Wählen Sie für Data location (Speicherort der Daten) die Option United States (US) (USA) aus. Derzeit sind die öffentlichen Datasets am multiregionalen Standort US gespeichert. Der Einfachheit halber sollten Sie Ihr Dataset am selben Speicherort ablegen.

      Seite

  5. Übernehmen Sie alle anderen Standardeinstellungen und klicken Sie auf Dataset erstellen.

Schritt 2: MovieLens-Dataset in BigQuery laden

Führen Sie die folgenden Schritte aus, um das Dataset "1m MovieLens" mithilfe der BigQuery-Befehlszeilentools in BigQuery zu laden. Dabei wird ein Dataset mit dem Namen movielens erstellt und die erforderlichen MovieLens-Tabellen werden darin gespeichert.

curl -O 'http://files.grouplens.org/datasets/movielens/ml-1m.zip'
unzip ml-1m.zip
bq mk --dataset movielens
sed 's/::/,/g' ml-1m/ratings.dat > ratings.csv
bq load --source_format=CSV movielens.movielens_1m ratings.csv \
  user_id:INT64,item_id:INT64,rating:FLOAT64,timestamp:TIMESTAMP

Da die Filmtitel Doppelpunkte, Kommas und senkrechte Striche enthalten, muss ein anderes Trennzeichen genutzt werden. Zum Laden der Filmtitel wird eine geringfügig veränderte Variante der letzten beiden Befehle verwendet.

sed 's/::/@/g' ml-1m/movies.dat > movie_titles.csv
bq load --source_format=CSV --field_delimiter=@ \
 movielens.movie_titles movie_titles.csv \
 movie_id:INT64,movie_title:STRING,genre:STRING

Schritt 3: Explizites Empfehlungsmodell erstellen

Als Nächstes erstellen Sie ein explizites Empfehlungsmodell mithilfe der MovieLens-Beispieltabelle, die im vorherigen Schritt geladen wurde. Mit der folgenden Standard-SQL-Abfrage wird das Modell erstellt, mit dem eine Bewertung für jedes Nutzer/Artikel-Paar vorhergesagt wird.

#standardSQL
CREATE OR REPLACE MODEL bqml_tutorial.my_explicit_mf_model
OPTIONS
  (model_type='matrix_factorization',
   user_col='user_id',
   item_col='item_id',
   l2_reg=9.83,
   num_factors=34) AS
SELECT
  user_id,
  item_id,
  rating
FROM movielens.movielens_1m

Durch Ausführen des Befehls CREATE MODEL wird das Modell, das Sie erstellen, außerdem trainiert.

Abfragedetails

Das Modell bqml_tutorial.my_explicit_mf_model wird mit der CREATE MODEL-Klausel erstellt und trainiert.

Die Klausel OPTIONS(model_type='matrix_factorization', user_col='user_id', ...) gibt an, dass ein Matrixfaktorisierungsmodell angelegt wird. Standardmäßig wird dadurch ein explizites Matrixfaktorisierungsmodell erstellt, sofern nicht feedback_type='IMPLICIT' festgelegt ist. Ein Beispiel für das Erstellen eines impliziten Matrixfaktorisierungsmodells wird unter Mit BigQuery ML Empfehlungen für implizites Feedback abgeben erläutert.

Die SELECT-Anweisung dieser Abfrage generiert Empfehlungen anhand der folgenden Spalten:

  • user_id: Die Nutzer-ID (INT64).
  • item_id: Die Film-ID (INT64).
  • rating: Die explizite Bewertung von 1 bis 5, die user_id für item_id (FLOAT64) abgegeben hat.

Die FROM-Klausel – movielens.movielens_1m – gibt an, dass Sie die Tabelle movielens_1m im Dataset movielens abfragen. Dieses Dataset befindet sich in Ihrem BigQuery-Projekt, wenn Sie Schritt 2 der Anleitung ausgeführt haben.

Abfrage CREATE MODEL ausführen

So führen Sie die Abfrage CREATE MODEL zum Erstellen und Trainieren des Modells aus:

  1. Klicken Sie in der BigQuery-Web-UI auf Neue Abfrage erstellen.

  2. Geben Sie in den Textbereich im Abfrageeditor die folgende Standard-SQL-Abfrage ein.

#standardSQL
CREATE OR REPLACE MODEL bqml_tutorial.my_explicit_mf_model
OPTIONS
  (model_type='matrix_factorization',
   user_col='user_id',
   item_col='item_id',
   l2_reg=9.83,
   num_factors=34) AS
SELECT
  user_id,
  item_id,
  rating
FROM movielens.movielens_1m
  1. Klicken Sie auf Ausführen.

    Die Verarbeitung der Abfrage dauert etwa 10 Minuten. Anschließend wird das Modell (my_explicit_mf_model) im Navigationsbereich der BigQuery-Web-UI angezeigt. Da die Abfrage zum Erstellen eines Modells eine CREATE MODEL-Anweisung verwendet, werden die Abfrageergebnisse nicht ausgegeben.

(Optional) Schritt 4: Trainingsstatistiken abrufen

Mit der Funktion ML.TRAINING_INFO können Sie sich die Ergebnisse des Modelltrainings anzeigen lassen. Alternativ sind die Statistiken auch in der BigQuery-Web-UI abrufbar. In dieser Anleitung verwenden Sie die BigQuery-Web-UI.

Ein Algorithmus für maschinelles Lernen erstellt ein Modell durch Analyse vieler Beispiele. Ziel ist es, ein Modell zu finden, das den Verlust so weit wie möglich minimiert. Dieser Vorgang wird als empirische Risikominimierung bezeichnet.

Zum Aufrufen der Statistiken des Modelltrainings, die beim Ausführen der CREATE MODEL-Abfrage generiert wurden, gehen Sie so vor:

  1. Erweitern Sie in der BigQuery-Web-UI im Abschnitt Ressourcen den Eintrag [PROJECT_ID] > bqml_tutorial und klicken Sie dann auf my_explicit_mf_model.

  2. Klicken Sie auf den Tab Training und dann auf Tabelle. Das Ergebnis sollte in etwa so aussehen:

    Ausgabe von ML.TRAINING_INFO

    Die Spalte Trainingsdatenverlust enthält den Verlustmesswert, der berechnet wird, nachdem das Modell mit dem Trainings-Dataset trainiert wurde. Da Sie die Matrixfaktorisierung ausgeführt haben, enthält diese Spalte die mittlere quadratische Abweichung. Standardmäßig werden die Daten bei Matrixfaktorisierungsmodellen nicht aufgeteilt, sodass die Spalte Evaluationsdatenverlust nur dann vorhanden ist, wenn ein Holdout-Dataset angegeben wird. Dies liegt daran, dass durch Aufteilung der Daten alle Bewertungen eines Nutzers oder Artikels verloren gehen können. Daher enthält das Modell keine Informationen zu latenten Faktoren über fehlende Nutzer oder Artikel.

    Weitere Informationen zur Funktion ML.TRAINING_INFO finden Sie in der Syntaxreferenz zu BigQuery ML.

Schritt 5: Modell bewerten

Nachdem Sie das Modell erstellt haben, können Sie mit der Funktion ML.EVALUATE die Leistung des Recommenders bewerten. Die ML.EVALUATE-Funktion bewertet die vorhergesagten Bewertungen gegenüber den tatsächlichen Bewertungen.

Zur Bewertung des Modells wird folgende Abfrage verwendet:

#standardSQL
SELECT
  *
FROM
  ML.EVALUATE(MODEL bqml_tutorial.my_explicit_mf_model,
    (
    SELECT
      user_id,
      item_id,
      rating
     FROM
      movielens.movielens_1m))

Abfragedetails

Die oberste SELECT-Anweisung ruft die Spalten aus dem Modell ab.

In der FROM-Klausel wird die Funktion ML.EVALUATE für das Modell bqml_tutorial.my_explicit_mf_model verwendet.

Die geschachtelte SELECT-Anweisung und die FROM-Klausel dieser Abfrage sind die gleichen wie in der Abfrage CREATE MODEL.

Sie können ML.EVALUATE auch ohne Eingabedaten aufrufen. Es werden dann die Bewertungsmesswerte verwendet, die während des Trainings berechnet wurden:

#standardSQL
SELECT
  *
FROM
  ML.EVALUATE(MODEL bqml_tutorial.my_explicit_mf_model)

Abfrage ML.EVALUATE ausführen

So führen Sie die ML.EVALUATE-Abfrage zur Bewertung des Modells aus:

  1. Klicken Sie in der BigQuery-Web-UI auf Neue Abfrage erstellen.

  2. Geben Sie in den Textbereich im Query editor (Abfrageeditor) die folgende Standard-SQL-Abfrage ein.

    #standardSQL
    SELECT
    *
    FROM
    ML.EVALUATE(MODEL bqml_tutorial.my_explicit_mf_model,
      (
      SELECT
    user_id,
    item_id,
    rating
       FROM
    `movielens.movielens_1m`))
    
  3. (Optional) Klicken Sie auf Mehr > Abfrageeinstellungen, um den Verarbeitungsstandort festzulegen. Wählen Sie als Processing location (Verarbeitungsort) US aus. Dieser Schritt ist optional, da der Verarbeitungsort anhand des Standorts des Datasets automatisch erkannt wird.

    Abfrageeinstellungen

  4. Klicken Sie auf Run (Ausführen).

  5. Sobald die Abfrage abgeschlossen ist, klicken Sie unterhalb des Textbereichs der Abfrage auf den Tab Results (Ergebnisse). Die Ergebnisse sollten in etwa so aussehen:

    Ausgabe von ML.EVALUATE

    Da Sie eine explizite Matrixfaktorisierung durchgeführt haben, enthalten die Ergebnisse die folgenden Spalten:

    • mean_absolute_error
    • mean_squared_error
    • mean_squared_log_error
    • median_absolute_error
    • r2_score
    • explained_variance

Ein wichtiger Messwert in den Bewertungsergebnissen ist der R2-Wert. Der R2-Wert ist ein statistisches Maß dafür, ob sich die Vorhersagen der linearen Regression den tatsächlichen Daten annähern. 0 gibt an, dass das Modell keine Erklärung für die Variabilität der Antwortdaten um den Mittelwert liefert. 1 gibt an, dass das Modell eine Erklärung für die gesamte Variabilität der Antwortdaten um den Mittelwert liefert.

Schritt 6: Anhand des Modells Bewertungen vorhersagen und Empfehlungen abgeben

Alle Artikelbewertungen für eine Gruppe von Nutzern suchen

Für ML.RECOMMEND sind neben dem Modell keine weiteren Argumente erforderlich. Es kann aber optional eine Tabelle verwendet werden. Wenn die Eingabetabelle nur eine Spalte enthält, die mit dem Namen der Eingabespalte für den user oder item übereinstimmt, werden alle vorhergesagten Artikelbewertungen für jeden user ausgegeben (und umgekehrt). Beachten Sie dabei Folgendes: Wenn alle Nutzer oder Artikel in der Eingabetabelle enthalten sind, werden die gleichen Ergebnisse wie ohne Angabe eines optionalen Arguments für ML.RECOMMEND ausgegeben.

Das folgende Beispiel zeigt eine Abfrage zum Abrufen aller vorhergesagten Filmbewertungen für fünf Nutzer:

#standardSQL
SELECT
  *
FROM
  ML.RECOMMEND(MODEL bqml_tutorial.my_explicit_mf_model,
    (
    SELECT
      user_id
    FROM
      movielens.movielens_1m
    LIMIT 5))

Abfragedetails

Die obere SELECT-Anweisung ruft die Spalten user, item und predicted_rating ab. Die letzte Spalte wird von der ML.RECOMMEND-Funktion generiert. Wenn Sie die ML.RECOMMEND-Funktion verwenden, lautet der Name der Ausgabespalte für das Modell predicted_<rating_column_name>. Bei expliziten Matrixfaktorisierungsmodellen ist predicted_rating der geschätzte Wert von rating.

Mit der ML.RECOMMEND-Funktion werden Bewertungen anhand des Modells bqml_tutorial.my_explicit_mf_model vorhergesagt.

Die verschachtelte SELECT-Anweisung dieser Abfrage wählt nur die Spalte user_id aus der ursprünglichen Tabelle aus, die für das Training verwendet wird.

Die LIMIT-Klausel – LIMIT 5 – filtert nach dem Zufallsprinzip fünf user_id aus, die an ML.RECOMMEND gesendet werden sollen.

Bewertungen für alle Nutzer/Artikel-Paare suchen

Nachdem Sie nun Ihr Modell bewertet haben, wird damit im nächsten Schritt eine Bewertung von Nutzern/Artikeln vorhergesagt. Sie verwenden dieses Modell, um die Bewertung jeder einzelnen Nutzer/Artikel-Kombination in der folgenden Abfrage vorherzusagen:

#standardSQL
SELECT
  *
FROM
  ML.RECOMMEND(MODEL bqml_tutorial.my_explicit_mf_model)

Abfragedetails

Die obere SELECT-Anweisung ruft die Spalten user, item und predicted_rating ab. Die letzte Spalte wird von der ML.RECOMMEND-Funktion generiert. Wenn Sie die ML.RECOMMEND-Funktion verwenden, lautet der Name der Ausgabespalte für das Modell predicted_<rating_column_name>. Bei expliziten Matrixfaktorisierungsmodellen ist predicted_rating der geschätzte Wert von rating.

Mit der ML.RECOMMEND-Funktion werden Bewertungen anhand des Modells bqml_tutorial.my_explicit_mf_model vorhergesagt.

Sie können beispielsweise so das Ergebnis in der Tabelle speichern:

#standardSQL
CREATE OR REPLACE TABLE bqml_tutorial.recommend_1m
OPTIONS() AS
SELECT
  *
FROM
  ML.RECOMMEND(MODEL bqml_tutorial.my_explicit_mf_model)

Wenn der Fehler Query Exceeded Resource Limits für ML.RECOMMEND auftritt, versuchen Sie es mit einer höheren Abrechnungsstufe. Diese kann im BigQuery-Befehlszeilentool mit dem Flag --maximum_billing_tier festgelegt werden.

Empfehlungen generieren

Mit der vorherigen Empfehlungsabfrage können wir nach der vorhergesagten Bewertung sortieren und die am häufigsten vorhergesagten Artikel für jeden Nutzer ausgeben. Die folgende Abfrage verknüpft item_ids mit movie_ids aus der zuvor hochgeladenen Tabelle movielens.movie_titles und gibt die fünf am häufigsten empfohlenen Filme pro Nutzer aus.

#standardSQL
SELECT
  user_id,
  ARRAY_AGG(STRUCT(movie_title, genre, predicted_rating)
ORDER BY predicted_rating DESC LIMIT 5)
FROM (
SELECT
  user_id,
  item_id,
  predicted_rating,
  movie_title,
  genre
FROM
  bqml_tutorial.recommend_1m
JOIN
  movielens.movie_titles
ON
  item_id = movie_id)
GROUP BY
  user_id

Abfragedetails

Die innere SELECT-Anweisung führt einen Inner Join für item_id aus der Tabelle mit den Empfehlungsergebnissen und für movie_id aus der Tabelle movielens.movie_titles aus. movielens.movie_titles ordnet movie_id nicht nur einem Filmnamen zu, sondern enthält auch die von der IMDB angegebenen Genres des Films.

Die obere SELECT-Anweisung aggregiert die Ergebnisse der verschachtelten SELECT-Anweisung. Dazu führt sie movie_title, genre, und predicted_rating mithilfe von GROUPS BY user_id in absteigender Reihenfolge zusammen und behält nur die ersten fünf Filme bei.

Abfrage ML.RECOMMEND ausführen

So führen Sie die ML.RECOMMEND-Abfrage aus, die die fünf am häufigsten empfohlenen Filme pro Nutzer ausgibt:

  1. Klicken Sie in der BigQuery-Web-UI auf Neue Abfrage erstellen.

  2. Geben Sie in den Textbereich im Abfrageeditor die folgende Standard-SQL-Abfrage ein.

    #standardSQL
    CREATE OR REPLACE TABLE bqml_tutorial.recommend_1m
    OPTIONS() AS
    SELECT
    *
    FROM
    ML.RECOMMEND(MODEL bqml_tutorial.my_explicit_mf_model)
    
  3. Klicken Sie auf Ausführen.

    Wenn die Abfrage abgeschlossen ist, wird (bqml_training.recommend_1m) im Navigationsbereich der BigQuery-Web-UI angezeigt. Da die Abfrage zum Erstellen einer Tabelle eine CREATE TABLE-Anweisung verwendet, werden die Abfrageergebnisse nicht ausgegeben.

  4. Erstellen Sie eine weitere neue Abfrage. Geben Sie die folgende Standard-SQL-Abfrage in den Textbereich des Abfrageeditors ein, sobald die vorherige Abfrage ausgeführt wurde:

    #standardSQL
    SELECT
     user_id,
     ARRAY_AGG(STRUCT(movie_title, genre, predicted_rating)
    ORDER BY predicted_rating DESC LIMIT 5)
    FROM (
    SELECT
     user_id,
     item_id,
     predicted_rating,
     movie_title,
     genre
    FROM
     bqml_tutorial.recommend_1m
    JOIN
     movielens.movie_titles
    ON
     item_id = movie_id)
    GROUP BY
     user_id
    
  5. (Optional) Klicken Sie auf Mehr > Abfrageeinstellungen, um den Verarbeitungsstandort festzulegen. Wählen Sie als Processing location (Verarbeitungsort) US aus. Dieser Schritt ist optional, da der Verarbeitungsort anhand des Standorts des Datasets automatisch erkannt wird.

    Abfrageeinstellungen

  6. Klicken Sie auf Run (Ausführen).

  7. Sobald die Abfrage abgeschlossen ist, klicken Sie unterhalb des Textbereichs der Abfrage auf den Tab Results (Ergebnisse). Die Ergebnisse sollten in etwa so aussehen:

    Ausgabe von ML.RECOMMEND

Da neben einem INT64-Wert zusätzliche Metadaten zu jeder movie_id verfügbar waren, können wir Informationen wie das Genre zu den fünf am häufigsten empfohlenen Filmen für jeden Nutzer abrufen. Wenn Sie keine entsprechende movietitles-Tabelle für Ihre Trainingsdaten haben, sind die Ergebnisse möglicherweise für Menschen nicht verständlich, da sie dann nur Zahlen-IDs oder Hashes enthalten.

Top-Genres pro Faktor

Wenn Sie wissen möchten, zu welchem Genre die einzelnen latenten Faktoren gehören, können Sie die folgende Abfrage ausführen:

#standardSQL
SELECT
  factor,
  ARRAY_AGG(STRUCT(feature, genre,
      weight)
  ORDER BY
    weight DESC
  LIMIT
    10) AS weights
FROM (
  SELECT
    * EXCEPT(factor_weights)
  FROM (
    SELECT
      *
    FROM (
      SELECT
        factor_weights,
        CAST(feature AS INT64) as feature
      FROM
        ML.WEIGHTS(model bqml_tutorial.my_explicit_mf_model)
      WHERE
        processed_input= 'item_id')
    JOIN
      movielens.movie_titles
    ON
      feature = movie_id) weights
  CROSS JOIN
    UNNEST(weights.factor_weights)
  ORDER BY
    feature,
    weight DESC)
GROUP BY
  factor

Abfragedetails

Die innere SELECT-Anweisung ruft die item_id oder das Array mit den Gewichtungen für Filmfaktoren ab und verknüpft die Werte mit der Tabelle movielens.movie_titles, um das Genre jeder Artikel-ID abzurufen.

Das Ergebnis dieser Anweisung wird dann per CROSS JOIN mit jedem factor_weights-Array verbunden, das als Ergebnis ORDER BY feature, weight DESC ausgibt.

Schließlich fasst die obere SELECT-Anweisung die Ergebnisse aus der inneren Anweisung nach factor zusammen und erstellt ein Array für jeden Faktor, sortiert nach der Gewichtung der einzelnen Genres.

Abfrage ausführen

So führen Sie die obige Abfrage aus, die die zehn beliebtesten Filmgenres pro Faktor ausgibt:

  1. Klicken Sie in der BigQuery-Web-UI auf Neue Abfrage erstellen.

  2. Geben Sie in den Textbereich im Query editor (Abfrageeditor) die folgende Standard-SQL-Abfrage ein.

#standardSQL
SELECT
  factor,
  ARRAY_AGG(STRUCT(feature, genre,
      weight)
  ORDER BY
    weight DESC
  LIMIT
    10) AS weights
FROM (
  SELECT
    * EXCEPT(factor_weights)
  FROM (
    SELECT
      *
    FROM (
      SELECT
        factor_weights,
        CAST(feature AS INT64) as feature
      FROM
        ML.WEIGHTS(model bqml_tutorial.my_explicit_mf_model)
      WHERE
        processed_input= 'item_id')
    JOIN
      movielens.movie_titles
    ON
      feature = movie_id) weights
  CROSS JOIN
    UNNEST(weights.factor_weights)
  ORDER BY
    feature,
    weight DESC)
GROUP BY
  factor
  1. (Optional) Klicken Sie auf Mehr > Abfrageeinstellungen, um den Verarbeitungsstandort festzulegen. Wählen Sie als Processing location (Verarbeitungsort) US aus. Dieser Schritt ist optional, da der Verarbeitungsort anhand des Standorts des Datasets automatisch erkannt wird.

    Abfrageeinstellungen

  2. Klicken Sie auf Run (Ausführen).

  3. Sobald die Abfrage abgeschlossen ist, klicken Sie unterhalb des Textbereichs der Abfrage auf den Tab Results (Ergebnisse). Die Ergebnisse sollten in etwa so aussehen:

    Analyse der Gewichtung

Bereinigen

So vermeiden Sie, dass Ihrem Google Cloud Platform-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:

  • Sie können das von Ihnen erstellte Projekt löschen.
  • Sie können das Projekt auch behalten und das Dataset löschen.

Datasets löschen

Wenn Sie Ihr Projekt löschen, werden alle Datasets und Tabellen entfernt. Wenn Sie das Projekt wieder verwenden möchten, können Sie das in dieser Anleitung erstellte Dataset löschen:

  1. Öffnen Sie ggf. die BigQuery-Web-UI.

    Zur BigQuery-Web-UI

  2. Wählen Sie im Navigationsbereich das Dataset bqml_tutorial aus, das Sie erstellt haben.

  3. Klicken Sie rechts im Fenster auf Delete dataset (Datensatz löschen). Dadurch werden das Dataset, die Tabelle und alle Daten gelöscht.

  4. Bestätigen Sie im Dialogfeld Dataset löschen den Löschbefehl. Geben Sie dazu den Namen des Datasets (bqml_tutorial) ein und klicken Sie auf Löschen.

Projekt löschen

So löschen Sie das Projekt:

  1. Wechseln Sie in der Cloud Console zur Seite Ressourcen verwalten.

    Zur Seite "Ressourcen verwalten"

  2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen .
  3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Beenden, um das Projekt zu löschen.

Weitere Informationen