Wir behandeln jede positive Filmbewertung (Bewertung >= 4) als Ereignis für die Anzeige einer Produktseite. Wir trainieren ein Empfehlungsmodell vom Typ „Was Ihnen sonst noch gefallen könnte“, das Filmempfehlungen auf der Grundlage eines Nutzers oder eines Seed-Films in unserem Dataset ausspricht.
Geschätzte Dauer:
- Erste Schritte für das Training des Modells: ca.1,5 Stunden.
- Warten auf das Modelltraining: ca. 2 Tage.
- Bewerten der Modellvorhersagen und Bereinigen: ca. 30 Minuten.
Lernziele
- Informationen zum Importieren von Produkt- und Nutzerereignisdaten aus BigQuery in Vertex AI Search for Retail einbinden
- Empfehlungsmodelle trainieren und bewerten
Kosten
In dieser Anleitung werden kostenpflichtige Komponenten von Google Cloud verwendet, darunter:- Cloud Storage
- BigQuery
- Vertex AI Search für den Einzelhandel
Weitere Informationen zu Cloud Storage-Kosten erhalten Sie auf der Seite Cloud Storage – Preise.
Weitere Informationen zu den Kosten von BigQuery finden Sie auf der Seite BigQuery-Preise.
Weitere Informationen zu den Kosten für Vertex AI Search für den Einzelhandel finden Sie auf der Seite Vertex AI Search für den Einzelhandel – Preise.
Hinweise
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
Dataset vorbereiten
Offen Google Cloud Console wählen Sie Ihr Google Cloud-Projekt aus. Notieren Sie sich die Projekt-ID auf der Dashboard-Seite auf der Karte Projektinformationen. Diese Projekt-ID benötigen Sie für die folgenden Schritte. Klicken Sie als Nächstes oben in der Console auf die Schaltfläche Cloud Shell aktivieren.
Im unteren Bereich der Google Cloud Console wird ein neuer Frame für die Cloud Shell-Sitzung geöffnet. und zeigt eine Eingabeaufforderung an.
Dataset importieren
Laden Sie in Cloud Shell das Quell-Dataset herunter und entpacken Sie es:
wget https://files.grouplens.org/datasets/movielens/ml-latest.zip unzip ml-latest.zip
Erstellen Sie einen Cloud Storage-Bucket und laden Sie die Daten in diesen hoch:
gcloud storage buckets create gs://PROJECT_ID-movielens-data gcloud storage cp ml-latest/movies.csv ml-latest/ratings.csv \ gs://PROJECT_ID-movielens-data
Erstellen Sie ein BigQuery-Dataset:
bq mk movielens
Laden Sie
movies.csv
in eine neue BigQuery-Tabelle für Filme:bq load --skip_leading_rows=1 movielens.movies \ gs://PROJECT_ID-movielens-data/movies.csv \ movieId:integer,title,genres
Laden Sie
ratings.csv
in eine neue BigQuery-Tabelle für Bewertungen:bq load --skip_leading_rows=1 movielens.ratings \ gs://PROJECT_ID-movielens-data/ratings.csv \ userId:integer,movieId:integer,rating:float,time:timestamp
BigQuery-Ansichten erstellen
Erstellen Sie eine Ansicht, die die Filme-Tabelle in das Retail-Produktkatalogschema konvertiert:
bq mk --project_id=PROJECT_ID \ --use_legacy_sql=false \ --view ' SELECT CAST(movieId AS string) AS id, SUBSTR(title, 0, 128) AS title, SPLIT(genres, "|") AS categories FROM `PROJECT_ID.movielens.movies`' \ movielens.products
Die neue Ansicht hat jetzt das Schema, das Vertex AI Search for Retail erwartet. Wählen Sie dann in der linken Seitenleiste
BIG DATA -> BigQuery
aus. Maximieren Sie anschließend in der Explorerleiste auf der linken Seite den Projektnamen und wählen Siemovielens -> products
aus, um die Abfrageseite für diese Ansicht zu öffnen.Jetzt wandeln Sie Filmbewertungen in Nutzerereignisse um. Konkret werden wir Folgendes tun:
- Negative Filmbewertungen ignorieren (<4)
- Jede positive Bewertung als Aufruf einer Produktseite behandeln (
detail-page-view
) - Die MovieLens-Zeitachse auf die letzten 90 Tage skalieren. Hierfür gibt es zwei Gründe:
- Für Vertex AI Search for Retail müssen Nutzerereignisse nicht älter als 2015 sein. MovieLens-Bewertungen reichen bis 1995 zurück.
- Vertex AI Search for Retail verwendet bei der Bereitstellung von Vorhersagen die Nutzerereignisse der letzten 90 Tage Anforderungen eines Nutzers. Jeder Nutzer hat scheinbar aktuelle Ereignisse, wenn wir später Vorhersagen für einen Nutzer treffen.
Eine BigQuery-Ansicht erstellen. Der folgende Befehl verwendet eine SQL-Abfrage, das den oben genannten Conversion-Anforderungen entspricht.
bq mk --project_id=PROJECT_ID \ --use_legacy_sql=false \ --view ' WITH t AS ( SELECT MIN(UNIX_SECONDS(time)) AS old_start, MAX(UNIX_SECONDS(time)) AS old_end, UNIX_SECONDS(TIMESTAMP_SUB( CURRENT_TIMESTAMP(), INTERVAL 90 DAY)) AS new_start, UNIX_SECONDS(CURRENT_TIMESTAMP()) AS new_end FROM `PROJECT_ID.movielens.ratings`) SELECT CAST(userId AS STRING) AS visitorId, "detail-page-view" AS eventType, FORMAT_TIMESTAMP( "%Y-%m-%dT%X%Ez", TIMESTAMP_SECONDS(CAST( (t.new_start + (UNIX_SECONDS(time) - t.old_start) * (t.new_end - t.new_start) / (t.old_end - t.old_start)) AS int64))) AS eventTime, [STRUCT(STRUCT(movieId AS id) AS product)] AS productDetails, FROM `PROJECT_ID.movielens.ratings`, t WHERE rating >= 4' \ movielens.user_events
Produktkatalog und Nutzerereignisse importieren
Jetzt können Sie den Produktkatalog und die Nutzerereignisdaten in Vertex AI Search for Retail.
Aktivieren Sie die Vertex AI Search for Retail API für Ihr Google Cloud-Projekt.
Klicken Sie auf Jetzt starten.
Gehen Sie zu Daten > in der Search for Retail-Konsole.
Zur Seite „Daten“Klicken Sie auf Importieren.
Produktkatalog importieren
Füllen Sie das Formular aus, um Produkte aus der oben erstellten BigQuery-Ansicht zu importieren:
- Wählen Sie den Importtyp aus: Produktkatalog.
- Wählen Sie den Standardzweignamen aus.
- Wählen Sie die Datenquelle aus: BigQuery.
- Wählen Sie das Datenschema aus: Retail-Produktschema.
Geben Sie den Namen der von Ihnen erstellten BigQuery-Ansicht Produkte ein oben (
PROJECT_ID.movielens.products
).
Klicken Sie auf Importieren.
Warten Sie fünf bis zehn Minuten, bis alle Produkte importiert sind.
Sie können die Importaktivität auf den Status des Importvorgangs prüfen. Wenn der Import abgeschlossen ist, ändert sich der Status des Importvorgangs in Erfolgreich.
Nutzerereignisse importieren
Importieren Sie die BigQuery-Ansicht „user_events“:
- Wählen Sie den Importtyp aus: Nutzerereignisse.
- Wählen Sie die Datenquelle aus: BigQuery.
- Wählen Sie das Datenschema aus: Schema für Nutzerereignisse in Retail.
- Geben Sie den Namen der BigQuery-Ansicht
user_events
ein, die Sie oben erstellt haben.
Klicken Sie auf Importieren.
Warten Sie, bis mindestens eine Million Ereignisse importiert wurden, bevor Sie mit dem nächsten Schritt fortfahren, um die Datenanforderungen für das Training eines neuen Modells zu erfüllen.
Sie können die Importaktivität auf den Vorgangsstatus prüfen. Der Vorgang dauert etwa eine Stunde.
Empfehlungsmodelle trainieren und bewerten
Empfehlungsmodell erstellen
Rufen Sie in der Search for Retail-Konsole die Seite Modelle auf.
Zur Seite „Modelle“Klicken Sie auf Modell erstellen:
- Geben Sie einen Namen für das Modell ein.
- Wählen Sie Was Ihnen sonst noch gefallen könnte als Modelltyp aus.
- Wählen Sie Klickrate (Click-through-Rate, CTR) als Geschäftsziel aus.
Klicken Sie auf Erstellen.
Ihr neues Modell beginnt mit dem Training.
Bereitstellungskonfiguration erstellen
Rufen Sie in der Search for Retail Console die Seite Bereitstellungskonfigurationen auf.
Zur Seite „Bereitstellungskonfigurationen“Klicken Sie auf Bereitstellungskonfiguration erstellen.
- Wählen Sie Empfehlung aus.
- Geben Sie der Bereitstellungskonfiguration einen Namen.
- Wählen Sie das von Ihnen erstellte Modell aus.
Klicken Sie auf Erstellen.
Warten Sie, bis das Modell bereit für die Abfrage ist.
Es dauert ungefähr zwei Tage, bis das Modell trainiert und bereit für die Abfrage ist.
Klicken Sie zum Anzeigen des Status auf die erstellte Bereitstellungskonfiguration auf der Seite „Bereitstellungskonfigurationen“.
Im Feld Bereit zum Abfragen des Modells wird Ja angezeigt, wenn der Vorgang abgeschlossen ist.
Vorschau von Empfehlungen
Sobald das Modell zum Abfragen bereit ist:
-
Rufen Sie in der Search for Retail Console die Seite Bereitstellungskonfigurationen auf.
Zur Seite „Bereitstellungskonfigurationen“ - Klicken Sie auf den Namen der Bereitstellungskonfiguration, um die zugehörige Detailseite aufzurufen.
- Klicken Sie auf den Tab Bewerten.
Geben Sie eine Seed-Film-ID ein, z. B.
4993
für „The Lord of the Rings: The Fellowship of the Ring (2001)“.Klicken Sie auf Vorhersagevorschau, um die Liste der empfohlenen Elemente rechts auf der Seite zu sehen.
Bereinigen
Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, löschen Sie entweder das Projekt, das die Ressourcen enthält, oder Sie behalten das Projekt und löschen die einzelnen Ressourcen.
Projekt löschen
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Einzelne Ressourcen löschen
Rufen Sie die Seite Bereitstellungskonfigurationen auf und löschen Sie die Bereitstellungskonfiguration, erstellt.
Rufen Sie die Seite Modelle auf und löschen Sie das Modell.
Löschen Sie das BigQuery-Dataset in Cloud Shell:
bq rm --recursive --dataset movielens
Löschen Sie den Cloud Storage-Bucket und seinen Inhalt:
gcloud storage rm gs://PROJECT_ID-movielens-data --recursive