Personalisierte Filmempfehlungen erstellen


In dieser Anleitung verwenden wir das Movielens-Dataset, um zu zeigen, wie Sie Ihren Produktkatalog und Nutzerereignisse in Vertex AI Search for Commerce hochladen und ein personalisiertes Produktempfehlungsmodell trainieren. Das MovieLens-Dataset enthält einen Katalog an Filmen (Produkten) und Nutzer-Filmbewertungen (Nutzerereignisse).

Wir behandeln jede positive Filmbewertung (Bewertung >= 4) als Ereignis für die Anzeige einer Produktseite. Wir trainieren ein Empfehlungsmodell vom Typ „Was Ihnen sonst noch gefallen könnte“, das Filmempfehlungen auf der Grundlage eines Nutzers oder eines Seed-Films in unserem Dataset ausspricht.

Geschätzte Dauer:

  • Erste Schritte für das Training des Modells: ca.1,5 Stunden.
  • Warten auf das Modelltraining: ca. 2 Tage.
  • Bewerten der Modellvorhersagen und Bereinigen: ca. 30 Minuten.

Lernziele

  • Hier erfahren Sie, wie Sie Produkte und Nutzerereignisdaten aus BigQuery in Vertex AI Search for Commerce importieren.
  • Empfehlungsmodelle trainieren und bewerten

Kosten

In dieser Anleitung werden unter anderem die folgenden kostenpflichtigen Google Cloud-Komponenten verwendet:

  • Cloud Storage
  • BigQuery
  • Vertex AI Search für den Einzelhandel

Weitere Informationen zu Cloud Storage-Kosten erhalten Sie auf der Seite Cloud Storage – Preise.

Weitere Informationen zu den Kosten von BigQuery finden Sie auf der Seite BigQuery-Preise.

Weitere Informationen zu den Kosten für Vertex AI Search for Commerce finden Sie auf der Seite Preise für Vertex AI Search for Commerce.

Hinweis

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

Dataset vorbereiten

Öffnen Sie die Google Cloud Console und wählen Sie Ihr Google Cloud -Projekt aus. Notieren Sie sich die Projekt-ID auf der Dashboard-Seite auf der Karte Projektinformationen. Diese Projekt-ID benötigen Sie für die folgenden Schritte. Klicken Sie als Nächstes oben in der Console auf die Schaltfläche Cloud Shell aktivieren.

Cloud Shell

Im unteren Bereich der Google Cloud Console wird ein neuer Frame mit einer Cloud Shell-Sitzung und einer Befehlszeilen-Eingabeaufforderung geöffnet.

Dataset importieren

  1. Laden Sie in Cloud Shell das Quell-Dataset herunter und entpacken Sie es:

    wget https://files.grouplens.org/datasets/movielens/ml-latest.zip
    unzip ml-latest.zip
    
  2. Erstellen Sie einen Cloud Storage-Bucket und laden Sie die Daten in diesen hoch:

    gcloud storage buckets create gs://PROJECT_ID-movielens-data
    gcloud storage cp ml-latest/movies.csv ml-latest/ratings.csv \
      gs://PROJECT_ID-movielens-data
    
  3. Erstellen Sie ein BigQuery-Dataset:

    bq mk movielens
    
  4. Laden Sie movies.csv in eine neue BigQuery-Tabelle für Filme:

    bq load --skip_leading_rows=1 movielens.movies \
      gs://PROJECT_ID-movielens-data/movies.csv \
      movieId:integer,title,genres
    
  5. Laden Sie ratings.csv in eine neue BigQuery-Tabelle für Bewertungen:

    bq load --skip_leading_rows=1 movielens.ratings \
      gs://PROJECT_ID-movielens-data/ratings.csv \
      userId:integer,movieId:integer,rating:float,time:timestamp
    

BigQuery-Ansichten erstellen

  1. Erstellen Sie eine Ansicht, die die Filme-Tabelle in das Retail-Produktkatalogschema konvertiert:

    bq mk --project_id=PROJECT_ID \
     --use_legacy_sql=false \
     --view '
     SELECT
       CAST(movieId AS string) AS id,
       SUBSTR(title, 0, 128) AS title,
       SPLIT(genres, "|") AS categories
     FROM `PROJECT_ID.movielens.movies`' \
    movielens.products
    

    Jetzt hat die neue Ansicht das Schema, das von Vertex AI Search for Commerce erwartet wird. Wählen Sie dann in der linken Seitenleiste BIG DATA -> BigQuery aus. Maximieren Sie anschließend in der Explorerleiste auf der linken Seite den Projektnamen und wählen Sie movielens -> products aus, um die Abfrageseite für diese Ansicht zu öffnen.

    Produktansicht

  2. Jetzt wandeln Sie Filmbewertungen in Nutzerereignisse um. Konkret werden wir Folgendes tun:

    • Negative Filmbewertungen ignorieren (<4)
    • Jede positive Bewertung als Aufruf einer Produktseite behandeln (detail-page-view)
    • Die MovieLens-Zeitachse auf die letzten 90 Tage skalieren. Hierfür gibt es zwei Gründe:
      • Für Vertex AI Search for Commerce müssen Nutzerereignisse nicht älter als von 2015 sein. MovieLens-Bewertungen reichen bis 1995 zurück.
      • Vertex AI Search for Commerce verwendet die letzten 90 Tage von Nutzerereignissen, wenn Vorhersageanfragen für einen Nutzer verarbeitet werden. Jeder Nutzer hat scheinbar aktuelle Ereignisse, wenn wir später Vorhersagen für einen Nutzer treffen.

    Eine BigQuery-Ansicht erstellen. Der folgende Befehl verwendet eine SQL-Abfrage, die die oben aufgeführten Konvertierungsanforderungen erfüllt.

    bq mk --project_id=PROJECT_ID \
     --use_legacy_sql=false \
     --view '
     WITH t AS (
       SELECT
         MIN(UNIX_SECONDS(time)) AS old_start,
         MAX(UNIX_SECONDS(time)) AS old_end,
         UNIX_SECONDS(TIMESTAMP_SUB(
           CURRENT_TIMESTAMP(), INTERVAL 90 DAY)) AS new_start,
         UNIX_SECONDS(CURRENT_TIMESTAMP()) AS new_end
       FROM `PROJECT_ID.movielens.ratings`)
     SELECT
       CAST(userId AS STRING) AS visitorId,
       "detail-page-view" AS eventType,
       FORMAT_TIMESTAMP(
         "%Y-%m-%dT%X%Ez",
         TIMESTAMP_SECONDS(CAST(
           (t.new_start + (UNIX_SECONDS(time) - t.old_start) *
             (t.new_end - t.new_start) / (t.old_end - t.old_start))
         AS int64))) AS eventTime,
       [STRUCT(STRUCT(movieId AS id) AS product)] AS productDetails,
     FROM `PROJECT_ID.movielens.ratings`, t
     WHERE rating >= 4' \
    movielens.user_events
    

Produktkatalog und Nutzerereignisse importieren

Wir können jetzt den Produktkatalog und die Nutzerereignisdaten in Vertex AI Search for Commerce importieren.

  1. Aktivieren Sie die Vertex AI Search for Commerce API für Ihr Google Cloud Projekt.

    API AKTIVIEREN

  2. Klicken Sie auf Jetzt starten.

  3. Rufen Sie in der Search for Commerce Console die Seite Daten auf.

    Zur Seite „Daten“

  4. Klicken Sie auf Importieren.

Produktkatalog importieren

  1. Füllen Sie das Formular aus, um Produkte aus der oben erstellten BigQuery-Ansicht zu importieren:

    • Wählen Sie den Importtyp aus: Produktkatalog.
    • Wählen Sie den Standardzweignamen aus.
    • Wählen Sie die Datenquelle aus: BigQuery.
    • Wählen Sie das Datenschema aus: Retail-Produktschema.
    • Geben Sie den Namen der BigQuery-Ansicht für Produkte ein, die Sie oben erstellt haben (PROJECT_ID.movielens.products).

  2. Klicken Sie auf Importieren.

  3. Warten Sie fünf bis zehn Minuten, bis alle Produkte importiert sind.

    Sie können die Importaktivität auf den Status des Importvorgangs prüfen. Wenn der Import abgeschlossen ist, ändert sich der Status des Importvorgangs in Erfolgreich.

    Importaktivitäten für Produkte

Nutzerereignisse importieren

  1. Importieren Sie die BigQuery-Ansicht „user_events“:

    • Wählen Sie den Importtyp aus: Nutzerereignisse.
    • Wählen Sie die Datenquelle aus: BigQuery.
    • Wählen Sie das Datenschema aus: Schema für Nutzerereignisse in Retail.
    • Geben Sie den Namen der BigQuery-Ansicht user_events ein, die Sie oben erstellt haben.
  2. Klicken Sie auf Importieren.

  3. Warten Sie, bis mindestens eine Million Ereignisse importiert wurden, bevor Sie mit dem nächsten Schritt fortfahren, um die Datenanforderungen für das Training eines neuen Modells zu erfüllen.

    Sie können die Importaktivität auf den Vorgangsstatus prüfen. Der Vorgang dauert etwa eine Stunde.

    Ereignisimportaktivität

Empfehlungsmodelle trainieren und bewerten

Empfehlungsmodell erstellen

  1. Rufen Sie in der Search for Commerce Console die Seite Modelle auf.

    Zur Seite „Modelle“

  2. Klicken Sie auf Modell erstellen:

    • Geben Sie einen Namen für das Modell ein.
    • Wählen Sie Was Ihnen sonst noch gefallen könnte als Modelltyp aus.
    • Wählen Sie Klickrate (Click-through-Rate, CTR) als Geschäftsziel aus.
  3. Klicken Sie auf Erstellen.

    Modell erstellen

    Ihr neues Modell beginnt mit dem Training.

    Modell erstellt

Bereitstellungskonfiguration erstellen

  1. Rufen Sie in der Search for Commerce Console die Seite Bereitstellungskonfigurationen auf.

    Zur Seite „Bereitstellungskonfigurationen“

  2. Klicken Sie auf Bereitstellungskonfiguration erstellen.

    • Wählen Sie Empfehlung aus.
    • Geben Sie einen Namen für die Bereitstellungskonfiguration ein.
    • Wählen Sie das von Ihnen erstellte Modell aus.
  3. Klicken Sie auf Erstellen.

Warten Sie, bis das Modell bereit für die Abfrage ist.

Es dauert ungefähr zwei Tage, bis das Modell trainiert und bereit für die Abfrage ist.

Klicken Sie zum Anzeigen des Status auf die erstellte Bereitstellungskonfiguration auf der Seite „Bereitstellungskonfigurationen“.

Im Feld Bereit zum Abfragen des Modells wird Ja angezeigt, wenn der Vorgang abgeschlossen ist.

Vorschau von Empfehlungen

Sobald das Modell zum Abfragen bereit ist:

  1. Rufen Sie in der Search for Commerce Console die Seite Bereitstellungskonfigurationen auf.

    Zur Seite „Bereitstellungskonfigurationen“
  2. Klicken Sie auf den Namen der Bereitstellungskonfiguration, um die zugehörige Detailseite aufzurufen.
  3. Klicken Sie auf den Tab Bewerten.
  4. Geben Sie eine Seed-Film-ID ein, z. B. 4993 für „The Lord of the Rings: The Fellowship of the Ring (2001)“.

    ID eingeben

  5. Klicken Sie auf Vorhersagevorschau, um die Liste der empfohlenen Elemente rechts auf der Seite zu sehen.

Bereinigen

Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, löschen Sie entweder das Projekt, das die Ressourcen enthält, oder Sie behalten das Projekt und löschen die einzelnen Ressourcen.

Projekt löschen

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

Einzelne Ressourcen löschen

  1. Rufen Sie die Seite Bereitstellungskonfigurationen auf und löschen Sie die Bereitstellungskonfiguration, die Sie erstellt haben.

  2. Rufen Sie die Seite Modelle auf und löschen Sie das Modell.

  3. Löschen Sie das BigQuery-Dataset in Cloud Shell:

    bq rm --recursive --dataset movielens
    
  4. Löschen Sie den Cloud Storage-Bucket und seinen Inhalt:

    gcloud storage rm gs://PROJECT_ID-movielens-data --recursive
    

Nächste Schritte