Erste Schritte: Mediensuche

Sie können schnell eine hochmoderne App für Mediensuchen erstellen. Durch Mediensuchen können Ihre Zielgruppen Inhalte entdecken, wobei die Ergebnisse Google-Qualität haben.

Allgemeine Informationen zu Vertex AI Search für Medien finden Sie unter Einführung in die Mediensuche und ‑empfehlungen.

In dieser Anleitung werden Sie das Dataset Movielens nutzen, um zu verstehen, wie Sie einen Medieninhaltskatalog in Vertex AI Search hochladen. Das Movielens-Dataset enthält einen Katalog an Filmen (Dokumenten).

Nach dem Hochladen der Filmdaten erstellen Sie eine Such-App und testen diese auf der Vorschauseite.

Wenn Sie die Anleitung Erste Schritte: Medienempfehlungen abgeschlossen haben und den Datenspeicher noch haben (vorgeschlagener Name: quickstart-media-data-store), können Sie diesen Datenspeicher verwenden, anstatt einen weiteren zu erstellen. In diesem Fall sollten Sie die Anleitung mit dem Schritt Anwendung für Mediensuchen erstellen beginnen.

Geschätzte Dauer, um dieses Tutorial abzuschließen: ca. 1 Stunde

Lernziele

  • Erfahren Sie, wie Sie Mediendokumenten importieren, um einen Mediendatenspeicher zu erstellen.
  • Suchanwendung erstellen, konfigurieren und testen

Bevor Sie mit dieser Anleitung beginnen, führen Sie die Schritte unter Bevor Sie beginnen aus.


Klicken Sie auf Anleitung, um eine detaillierte Anleitung für diese Aufgabe direkt in der Google Cloud Console aufzurufen.

Anleitung


Hinweise

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI Agent Builder, Cloud Storage, BigQuery APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI Agent Builder, Cloud Storage, BigQuery APIs.

    Enable the APIs

Dataset vorbereiten

Hinweis: Wenn Sie die Anleitung Erste Schritte: Medienempfehlungen abgeschlossen haben und den Datenspeicher noch haben (vorgeschlagener Name: quickstart-media-data-store), fahren Sie mit App für die Mediensuche erstellen fort.

Sie importieren das Movielens-Dataset mit Cloud Shell und strukturieren das Dataset für Vertex AI Search für Medien neu.

Cloud Shell öffnen

  1. Öffnen Sie die Google Cloud Console.
  2. Wählen Sie Ihr Google Cloud-Projekt aus.
  3. Notieren Sie sich die Projekt-ID auf der Dashboard-Seite auf der Karte Projektinformationen. Sie benötigen die Projekt-ID für die folgenden Schritte.
  4. Klicken Sie oben im Console-Fenster auf die Schaltfläche Cloud Shell aktivieren. Im unteren Bereich der Google Cloud Console wird ein neues Feld mit einer Cloud Shell-Sitzung und einer Befehlszeilen-Eingabeaufforderung geöffnet.

    Cloud Shell

Dataset importieren

Das Movielens-Dataset ist in einem öffentlichen Cloud Storage-Bucket verfügbar, um den Import zu vereinfachen.

  1. Führen Sie die folgenden Elemente mit Ihrer Projekt-ID aus, um das Standardprojekt für die Befehlszeile festzulegen.

    gcloud config set project PROJECT_ID
    
  2. Erstellen Sie ein BigQuery-Dataset:

    bq mk movielens
    
  3. Laden Sie movies.csv in eine neue movies-BigQuery-Tabelle:

    bq load --skip_leading_rows=1 movielens.movies \
      gs://cloud-samples-data/gen-app-builder/media-recommendations/movies.csv \
      movieId:integer,title,genres
    
  4. Laden Sie ratings.csv in eine neue ratings-BigQuery-Tabelle:

    bq load --skip_leading_rows=1 movielens.ratings \
      gs://cloud-samples-data/gen-app-builder/media-recommendations/ratings.csv \
      userId:integer,movieId:integer,rating:float,time:timestamp
    

BigQuery-Ansichten erstellen

In diesem Schritt strukturieren Sie das Movielens-Dataset so um, dass es dem erwarteten Format für Mediendatenspeicher entspricht.

Für diesen Leitfaden erstellen Sie fiktive view-item-Nutzerereignisse in den letzten 90 Tagen aus positiven Bewertungen (< 4).

  1. Erstellen Sie eine Ansicht, die die Tabelle „Movies“ in das Document-Schema konvertiert:

    bq mk --project_id=PROJECT_ID \
     --use_legacy_sql=false \
     --view '
      WITH t AS (
        SELECT
          CAST(movieId AS string) AS id,
          SUBSTR(title, 0, 128) AS title,
          SPLIT(genres, "|") AS categories
          FROM `PROJECT_ID.movielens.movies`)
        SELECT
          id, "default_schema" as schemaId, null as parentDocumentId,
          TO_JSON_STRING(STRUCT(title as title, categories as categories,
          CONCAT("http://mytestdomain.movie/content/", id) as uri,
          "2023-01-01T00:00:00Z" as available_time,
          "2033-01-01T00:00:00Z" as expire_time,
          "movie" as media_type)) as jsonData
        FROM t;' \
    movielens.movies_view
    

    Jetzt hat die neue Ansicht das Schema, das die Vertex AI Agent Builder API erwartet.

  2. Rufen Sie in der Google Cloud Console die Seite BigQuery auf.

    BigQuery aufrufen

  3. Maximieren Sie im Bereich Explorer den Projektnamen, maximieren Sie das Dataset movielens und klicken Sie auf movies_view, um das Abfrageseite für diese Ansicht aufrufen.

    Produktansicht

  4. Rufen Sie den Tab Tabellen-Explorer auf.

  5. Klicken Sie im Bereich Generierte Abfrage auf die Schaltfläche In Abfrage kopieren. Der Abfrageeditor wird geöffnet.

  6. Klicken Sie auf Ausführen, um Filmdaten in der von Ihnen erstellten Ansicht anzuzeigen.

  7. Erstellen Sie fiktive Nutzerereignisse aus Filmbewertungen mit dem folgenden Cloud Shell-Befehl:

    bq mk --project_id=PROJECT_ID \
     --use_legacy_sql=false \
     --view '
     WITH t AS (
      SELECT
        MIN(UNIX_SECONDS(time)) AS old_start,
        MAX(UNIX_SECONDS(time)) AS old_end,
        UNIX_SECONDS(TIMESTAMP_SUB(
        CURRENT_TIMESTAMP(), INTERVAL 90 DAY)) AS new_start,
        UNIX_SECONDS(CURRENT_TIMESTAMP()) AS new_end
      FROM `PROJECT_ID.movielens.ratings`)
      SELECT
        CAST(userId AS STRING) AS userPseudoId,
        "view-item" AS eventType,
        FORMAT_TIMESTAMP("%Y-%m-%dT%X%Ez",
        TIMESTAMP_SECONDS(CAST(
          (t.new_start + (UNIX_SECONDS(time) - t.old_start) *
          (t.new_end - t.new_start) / (t.old_end - t.old_start))
        AS int64))) AS eventTime,
        [STRUCT(movieId AS id, null AS name)] AS documents,
      FROM `PROJECT_ID.movielens.ratings`, t
      WHERE rating >= 4;' \
      movielens.user_events
    

Vertex AI Agent Builder aktivieren

  1. Rufen Sie in der Google Cloud Console die Seite Agent Builder auf.

    Zum Agent Builder

  2. Lesen und akzeptieren Sie die Nutzungsbedingungen und klicken Sie anschließend auf Fortfahren und API aktivieren.

Die Verfahren in diesem Abschnitt führen Sie durch das Erstellen und Bereitstellen einer Anwendung für Mediensuchen.

  1. Rufen Sie in der Google Cloud Console die Seite Agent Builder auf.

    Zum Agent Builder

  2. Klicken Sie auf App erstellen.

  3. Klicken Sie auf der Seite App erstellen unter Medienkatalogsuche auf Erstellen.

  4. Geben Sie im Feld Anwendungsname einen Namen für die Anwendung ein, z.B. quickstart-media-search. Die Anwendungs-ID wird unter dem Suchmaschinenname angezeigt.

  5. Klicken Sie auf Weiter.

  6. Wenn Sie die Anleitung Erste Schritte mit Medienempfehlungen abgeschlossen haben und den Datenspeicher noch haben (vorgeschlagener Name: quickstart-media-data-store), wählen Sie ihn aus, klicken Sie auf Erstellen und gehen Sie zu Suche in der Vorschau ansehen.

  7. Wenn Sie keinen Datenspeicher haben, der das Movielens-Dataset enthält, erstellen Sie einen neuen Datenspeicher und wählen diesen aus:

    1. Klicken Sie auf der Seite Datenspeicher auf Neuen Datenspeicher erstellen.

    2. Geben Sie einen Anzeigenamen für den Datenspeicher ein, z. B. quickstart-media-data-store, und klicken Sie dann auf Erstellen.

    3. Wählen Sie den soeben erstellten Datenspeicher aus und klicken Sie auf Erstellen, um Ihre Anwendung zu erstellen. Sie werden auf die Seite Datenquelle auswählen weitergeleitet.

Daten importieren

Importieren Sie als Nächstes die zuvor formatierten Filme und Nutzerereignisdaten.

Dokumente importieren

  1. Wenn Sie nicht automatisch zur Seite Datenquelle auswählen weitergeleitet werden:

    • Öffnen Sie den Tab Dokumente.
    • Klicken Sie auf Daten importieren.
  2. Wählen Sie auf der Seite Datenquelle auswählen die Option BigQuery aus.

  3. Geben Sie den Namen der von Ihnen erstellten BigQuery-Ansicht movies ein und klicken Sie auf Importieren.

    PROJECT_ID.movielens.movies_view
    
  4. Warten Sie, bis alle Dokumente importiert wurden. Dies dauert etwa 15 Minuten. Nach Abschluss sollten 86.537 Dokumente vorhanden sein.

    Sie können den Status des Importvorgangs auf dem Tab Aktivität prüfen. Wenn der Import abgeschlossen ist, ändert sich der Status des Importvorgangs in Erfolgreich.

Nutzerereignisse importieren

  1. Öffnen Sie den Tab Ereignisse.

  2. Klicken Sie auf Ereignisse importieren.

  3. Wählen Sie BigQuery aus.

  4. Geben Sie den Namen der von Ihnen erstellten BigQuery-Ansicht user_events ein und klicken Sie auf Importieren.

    PROJECT_ID.movielens.user_events
    
  5. Sie können mit dem nächsten Schritt fortfahren, bevor die Ereignisse importiert wurden, aber die Suchergebnisse enthalten dann noch nicht das vollständige Dataset.

    Sie können den Status des Vorgangs auf dem Tab Aktivität prüfen. Der Prozess dauert etwa eine Stunde, weil Sie Millionen von Zeilen importieren.

  1. Klicken Sie im Navigationsmenü auf Konfigurationen.

  2. Geben Sie in das Feld Hier suchen den Namen eines Films ein, z. B. „Der Herr der Ringe“.

  3. Die Suchergebnisse sind für den eingegebenen Filmtitel relevant.

  4. Auf dieser Seite können Sie anpassen, wie das Such-Widget die Suchergebnisse anzeigt. Weitere Informationen finden Sie unter Ergebnisse für das Such-Widget konfigurieren.

    Bei Apps für Mediensuchen haben Sie folgende Möglichkeiten:

    Nachdem Sie die Änderungen vorgenommen haben, klicken Sie auf Speichern und veröffentlichen, um das Widget zu aktualisieren.

Such-Widget bereitstellen

  1. Klicken Sie im Navigationsmenü auf Integration.

  2. Achten Sie darauf, dass der Tab Widget ausgewählt ist.

  3. Wählen Sie als Widget-Autorisierungstyp JWT- oder OAuth-basiert aus.

  4. Geben Sie im Feld Domain den Domainnamen der Webseite ein, auf der Sie das Widget einfügen werden. Wenn Sie beispielsweise das Widget auf die Webseite example.com/ai.html kopieren, geben Sie example.com als Domain ein.

  5. Klicken Sie auf Hinzufügen und dann auf Speichern.

  6. Kopieren Sie das Code-Snippet im Abschnitt Kopieren Sie den folgenden Code in Ihre Webanwendung.

  7. Generieren Sie in der Codebasis ein Autorisierungstoken.

  8. Um das Autorisierungstoken an Ihr Widget zu übergeben, verwenden Sie das Code-Snippet "Autorisierungstoken festlegen" imKopieren Sie den folgenden Code in Ihre Webanwendung Abschnitt und ersetzen Sie den Text<JWT or OAuth token provided by you backend> durch Ihr Autorisierungstoken.

  9. Wenn Sie Hilfe bei der Einbindung der Such-App in Ihre Webanwendung benötigen, finden Sie Codebeispiele unter Suchergebnisse abrufen.

Bereinigen

Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:

Sie können den Datenspeicher, den Sie in der Anleitung Erste Schritte: Medienempfehlungen für Medienempfehlungen erstellt haben, wiederverwenden. Arbeiten Sie diese Anleitung durch, bevor Sie diesen Bereinigungsvorgang ausführen.

  1. Löschen Sie Ihr Projekt mit der Google Cloud Console, wenn Sie es nicht mehr benötigen, um unnötige Google Cloud-Gebühren zu vermeiden.
  2. Wenn Sie ein neues Projekt erstellt haben, um mehr über Vertex AI Agent Builder zu erfahren, und dieses Projekt nicht mehr benötigen, löschen Sie es.
  3. Wenn Sie ein vorhandenes Google Cloud-Projekt verwendet haben, löschen Sie die von Ihnen erstellten Ressourcen. So vermeiden Sie, dass Ihrem Konto Gebühren in Rechnung gestellt werden. Weitere Informationen finden Sie unter App löschen, Daten dauerhaft aus einem Datenspeicher löschen und Datenspeicher löschen.
  4. Führen Sie die Schritte unter Vertex AI Agent Builder deaktivieren aus.
  5. Wenn Sie ein BigQuery-Dataset erstellt haben, löschen Sie es in Cloud Shell:

    bq rm --recursive --dataset movielens
    

Nächste Schritte