Erste Schritte: Mediensuche
Sie können schnell eine hochmoderne App für Mediensuchen erstellen. Durch Mediensuchen können Ihre Zielgruppen Inhalte entdecken, wobei die Ergebnisse Google-Qualität haben.
Allgemeine Informationen zu Vertex AI Search für Medien finden Sie unter Einführung in die Mediensuche und ‑empfehlungen.In dieser Anleitung werden Sie das Dataset Movielens nutzen, um zu verstehen, wie Sie einen Medieninhaltskatalog in Vertex AI Search hochladen. Das Movielens-Dataset enthält einen Katalog an Filmen (Dokumenten).
Nach dem Hochladen der Filmdaten erstellen Sie eine Such-App und testen diese auf der Vorschauseite.
Wenn Sie die Anleitung Erste Schritte: Medienempfehlungen abgeschlossen haben und den Datenspeicher noch haben (vorgeschlagener Name: quickstart-media-data-store
), können Sie diesen Datenspeicher verwenden, anstatt einen weiteren zu erstellen. In diesem Fall sollten Sie die Anleitung mit dem Schritt Anwendung für Mediensuchen erstellen beginnen.
Geschätzte Dauer, um dieses Tutorial abzuschließen: ca. 1 Stunde
Lernziele
- Erfahren Sie, wie Sie Mediendokumenten importieren, um einen Mediendatenspeicher zu erstellen.
- Suchanwendung erstellen, konfigurieren und testen
Bevor Sie mit dieser Anleitung beginnen, führen Sie die Schritte unter Bevor Sie beginnen aus.
Klicken Sie auf Anleitung, um eine detaillierte Anleitung für diese Aufgabe direkt in der Google Cloud Console aufzurufen.
Hinweise
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI Agent Builder, Cloud Storage, BigQuery APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI Agent Builder, Cloud Storage, BigQuery APIs.
Dataset vorbereiten
Hinweis: Wenn Sie die Anleitung Erste Schritte: Medienempfehlungen abgeschlossen haben und den Datenspeicher noch haben (vorgeschlagener Name:quickstart-media-data-store
), fahren Sie mit App für die Mediensuche erstellen fort.
Sie importieren das Movielens-Dataset mit Cloud Shell und strukturieren das Dataset für Vertex AI Search für Medien neu.
Cloud Shell öffnen
- Öffnen Sie die Google Cloud Console.
- Wählen Sie Ihr Google Cloud-Projekt aus.
- Notieren Sie sich die Projekt-ID auf der Dashboard-Seite auf der Karte Projektinformationen. Sie benötigen die Projekt-ID für die folgenden Schritte.
Klicken Sie oben im Console-Fenster auf die Schaltfläche Cloud Shell aktivieren. Im unteren Bereich der Google Cloud Console wird ein neues Feld mit einer Cloud Shell-Sitzung und einer Befehlszeilen-Eingabeaufforderung geöffnet.
Dataset importieren
Das Movielens-Dataset ist in einem öffentlichen Cloud Storage-Bucket verfügbar, um den Import zu vereinfachen.
Führen Sie die folgenden Elemente mit Ihrer Projekt-ID aus, um das Standardprojekt für die Befehlszeile festzulegen.
gcloud config set project PROJECT_ID
Erstellen Sie ein BigQuery-Dataset:
bq mk movielens
Laden Sie
movies.csv
in eine neuemovies
-BigQuery-Tabelle:bq load --skip_leading_rows=1 movielens.movies \ gs://cloud-samples-data/gen-app-builder/media-recommendations/movies.csv \ movieId:integer,title,genres
Laden Sie
ratings.csv
in eine neueratings
-BigQuery-Tabelle:bq load --skip_leading_rows=1 movielens.ratings \ gs://cloud-samples-data/gen-app-builder/media-recommendations/ratings.csv \ userId:integer,movieId:integer,rating:float,time:timestamp
BigQuery-Ansichten erstellen
In diesem Schritt strukturieren Sie das Movielens-Dataset so um, dass es dem erwarteten Format für Mediendatenspeicher entspricht.
Für diesen Leitfaden erstellen Sie fiktive view-item
-Nutzerereignisse in den letzten 90 Tagen aus positiven Bewertungen (< 4
).
Erstellen Sie eine Ansicht, die die Tabelle „Movies“ in das
Document
-Schema konvertiert:bq mk --project_id=PROJECT_ID \ --use_legacy_sql=false \ --view ' WITH t AS ( SELECT CAST(movieId AS string) AS id, SUBSTR(title, 0, 128) AS title, SPLIT(genres, "|") AS categories FROM `PROJECT_ID.movielens.movies`) SELECT id, "default_schema" as schemaId, null as parentDocumentId, TO_JSON_STRING(STRUCT(title as title, categories as categories, CONCAT("http://mytestdomain.movie/content/", id) as uri, "2023-01-01T00:00:00Z" as available_time, "2033-01-01T00:00:00Z" as expire_time, "movie" as media_type)) as jsonData FROM t;' \ movielens.movies_view
Jetzt hat die neue Ansicht das Schema, das die Vertex AI Agent Builder API erwartet.
Rufen Sie in der Google Cloud Console die Seite BigQuery auf.
Maximieren Sie im Bereich Explorer den Projektnamen, maximieren Sie das Dataset
movielens
und klicken Sie aufmovies_view
, um das Abfrageseite für diese Ansicht aufrufen.Rufen Sie den Tab Tabellen-Explorer auf.
Klicken Sie im Bereich Generierte Abfrage auf die Schaltfläche In Abfrage kopieren. Der Abfrageeditor wird geöffnet.
Klicken Sie auf Ausführen, um Filmdaten in der von Ihnen erstellten Ansicht anzuzeigen.
Erstellen Sie fiktive Nutzerereignisse aus Filmbewertungen mit dem folgenden Cloud Shell-Befehl:
bq mk --project_id=PROJECT_ID \ --use_legacy_sql=false \ --view ' WITH t AS ( SELECT MIN(UNIX_SECONDS(time)) AS old_start, MAX(UNIX_SECONDS(time)) AS old_end, UNIX_SECONDS(TIMESTAMP_SUB( CURRENT_TIMESTAMP(), INTERVAL 90 DAY)) AS new_start, UNIX_SECONDS(CURRENT_TIMESTAMP()) AS new_end FROM `PROJECT_ID.movielens.ratings`) SELECT CAST(userId AS STRING) AS userPseudoId, "view-item" AS eventType, FORMAT_TIMESTAMP("%Y-%m-%dT%X%Ez", TIMESTAMP_SECONDS(CAST( (t.new_start + (UNIX_SECONDS(time) - t.old_start) * (t.new_end - t.new_start) / (t.old_end - t.old_start)) AS int64))) AS eventTime, [STRUCT(movieId AS id, null AS name)] AS documents, FROM `PROJECT_ID.movielens.ratings`, t WHERE rating >= 4;' \ movielens.user_events
Vertex AI Agent Builder aktivieren
Rufen Sie in der Google Cloud Console die Seite Agent Builder auf.
Lesen und akzeptieren Sie die Nutzungsbedingungen und klicken Sie anschließend auf Fortfahren und API aktivieren.
App für Mediensuchen erstellen
Die Verfahren in diesem Abschnitt führen Sie durch das Erstellen und Bereitstellen einer Anwendung für Mediensuchen.
Rufen Sie in der Google Cloud Console die Seite Agent Builder auf.
Klicken Sie auf
App erstellen .Klicken Sie auf der Seite App erstellen unter Medienkatalogsuche auf Erstellen.
Geben Sie im Feld Anwendungsname einen Namen für die Anwendung ein, z.B.
quickstart-media-search
. Die Anwendungs-ID wird unter dem Suchmaschinenname angezeigt.Klicken Sie auf Weiter.
Wenn Sie die Anleitung Erste Schritte mit Medienempfehlungen abgeschlossen haben und den Datenspeicher noch haben (vorgeschlagener Name:
quickstart-media-data-store
), wählen Sie ihn aus, klicken Sie auf Erstellen und gehen Sie zu Suche in der Vorschau ansehen.Wenn Sie keinen Datenspeicher haben, der das Movielens-Dataset enthält, erstellen Sie einen neuen Datenspeicher und wählen diesen aus:
Klicken Sie auf der Seite Datenspeicher auf Neuen Datenspeicher erstellen.
Geben Sie einen Anzeigenamen für den Datenspeicher ein, z. B.
quickstart-media-data-store
, und klicken Sie dann auf Erstellen.Wählen Sie den soeben erstellten Datenspeicher aus und klicken Sie auf Erstellen, um Ihre Anwendung zu erstellen. Sie werden auf die Seite Datenquelle auswählen weitergeleitet.
Daten importieren
Importieren Sie als Nächstes die zuvor formatierten Filme und Nutzerereignisdaten.
Dokumente importieren
Wenn Sie nicht automatisch zur Seite Datenquelle auswählen weitergeleitet werden:
- Öffnen Sie den Tab Dokumente.
- Klicken Sie auf Daten importieren.
Wählen Sie auf der Seite Datenquelle auswählen die Option BigQuery aus.
Geben Sie den Namen der von Ihnen erstellten BigQuery-Ansicht
movies
ein und klicken Sie auf Importieren.PROJECT_ID.movielens.movies_view
Warten Sie, bis alle Dokumente importiert wurden. Dies dauert etwa 15 Minuten. Nach Abschluss sollten 86.537 Dokumente vorhanden sein.
Sie können den Status des Importvorgangs auf dem Tab Aktivität prüfen. Wenn der Import abgeschlossen ist, ändert sich der Status des Importvorgangs in Erfolgreich.
Nutzerereignisse importieren
Öffnen Sie den Tab Ereignisse.
Klicken Sie auf Ereignisse importieren.
Wählen Sie BigQuery aus.
Geben Sie den Namen der von Ihnen erstellten BigQuery-Ansicht
user_events
ein und klicken Sie auf Importieren.PROJECT_ID.movielens.user_events
Sie können mit dem nächsten Schritt fortfahren, bevor die Ereignisse importiert wurden, aber die Suchergebnisse enthalten dann noch nicht das vollständige Dataset.
Sie können den Status des Vorgangs auf dem Tab Aktivität prüfen. Der Prozess dauert etwa eine Stunde, weil Sie Millionen von Zeilen importieren.
Vorschau der Suche anzeigen und Suche konfigurieren
Klicken Sie im Navigationsmenü auf
Konfigurationen .Geben Sie in das Feld Hier suchen den Namen eines Films ein, z. B. „Der Herr der Ringe“.
Die Suchergebnisse sind für den eingegebenen Filmtitel relevant.
Auf dieser Seite können Sie anpassen, wie das Such-Widget die Suchergebnisse anzeigt. Weitere Informationen finden Sie unter Ergebnisse für das Such-Widget konfigurieren.
Bei Apps für Mediensuchen haben Sie folgende Möglichkeiten:
- Felder für die Suche konfigurieren
- Automatische Vervollständigung konfigurieren
- Suchergebnisse konfigurieren
Nachdem Sie die Änderungen vorgenommen haben, klicken Sie auf Speichern und veröffentlichen, um das Widget zu aktualisieren.
Such-Widget bereitstellen
Klicken Sie im Navigationsmenü auf Integration.
Achten Sie darauf, dass der Tab Widget ausgewählt ist.
Wählen Sie als Widget-Autorisierungstyp JWT- oder OAuth-basiert aus.
Geben Sie im Feld Domain den Domainnamen der Webseite ein, auf der Sie das Widget einfügen werden. Wenn Sie beispielsweise das Widget auf die Webseite
example.com/ai.html
kopieren, geben Sieexample.com
als Domain ein.Klicken Sie auf Hinzufügen und dann auf Speichern.
Kopieren Sie das Code-Snippet im Abschnitt Kopieren Sie den folgenden Code in Ihre Webanwendung.
Generieren Sie in der Codebasis ein Autorisierungstoken.
Um das Autorisierungstoken an Ihr Widget zu übergeben, verwenden Sie das Code-Snippet "Autorisierungstoken festlegen" imKopieren Sie den folgenden Code in Ihre Webanwendung Abschnitt und ersetzen Sie den Text
<JWT or OAuth token provided by you backend>
durch Ihr Autorisierungstoken.Wenn Sie Hilfe bei der Einbindung der Such-App in Ihre Webanwendung benötigen, finden Sie Codebeispiele unter Suchergebnisse abrufen.
Bereinigen
Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:
Sie können den Datenspeicher, den Sie in der Anleitung Erste Schritte: Medienempfehlungen für Medienempfehlungen erstellt haben, wiederverwenden. Arbeiten Sie diese Anleitung durch, bevor Sie diesen Bereinigungsvorgang ausführen.
- Löschen Sie Ihr Projekt mit der Google Cloud Console, wenn Sie es nicht mehr benötigen, um unnötige Google Cloud-Gebühren zu vermeiden.
- Wenn Sie ein neues Projekt erstellt haben, um mehr über Vertex AI Agent Builder zu erfahren, und dieses Projekt nicht mehr benötigen, löschen Sie es.
- Wenn Sie ein vorhandenes Google Cloud-Projekt verwendet haben, löschen Sie die von Ihnen erstellten Ressourcen. So vermeiden Sie, dass Ihrem Konto Gebühren in Rechnung gestellt werden. Weitere Informationen finden Sie unter App löschen, Daten dauerhaft aus einem Datenspeicher löschen und Datenspeicher löschen.
- Führen Sie die Schritte unter Vertex AI Agent Builder deaktivieren aus.
Wenn Sie ein BigQuery-Dataset erstellt haben, löschen Sie es in Cloud Shell:
bq rm --recursive --dataset movielens