Inizia a utilizzare la ricerca di contenuti multimediali

Puoi creare rapidamente un'app di ricerca di contenuti multimediali all'avanguardia. La ricerca di contenuti multimediali consente al pubblico di scoprire contenuti grazie a risultati di qualità Google.

Per informazioni generali su Vertex AI Search per i contenuti multimediali, consulta Introduzione alla ricerca e ai consigli sui contenuti multimediali.

In questo tutorial introduttivo, utilizzerai il set di dati Movielens per scoprire come caricare il tuo catalogo di contenuti multimediali in Vertex AI Search. Il set di dati Movielens contiene un catalogo di film (documenti).

Dopo aver caricato i dati dei film, dovrai creare un'app di ricerca e testarla tramite la pagina di anteprima.

Se hai completato il tutorial Inizia a usare suggerimenti sui contenuti multimediali e hai ancora il datastore (nome suggerito quickstart-media-data-store), puoi utilizzarlo invece di crearne un altro. In questo caso, dovresti iniziare il tutorial da Creare un'app per la ricerca di contenuti multimediali.

Tempo stimato per completare questo tutorial: circa 1 ora.

Obiettivi

  • Scopri come importare documenti multimediali per creare un datastore di contenuti multimediali.
  • Crea, configura e testa un'app di ricerca.

Prima di seguire questo tutorial, assicurati di aver svolto i passaggi descritti in Prima di iniziare.


Per seguire le indicazioni dettagliate per questa attività direttamente nella console Google Cloud, fai clic su Procedura guidata:

Procedura guidata


Prima di iniziare

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI Agent Builder, Cloud Storage, BigQuery APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI Agent Builder, Cloud Storage, BigQuery APIs.

    Enable the APIs

Prepara il set di dati

Nota: se hai completato il tutorial Inizia a usare suggerimenti sui contenuti multimediali e hai ancora il datastore (nome suggerito quickstart-media-data-store), vai a Crea un'app per la ricerca di contenuti multimediali.

Puoi utilizzare Cloud Shell per importare il set di dati Movielens e ristrutturarlo per usarlo in Vertex AI Search per i contenuti multimediali.

Apri Cloud Shell

  1. Apri la console Google Cloud.
  2. Selezionare il tuo progetto Google Cloud.
  3. Prendi nota dell'ID progetto nella scheda Informazioni sul progetto della pagina della dashboard. Ti servirà l'ID progetto per le seguenti procedure.
  4. Fai clic sul pulsante Attiva Cloud Shell nella parte superiore della console. All'interno di un nuovo frame nella parte inferiore della console Google Cloud si apre una sessione di Cloud Shell e viene visualizzato un prompt della riga di comando.

    Cloud Shell

Importa il set di dati

Il set di dati Movielens è disponibile in un bucket Cloud Storage pubblico per semplificarne l'importazione.

  1. Esegui il comando seguente utilizzando l'ID progetto in modo da impostare il progetto predefinito per la riga di comando.

    gcloud config set project PROJECT_ID
    
  2. Crea un set di dati BigQuery:

    bq mk movielens
    
  3. Carica movies.csv in una nuova tabella BigQuery movies:

    bq load --skip_leading_rows=1 movielens.movies \
      gs://cloud-samples-data/gen-app-builder/media-recommendations/movies.csv \
      movieId:integer,title,genres
    
  4. Carica ratings.csv in una nuova tabella BigQuery ratings:

    bq load --skip_leading_rows=1 movielens.ratings \
      gs://cloud-samples-data/gen-app-builder/media-recommendations/ratings.csv \
      userId:integer,movieId:integer,rating:float,time:timestamp
    

Crea le viste BigQuery

In questo passaggio ristrutturerai il set di dati Movielens in modo che rispetti il formato previsto per i datastore di contenuti multimediali.

Per questa guida, creerai eventi utente view-item fittizi negli ultimi 90 giorni a partire da valutazioni positive (< 4).

  1. Crea una vista che converta la tabella dei film nello schema Document:

    bq mk --project_id=PROJECT_ID \
     --use_legacy_sql=false \
     --view '
      WITH t AS (
        SELECT
          CAST(movieId AS string) AS id,
          SUBSTR(title, 0, 128) AS title,
          SPLIT(genres, "|") AS categories
          FROM `PROJECT_ID.movielens.movies`)
        SELECT
          id, "default_schema" as schemaId, null as parentDocumentId,
          TO_JSON_STRING(STRUCT(title as title, categories as categories,
          CONCAT("http://mytestdomain.movie/content/", id) as uri,
          "2023-01-01T00:00:00Z" as available_time,
          "2033-01-01T00:00:00Z" as expire_time,
          "movie" as media_type)) as jsonData
        FROM t;' \
    movielens.movies_view
    

    Ora la vista nuova ha lo schema previsto dall'API Vertex AI Agent Builder.

  2. Vai alla pagina BigQuery nella console Google Cloud.

    Vai a BigQuery

  3. Nel riquadro Explorer espandi il nome del progetto, quindi il set di dati movielens e fai clic su movies_view per aprire la pagina di query per questa vista.

    Visualizzazione Prodotti

  4. Vai alla scheda Esplora tabelle.

  5. Nel riquadro Query generata, fai clic sul pulsante Copia nella query. Si apre l'editor di query.

  6. Fai clic su Esegui per vedere i dati dei film nella vista che hai creato.

  7. Per creare eventi utente fittizi partendo dalle valutazioni dei film, esegui questo comando Cloud Shell:

    bq mk --project_id=PROJECT_ID \
     --use_legacy_sql=false \
     --view '
     WITH t AS (
      SELECT
        MIN(UNIX_SECONDS(time)) AS old_start,
        MAX(UNIX_SECONDS(time)) AS old_end,
        UNIX_SECONDS(TIMESTAMP_SUB(
        CURRENT_TIMESTAMP(), INTERVAL 90 DAY)) AS new_start,
        UNIX_SECONDS(CURRENT_TIMESTAMP()) AS new_end
      FROM `PROJECT_ID.movielens.ratings`)
      SELECT
        CAST(userId AS STRING) AS userPseudoId,
        "view-item" AS eventType,
        FORMAT_TIMESTAMP("%Y-%m-%dT%X%Ez",
        TIMESTAMP_SECONDS(CAST(
          (t.new_start + (UNIX_SECONDS(time) - t.old_start) *
          (t.new_end - t.new_start) / (t.old_end - t.old_start))
        AS int64))) AS eventTime,
        [STRUCT(movieId AS id, null AS name)] AS documents,
      FROM `PROJECT_ID.movielens.ratings`, t
      WHERE rating >= 4;' \
      movielens.user_events
    

Attiva Vertex AI Agent Builder

  1. Nella console Google Cloud, vai alla pagina Agent Builder.

    Agent Builder

  2. Leggi e accetta i Termini di servizio, quindi fai clic su Continua e attiva l'API.

Le procedure descritte in questa sezione ti guideranno attraverso la creazione e il deployment di un'app per la ricerca di contenuti multimediali.

  1. Nella console Google Cloud, vai alla pagina Agent Builder.

    Agent Builder

  2. Fai clic su Crea app.

  3. Nella pagina Crea app, fai clic su Crea in Ricerca nel catalogo multimediale.

  4. Nel campo Il nome dell'app, inserisci un nome per l'app, ad esempio quickstart-media-search. L'ID dell'app è riportato sotto il nome del motore.

  5. Fai clic su Continua.

  6. Se hai completato il tutorial Inizia a usare suggerimenti sui contenuti multimediali e hai ancora il datastore (nome suggerito quickstart-media-data-store), selezionalo, fai clic su Crea e vai ad Anteprima della ricerca.

  7. Se non hai un datastore che contiene il set di dati Movielens, crea un nuovo datastore e selezionalo:

    1. Nella pagina Datastore, fai clic su Crea datastore.

    2. Inserisci un nome visualizzato per il datastore, ad esempio quickstart-media-data-store, poi fai clic su Crea.

    3. Seleziona il datastore appena creato, poi fai clic su Crea per creare la tua app. Si aprirà la pagina Seleziona un'origine dati.

Importa dati

Devi quindi importare i dati sui film e sugli eventi utente formattati in precedenza.

Importa documenti

  1. Se non compare automaticamente la pagina Seleziona un'origine dati:

    • Apri la scheda Documenti.
    • Fai clic su Importa dati.
  2. Nella pagina Seleziona un'origine dati, seleziona BigQuery.

  3. Inserisci il nome della vista BigQuery movies che hai creato e fai clic su Importa.

    PROJECT_ID.movielens.movies_view
    
  4. Attendi che siano stati importati tutti i documenti. L'operazione dovrebbe richiedere circa 15 minuti. Al termine, dovrebbero essere presenti 86.537 documenti.

    Puoi controllare lo stato dell'operazione di importazione nella scheda Attività. Quando l'importazione viene completata, lo stato dell'operazione diventa Completato.

Importa gli eventi utente

  1. Apri la scheda Eventi.

  2. Fai clic su Importa eventi.

  3. Seleziona BigQuery.

  4. Inserisci il nome della vista BigQuery user_events che hai creato e fai clic su Importa.

    PROJECT_ID.movielens.user_events
    
  5. Puoi procedere al passaggio successivo prima dell'importazione degli eventi, ma i risultati di ricerca non conterranno ancora il set di dati completo.

    Puoi controllare lo stato dell'operazione nella scheda Attività. Il completamento del processo richiede circa un'ora, dato che è in corso l'importazione di milioni di righe.

  1. Nel menu di navigazione, fai clic su Configurazioni.

  2. Nella casella Cerca qui, digita il nome di un film, ad esempio "The Lord of the Rings" (Il Signore degli Anelli).

  3. Tieni presente che i risultati di ricerca sono pertinenti al titolo del filmato inserito.

  4. In questa pagina puoi personalizzare la modalità di visualizzazione delle informazioni dei risultati di ricerca nel widget di ricerca. Per saperne di più, consulta Configurare i risultati per widget di ricerca.

    Per le app di ricerca di contenuti multimediali, puoi:

    Dopo aver apportato le modifiche, fai clic su Salva e pubblica per aggiornare il widget.

Esegui il deployment del widget di ricerca

  1. Nel menu di navigazione, fai clic su Integrazione.

  2. Assicurati che la scheda Widget sia selezionata.

  3. Seleziona Basato su JWT o OAuth come tipo di autorizzazione del widget.

  4. Nel campo Dominio, inserisci il nome di dominio della pagina web in cui inserirai il widget. Ad esempio, se copi il widget nella pagina web example.com/ai.html, inserisci example.com come dominio.

  5. Fai clic su Aggiungi e poi su Salva.

  6. Copia lo snippet di codice fornito nella sezione Copia il seguente codice nella tua applicazione web.

  7. Nel codebase, genera un token di autorizzazione.

  8. Per passare il token di autorizzazione al widget, usa lo snippet di codice "Imposta token di autorizzazione" fornito nellaCopia il seguente codice nella tua applicazione web e sostituisci il testo <JWT or OAuth token provided by you backend> con il token di autorizzazione.

  9. Per informazioni su come integrare l'app di ricerca nella tua app web, consulta gli esempi di codice in Ottieni i risultati di ricerca.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.

Puoi riutilizzare il datastore che hai creato per i suggerimenti sui contenuti multimediali nel tutorial Inizia a usare suggerimenti sui contenuti multimediali. Prova questo tutorial prima di eseguire la procedura di pulizia.

  1. Per evitare addebiti Google Cloud non necessari, utilizza la console Google Cloud per eliminare il progetto se non ti serve.
  2. Se hai creato un nuovo progetto per prendere dimestichezza con Vertex AI Agent Builder, ma non ne hai più bisogno, elimina il progetto.
  3. Se hai utilizzato un progetto Google Cloud esistente, elimina le risorse che hai creato per evitare addebiti sul tuo account. Per ulteriori informazioni, consulta Eliminare un'app, Eliminare definitivamente i dati da un datastore ed Eliminare un datastore.
  4. Segui i passaggi descritti in Disattivare Vertex AI Agent Builder.
  5. Se hai creato un set di dati BigQuery, eliminalo in Cloud Shell:

    bq rm --recursive --dataset movielens
    

Passaggi successivi