Considereremo ogni valutazione positiva di un film (valutazione >= 4) come un evento di visualizzazione della pagina del prodotto. Addestreremo un modello di consigli di tipo Altri film che potrebbero piacerti che farà consigli di film in base a qualsiasi utente o a un film di riferimento nel nostro set di dati.
Tempo stimato:
- Primi passaggi per iniziare l'addestramento del modello: circa 1,5 ore.
- Attesa dell'addestramento del modello: circa 2 giorni.
- Valutazione delle previsioni del modello e pulizia: circa 30 minuti.
Obiettivi
- Scopri come importare dati di prodotti ed eventi utente da BigQuery in Vertex AI Search per il commercio.
- Addestra e valuta i modelli di suggerimenti.
Costi
Questo tutorial utilizza i componenti fatturabili di Google Cloud, tra cui:- Cloud Storage
- BigQuery
- Vertex AI Search per il commercio
Per maggiori informazioni sui costi di Cloud Storage, consulta la pagina Prezzi di Cloud Storage.
Per ulteriori informazioni sui costi di BigQuery, consulta la pagina Prezzi di BigQuery.
Per saperne di più sui costi di Vertex AI Search per il commercio, consulta la pagina Prezzi di Vertex AI Search per il commercio.
Prima di iniziare
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
Prepara il set di dati
Apri la console Google Cloud e seleziona il tuo Google Cloud progetto. Prendi nota dell'ID progetto nella scheda Informazioni sul progetto nella pagina della dashboard. Ti servirà l'ID progetto per i passaggi successivi. Poi, fai clic sul pulsante Attiva Cloud Shell nella parte superiore della console.
All'interno di un nuovo frame nella parte inferiore della console Google Cloud si apre una sessione di Cloud Shell e viene visualizzato un prompt della riga di comando.
Importa il set di dati
Utilizzando Cloud Shell, scarica e decomprimi il set di dati di origine:
wget https://files.grouplens.org/datasets/movielens/ml-latest.zip unzip ml-latest.zip
Crea un bucket Cloud Storage e carica i dati al suo interno:
gcloud storage buckets create gs://PROJECT_ID-movielens-data gcloud storage cp ml-latest/movies.csv ml-latest/ratings.csv \ gs://PROJECT_ID-movielens-data
Crea un set di dati BigQuery:
bq mk movielens
Carica
movies.csv
in una nuova tabella BigQuery di film:bq load --skip_leading_rows=1 movielens.movies \ gs://PROJECT_ID-movielens-data/movies.csv \ movieId:integer,title,genres
Carica
ratings.csv
in una nuova tabella BigQuery delle valutazioni:bq load --skip_leading_rows=1 movielens.ratings \ gs://PROJECT_ID-movielens-data/ratings.csv \ userId:integer,movieId:integer,rating:float,time:timestamp
Crea le viste BigQuery
Crea una vista che converta la tabella dei film nello schema del catalogo dei prodotti di vendita al dettaglio:
bq mk --project_id=PROJECT_ID \ --use_legacy_sql=false \ --view ' SELECT CAST(movieId AS string) AS id, SUBSTR(title, 0, 128) AS title, SPLIT(genres, "|") AS categories FROM `PROJECT_ID.movielens.movies`' \ movielens.products
Ora la nuova vista ha lo schema previsto da Vertex AI Search for Commerce. Quindi, nella barra laterale sinistra, scegli
BIG DATA -> BigQuery
. Quindi, dalla barra di esplorazione a sinistra, espandi il nome del progetto e selezionamovielens -> products
per aprire la pagina di query per questa vista.Ora convertiamo le valutazioni dei film in eventi utente. Effettueremo:
- Ignora le valutazioni negative dei film (<4)
- Tratta ogni valutazione positiva come evento di visualizzazione della pagina del prodotto
(
detail-page-view
) - Scala la cronologia di Movielens negli ultimi 90 giorni. Lo facciamo per due motivi:
- Vertex AI Search for Commerce richiede che gli eventi utente non risalgano a prima del 2015. Le valutazioni di Movielens risalgono al 1995.
- Vertex AI Search for Commerce utilizza gli eventi utente degli ultimi 90 giorni per soddisfare le richieste di previsione per un utente. Quando effettueremo le previsioni per qualsiasi utente in un secondo momento, tutti gli utenti avranno eventi recenti.
Crea una vista BigQuery. Il seguente comando utilizza una query SQL che soddisfa i requisiti di conversione elencati sopra.
bq mk --project_id=PROJECT_ID \ --use_legacy_sql=false \ --view ' WITH t AS ( SELECT MIN(UNIX_SECONDS(time)) AS old_start, MAX(UNIX_SECONDS(time)) AS old_end, UNIX_SECONDS(TIMESTAMP_SUB( CURRENT_TIMESTAMP(), INTERVAL 90 DAY)) AS new_start, UNIX_SECONDS(CURRENT_TIMESTAMP()) AS new_end FROM `PROJECT_ID.movielens.ratings`) SELECT CAST(userId AS STRING) AS visitorId, "detail-page-view" AS eventType, FORMAT_TIMESTAMP( "%Y-%m-%dT%X%Ez", TIMESTAMP_SECONDS(CAST( (t.new_start + (UNIX_SECONDS(time) - t.old_start) * (t.new_end - t.new_start) / (t.old_end - t.old_start)) AS int64))) AS eventTime, [STRUCT(STRUCT(movieId AS id) AS product)] AS productDetails, FROM `PROJECT_ID.movielens.ratings`, t WHERE rating >= 4' \ movielens.user_events
Importa il catalogo dei prodotti e gli eventi utente
Ora siamo pronti per importare il catalogo dei prodotti e i dati sugli eventi utente in Vertex AI Search for Commerce.
Abilita l'API Vertex AI Search for Commerce per il tuo Google Cloud progetto.
Fai clic su Inizia.
Vai alla pagina Dati> nella console Ricerca per il commercio.
Vai alla pagina DatiFai clic su Importa.
Importa il catalogo dei prodotti
Compila il modulo per importare i prodotti dalla vista BigQuery che hai creato sopra:
- Seleziona il tipo di importazione: Catalogo dei prodotti.
- Seleziona il nome del ramo predefinito.
- Seleziona l'origine dei dati: BigQuery.
- Seleziona lo schema dei dati: Schema dei prodotti di vendita al dettaglio.
Inserisci il nome della visualizzazione BigQuery dei prodotti che hai creato sopra (
PROJECT_ID.movielens.products
).
Fai clic su Importa.
Attendi che siano stati importati tutti i prodotti. L'operazione dovrebbe richiedere 5-10 minuti.
Puoi controllare lo stato dell'operazione di importazione nell'attività di importazione. Al termine dell'importazione, lo stato dell'operazione diventa Riuscito.
Importa gli eventi utente
Importa la vista BigQuery user_events:
- Seleziona il tipo di importazione: Eventi utente.
- Seleziona l'origine dei dati: BigQuery.
- Seleziona lo schema dei dati: Schema eventi utente retail.
- Inserisci il nome della vista BigQuery
user_events
che hai creato sopra.
Fai clic su Importa.
Attendi che sia stato importato almeno un milione di eventi prima di andare al passaggio successivo, in modo da soddisfare i requisiti dei dati per l'addestramento di un nuovo modello.
Puoi controllare lo stato dell'operazione nell'attività di importazione. Il completamento del processo richiede circa un'ora.
Addestra e valuta i modelli di suggerimenti
Creare un modello di suggerimenti
Vai alla pagina Modelli nella console Ricerca per il commercio.
Vai alla pagina ModelliFai clic su Crea modello:
- Assegna un nome al modello.
- Seleziona Altri che ti potrebbero piacere come tipo di modello.
- Scegli Percentuale di clic (CTR) come scopo commerciale.
Fai clic su Crea.
L'addestramento del nuovo modello inizia.
Crea una configurazione di pubblicazione
Vai alla pagina Configurazioni di pubblicazione nella console Ricerca per il commercio.
Vai alla pagina Configurazioni di pubblicazioneFai clic su Crea configurazione di pubblicazione:
- Seleziona Consiglio.
- Assegna un nome alla configurazione di pubblicazione.
- Seleziona il modello che hai creato.
Fai clic su Crea.
Attendi che il modello sia "Pronto per l'esecuzione di query"
Sono necessari circa due giorni per l'addestramento del modello e la sua preparazione alle query.
Per visualizzare lo stato, fai clic sulla configurazione di pubblicazione creata nella pagina Configurazioni di pubblicazione.
Il campo Modello pronto per ricevere query indica Sì al termine del processo.
Visualizza un'anteprima dei suggerimenti
Quando il modello è pronto per ricevere query:
-
Vai alla pagina Configurazioni di pubblicazione nella console Ricerca per il commercio.
Vai alla pagina Configurazioni di pubblicazione - Fai clic sul nome della configurazione di pubblicazione per passare alla relativa pagina dei dettagli.
- Fai clic sulla scheda Valuta.
Inserisci un ID film di riferimento, ad esempio
4993
per "Il Signore degli Anelli: La Compagnia dell'Anello (2001)".Fai clic su Anteprima previsione per visualizzare l'elenco di elementi consigliati a destra della pagina.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.
Elimina il progetto
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Elimina singole risorse
Vai alla pagina Configurazioni di pubblicazione ed elimina la configurazione di pubblicazione che hai creato.
Vai alla pagina Modelli ed elimina il modello.
Elimina il set di dati BigQuery in Cloud Shell:
bq rm --recursive --dataset movielens
Elimina il bucket Cloud Storage e i relativi contenuti:
gcloud storage rm gs://PROJECT_ID-movielens-data --recursive