La pagina fornisce indicazioni per ottenere previsioni da Vertex AI, in base ai dati retail esportati in BigQuery. Forniamo diversi blocchi di codice SQL per aiutarti a trasformare i dati degli eventi di prodotti retail e utenti in un formato utilizzabile da Vertex AI. Questi blocchi di codice sono seguiti dalle procedure per la console Vertex AI per creare un set di dati, addestrare un modello e poi generare una previsione.
Prima di iniziare
Prima di poter generare previsioni di vendita utilizzando i dati di vendita al dettaglio, devi:
Carica i tuoi dati di vendita al dettaglio utilizzando Vertex AI Search for Commerce. Per ulteriori informazioni, vedi:
Esporta i tuoi dati retail da Vertex AI Search per il commercio in BigQuery. In questo modo, in BigQuery avrai una tabella dei prodotti e una tabella degli eventi utente, che potrai utilizzare nelle procedure seguenti. Per ulteriori informazioni, consulta Esportare i dati in BigQuery.
In alternativa, se i dati sugli eventi utente e sui prodotti sono già in BigQuery, nel formato Vertex AI Search for commerce, puoi utilizzare questi dati per generare previsioni di vendita a partire dai dati di vendita al dettaglio. In questo caso non devi caricare i dati retail ed esportarli in BigQuery. Per maggiori informazioni sul formato, vedi Schema del prodotto e Informazioni sugli eventi utente.
Assicurati di aver ricevuto il ruolo IAM
roles/aiplatform.user
, in modo da poter eseguire le procedure utilizzando la console Vertex AI.
Crea una tabella delle vendite aggregate
Il codice SQL in questa sezione trasforma la tabella degli eventi utente in una tabella delle vendite aggregata. Ciò significa che per ogni prodotto nella tabella degli eventi utente venduto almeno una volta, la quantità di vendite del prodotto viene aggregata su un periodo settimanale. Inoltre, il codice SQL esegue le seguenti operazioni:
Per qualsiasi prodotto nella tabella degli eventi utente, se mancano timestamp tra la prima vendita del prodotto nella tabella e l'ultima vendita di qualsiasi prodotto nella tabella, ogni timestamp mancante viene compilato con una nuova riga con vendite pari a zero. per eliminare i vuoti nella cronologia delle vendite.
Se nella tabella degli eventi utente non è presente almeno un prodotto con almeno 20 timestamp, viene scelto un prodotto a caso dalla tabella e vengono aggiunte righe sufficienti (ciascuna con zero vendite) per raggiungere 20 timestamp. per soddisfare il requisito di Vertex AI di avere almeno 20 timestamp durante l'addestramento di un modello.
Per creare una tabella delle vendite aggregate:
Sostituisci le variabili nel seguente codice di esempio SQL come segue:
starting_day_of_week. Il giorno in cui inizia la settimana. Valori validi:
MONDAY
,TUESDAY
,WEDNESDAY
,THURSDAY
,FRIDAY
,SATURDAY
,SUNDAY
.rdm_user_event_table. Gli ID progetto, set di dati e tabella della tabella degli eventi utente che hai esportato in BigQuery. Il formato è
project_id.dataset_id.table_id
.rdm_product_table. Gli ID progetto, set di dati e tabella della tabella dei prodotti che hai esportato in BigQuery. Il formato è
project_id.dataset_id.table_id
.aggregated_sales_table. Gli ID progetto, set di dati e tabella in BigQuery per la nuova tabella delle vendite aggregate. Utilizza lo stesso ID progetto delle tabelle degli eventi di prodotto e utente. Utilizza l'ID di un set di dati esistente. Specifica un ID tabella, ma non utilizzare l'ID di una tabella esistente a meno che tu non voglia sovrascriverla. Il formato è
project_id.dataset_id.table_id
.
Copia l'esempio di codice SQL.
Apri la pagina BigQuery nella console Google Cloud .
Se non è già selezionato, seleziona il progetto che contiene le tabelle degli eventi utente e dei prodotti.
Nel riquadro Editor, incolla il codice SQL di esempio.
Fai clic su
Esegui e attendi il completamento dell'esecuzione della query.
La nuova tabella delle vendite aggregate viene scritta nella posizione in BigQuery che hai impostato utilizzando la variabile aggregated_sales_table.
Elaborare la tabella dei prodotti
Il codice SQL in questa sezione agisce sulla tabella dei prodotti che hai esportato in BigQuery, rimuovendo i campi ripetuti e struct e separando il campo price_info nei relativi campi secondari. Questo è necessario perché Vertex AI non accetta elenchi o strutture nidificate. Il risultato è la tabella dei prodotti elaborata.
Per elaborare la tabella dei prodotti:
Sostituisci le variabili nel seguente codice di esempio SQL come segue:
rdm_product_table. Gli ID progetto, set di dati e tabella per la tabella dei prodotti che hai esportato in BigQuery. Il formato è
project_id.dataset_id.table_id
.processed_product_table. Gli ID progetto, set di dati e tabella in BigQuery per la nuova tabella dei prodotti elaborata. Utilizza lo stesso ID progetto delle tabelle degli eventi di prodotto e utente. Utilizza l'ID di un set di dati esistente. Specifica un ID tabella, ma non utilizzare l'ID di una tabella esistente a meno che tu non voglia sovrascriverla. Il formato è
project_id.dataset_id.table_id
.
CREATE OR REPLACE TABLE `PROCESSED_PRODUCT_TABLE` AS SELECT * EXCEPT (id, attributes, price_info, rating, expire_time, available_time, fulfillment_info, images, audience, color_info, promotions, publish_time, retrievable_fields, categories, brands, conditions, sizes, collection_member_ids, tags, materials, patterns), id as sku, price_info.price as price_info_price, price_info.currency_code as price_info_currency_code, price_info.cost as price_info_cost, FROM `RDM_PRODUCT_TABLE`
Copia l'esempio di codice SQL.
Apri la pagina BigQuery nella console Google Cloud .
Se non è già selezionato, seleziona il progetto che contiene le tabelle degli eventi utente e dei prodotti.
Nel riquadro Editor, incolla il codice SQL di esempio.
Fai clic su
Esegui e attendi il completamento dell'esecuzione della query.
La nuova tabella dei prodotti elaborati viene scritta nella posizione in BigQuery che hai impostato utilizzando la variabile processed_product_table.
Creare una tabella di previsione degli eventi
Il codice SQL in questa sezione estrae ogni SKU venduto almeno una volta nella tabella degli eventi utente. Il codice crea una tabella di previsione degli eventi contenente tutti gli SKU estratti in tutti i timestamp futuri. I timestamp futuri sono un array di timestamp settimanali continui, a partire dall'ultima settimana nella tabella degli eventi utente + 1 settimana e terminando con l'ultima settimana nella tabella degli eventi utente + future_length settimane. Imposta il valore di future_length sul numero di settimane nel futuro per cui vuoi che il modello faccia previsioni. Ogni riga della tabella di previsione degli eventi può essere identificata in modo univoco da uno SKU e da un timestamp.
Per creare una tabella di previsione degli eventi:
Sostituisci le variabili nel seguente codice di esempio SQL come segue:
starting_day_of_week. Il giorno in cui inizia la settimana. Valori validi:
MONDAY
,TUESDAY
,WEDNESDAY
,THURSDAY
,FRIDAY
,SATURDAY
,SUNDAY
.rdm_user_event_table. Gli ID progetto, set di dati e tabella per la tabella degli eventi utente che hai esportato in BigQuery. Il formato è
project_id.dataset_id.table_id
.events_prediction_table. Gli ID progetto, set di dati e tabella in BigQuery per la nuova tabella di previsione degli eventi. Utilizza lo stesso ID progetto delle tabelle degli eventi di prodotto e utente. Utilizza l'ID di un set di dati esistente. Specifica un ID tabella, ma non utilizzare l'ID di una tabella esistente a meno che tu non voglia sovrascriverla. Il formato è
project_id.dataset_id.table_id
.rdm_product_table. Gli ID progetto, set di dati e tabella per la tabella dei prodotti che hai esportato in BigQuery. Il formato è
project_id.dataset_id.table_id
.future_length. Il numero di settimane nel futuro, dopo l'ultima settimana nella tabella degli eventi utente, che il modello prevede.
Copia l'esempio di codice SQL.
Apri la pagina BigQuery nella console Google Cloud .
Se non è già selezionato, seleziona il progetto che contiene le tabelle degli eventi utente e dei prodotti.
Nel riquadro Editor, incolla il codice SQL di esempio.
Fai clic su
Esegui e attendi il completamento dell'esecuzione della query.
La nuova tabella di previsione degli eventi viene scritta nella posizione in BigQuery che hai impostato utilizzando la variabile events_prediction_table.
Crea una tabella di addestramento Vertex AI
Il codice SQL in questa sezione unisce la tabella delle vendite aggregate alla tabella dei prodotti elaborati. Il risultato è una tabella di addestramento Vertex AI, che Vertex AI utilizza per l'addestramento del modello.
Per creare una tabella di addestramento Vertex AI:
Sostituisci le variabili nel seguente codice di esempio SQL come segue:
vertex_ai_training_table. Gli ID progetto, set di dati e tabella in BigQuery per la nuova tabella di addestramento Vertex AI. Utilizza lo stesso ID progetto delle tabelle degli eventi utente e di prodotto. Utilizza l'ID di un set di dati esistente. Specifica un ID tabella, ma non utilizzare l'ID di una tabella esistente a meno che tu non voglia sovrascriverla. Il formato è
project_id.dataset_id.table_id
.aggregated_sales_table. Gli ID progetto, set di dati e tabella in BigQuery della tabella delle vendite aggregate, che hai creato in Creare una tabella delle vendite aggregate.
processed_product_table. Gli ID progetto, set di dati e tabella in BigQuery per la tabella dei prodotti elaborata, che hai creato in Elabora la tabella dei prodotti.
CREATE OR REPLACE TABLE `VERTEX_AI_TRAINING_TABLE` AS SELECT t1.*, t2.* EXCEPT(sku) FROM `AGGREGATED_SALES_TABLE` AS t1 LEFT JOIN `PROCESSED_PRODUCT_TABLE` AS t2 ON t1.sku = t2.sku
Copia l'esempio di codice SQL.
Apri la pagina BigQuery nella console Google Cloud .
Se non è già selezionato, seleziona il progetto che contiene le tabelle degli eventi utente e dei prodotti.
Nel riquadro Editor, incolla il codice SQL di esempio.
Fai clic su
Esegui e attendi il completamento dell'esecuzione della query.
La nuova tabella di addestramento Vertex AI viene scritta nella posizione in BigQuery che hai impostato utilizzando la variabile vertex_ai_training_table.
Crea una tabella delle previsioni Vertex AI
Il codice SQL in questa sezione aggiunge la tabella di previsione degli eventi alla tabella delle vendite aggregate, quindi la unisce alla tabella dei prodotti elaborata. Il risultato è la tabella delle previsioni di Vertex AI, che viene utilizzata per creare una previsione.
Per creare una tabella di previsione Vertex AI:
Sostituisci le variabili nel seguente codice di esempio SQL come segue:
vertex_ai_prediction_table. Gli ID progetto, set di dati e tabella in BigQuery per la nuova tabella di previsione Vertex AI. Utilizza lo stesso ID progetto e ID set di dati che hai utilizzato per le tabelle degli eventi di prodotto e utente. Non utilizzare l'ID di una tabella esistente, a meno che tu non voglia sovrascriverla. Il formato è
project_id.dataset_id.table_id
.aggregated_sales_table. Gli ID progetto, set di dati e tabella in BigQuery per la tabella delle vendite aggregate, che hai creato in Crea una tabella delle vendite aggregate.
processed_product_table. Gli ID progetto, set di dati e tabella in BigQuery per la tabella dei prodotti elaborata, che hai creato in Elabora la tabella dei prodotti.
events_prediction_table. Gli ID progetto, set di dati e tabella in BigQuery per la tabella di previsione degli eventi, che hai creato in Creare una tabella di previsione degli eventi.
CREATE OR REPLACE TABLE `VERTEX_AI_PREDICTION_TABLE` AS WITH append_predict_to_history AS ( SELECT add_to_cart_quantity, category_page_view_quantity, detail_page_view_quantity, last_day_of_week, quantity, search_quantity, sku FROM `AGGREGATED_SALES_TABLE` UNION ALL SELECT NULL AS add_to_cart_quantity, NULL AS category_page_view_quantity, NULL AS detail_page_view_quantity, last_day_of_week, NULL AS quantity, NULL AS search_quantity, sku FROM `EVENTS_PREDICTION_TABLE` ) SELECT t1.*, t2.* EXCEPT(sku) FROM append_predict_to_history AS t1 LEFT JOIN `PROCESSED_PRODUCT_TABLE` AS t2 ON t1.sku = t2.sku
Copia l'esempio di codice SQL.
Apri la pagina BigQuery nella console Google Cloud .
Se non è già selezionato, seleziona il progetto che contiene le tabelle degli eventi utente e dei prodotti.
Nel riquadro Editor, incolla il codice SQL di esempio.
Fai clic su
Esegui e attendi il completamento dell'esecuzione della query.
La nuova tabella delle previsioni di Vertex AI viene scritta nella posizione in BigQuery che hai impostato utilizzando la variabile vertex_ai_prediction_table.
Crea un set di dati Vertex AI
Questa sezione mostra come creare un set di dati Vertex AI che puoi utilizzare per addestrare un modello di previsione. Per ulteriori informazioni, consulta Creare un set di dati per l'addestramento di modelli di previsione nella documentazione di Vertex AI.
Per creare un set di dati Vertex AI:
Nella console Google Cloud , nella sezione Vertex AI, vai alla pagina Set di dati.
Fai clic su Crea per aprire la pagina Crea set di dati.
Nel campo Nome set di dati, inserisci un nome per il nuovo set di dati.
Seleziona la scheda Tabulare.
Seleziona lo scopo Previsione.
Nell'elenco Regione, seleziona la regione che hai utilizzato quando hai creato un set di dati per esportare i dati di vendita al dettaglio in BigQuery. Se hai selezionato us quando hai creato il set di dati BigQuery, puoi selezionare qualsiasi regione negli Stati Uniti. Allo stesso modo, se hai selezionato eu quando hai creato il set di dati BigQuery, puoi selezionare qualsiasi regione dell'Unione Europea. Per ulteriori informazioni, consulta la pagina Esportare i dati in BigQuery.
Fai clic su Crea per creare il set di dati vuoto e passare alla scheda Origine.
Seleziona Seleziona una tabella o una vista da BigQuery.
In Seleziona una tabella o una vista da BigQuery, inserisci gli ID progetto, set di dati e tabella per la tabella di addestramento Vertex AI che hai creato in Crea una tabella di addestramento Vertex AI. Il formato è
project_id.dataset_id.table_id
.Fai clic su Continua.
L'origine dati è associata al set di dati.
Nella scheda Analizza, seleziona sku nell'elenco Colonna identificatore serie e last_day_of_week nell'elenco Colonna timestamp.
Fai clic su Addestra nuovo modello per passare alla pagina Addestra nuovo modello. Per istruzioni sull'addestramento del modello, consulta Addestrare un modello di previsione.
Addestra un modello di previsione
Questa sezione mostra come addestrare un modello di previsione utilizzando il set di dati creato in Crea un set di dati Vertex AI. Per saperne di più, consulta Addestra un modello di previsione nella documentazione di Vertex AI.
Prima di iniziare
Prima di poter addestrare un modello di previsione, devi creare un set di dati Vertex AI.
Addestra un modello
Nella pagina Metodo di addestramento, seleziona il metodo di addestramento del modello. Per informazioni sui metodi di addestramento, consulta Addestra un modello nella documentazione di Vertex AI.
Fai clic su Continua.
Nella pagina Dettagli modello, configura quanto segue:
Seleziona Addestra nuovo modello se non è già selezionato.
Inserisci un nome per il nuovo modello.
Seleziona quantità (INTEGER) dall'elenco Colonna target.
Seleziona Settimanale dall'elenco Granularità dei dati.
Inserisci la finestra contestuale e l'orizzonte di previsione.
L'orizzonte di previsione determina per quanto lontano nel futuro il modello prevede il valore target per ogni riga di dati di previsione. L'orizzonte di previsione è specificato in unità di granularità dei dati.
La finestra contestuale imposta il periodo di tempo a ritroso che il modello prende in considerazione durante l'addestramento (e per le previsioni). In altre parole, per ogni punto dati di addestramento, la finestra contestuale determina quanto indietro nel tempo il modello cerca pattern predittivi. Se non specifichi una finestra di contesto, il valore predefinito è quello impostato per l'orizzonte di previsione. La finestra di contesto è specificata in unità di granularità dei dati.
Per saperne di più, consulta Considerazioni per l'impostazione della finestra contestuale e dell'orizzonte di previsione nella documentazione di Vertex AI.
Fai clic su Continua.
Nella pagina Training options (Opzioni di addestramento), configura quanto segue. Tieni presente che quando una freccia menu a discesa
è grigia o quando non è presente alcuna freccia menu a discesa, il valore non può essere modificato.Seleziona un valore Trasformazione per le colonne nell'elenco Nome colonna come segue:
Se il valore di Tipo BigQuery è Float, Integer o Numeric, imposta il valore di Trasformazione su Numeric.
Se il valore di Tipo BigQuery è Stringa o Booleano, imposta il valore di Trasformazione su Categorica.
Se il valore di Tipo BigQuery è Data, imposta il valore di Trasformazione su Timestamp.
Seleziona un valore Tipo di funzionalità per le colonne nell'elenco Nome colonna come segue:
Per add_to_cart_quantity, category_page_view_quantity, detail_page_view_quantity e search_quantity, imposta il valore Tipo di caratteristica su Covariata.
Delle colonne rimanenti, per quelle che possono essere modificate, imposta il Tipo di funzionalità su Attributo.
Seleziona un valore Disponibile nella previsione per le colonne nell'elenco Tipo di colonna nel seguente modo:
Per add_to_cart_quantity, category_page_view_quantity, detail_page_view_quantity e search_quantity, imposta il valore Disponibilità alla previsione su Non disponibile.
Delle colonne rimanenti, per quelle che possono essere modificate, imposta il valore Tipo di funzionalità su Disponibile.
Fai clic su Continua.
Nella pagina Compute e prezzi, inserisci il numero massimo di ore per cui vuoi addestrare il modello. Questa impostazione ti aiuta a limitare i costi di addestramento. Il tempo effettivo trascorso può essere superiore a questo valore perché sono coinvolte altre operazioni nella creazione di un nuovo modello. Per informazioni sulla quantità di tempo necessaria per addestrare modelli di alta qualità, consulta la sezione Addestrare un modello nella documentazione di Vertex AI.
Fai clic su Inizia addestramento.
L'addestramento del modello può richiedere molte ore, a seconda delle dimensioni e della complessità dei dati e del budget di addestramento, se ne hai specificato uno. Puoi chiudere questa scheda e tornarci in un secondo momento. Ricevi un'email quando l'addestramento del modello è terminato. Se vuoi monitorare l'avanzamento dell'addestramento del modello, consulta Monitorare l'avanzamento dell'addestramento.
Monitorare l'avanzamento dell'allenamento
Nella console Google Cloud , nella sezione Vertex AI, vai alla pagina Addestramento.
Se non è già selezionata, seleziona la scheda Pipeline di addestramento. Il modello che stai addestrando dovrebbe essere presente nell'elenco. L'addestramento termina quando lo stato passa da Addestramento a Terminato.
Creare una previsione
Questa pagina mostra come creare una previsione utilizzando il modello di previsione che hai addestrato in Addestrare un modello di previsione.
Prima di iniziare
Prima di poter creare una previsione, devi addestrare un modello di previsione.
Effettua una richiesta di previsione batch al tuo modello
Nella console Google Cloud , vai alla pagina Batch predictions nella sezione Vertex AI.
Fai clic su Crea per aprire la finestra Nuova previsione batch e completa i seguenti passaggi:
Inserisci un nome per la previsione batch.
Nell'elenco Nome modello, seleziona il modello che hai addestrato in Addestra un modello di previsione.
Nell'elenco Versione, seleziona la versione del modello.
Nella sezione Seleziona l'origine:
Se non è già selezionata, seleziona Tabella BigQuery.
Inserisci gli ID progetto, set di dati e tabella in BigQuery per la tabella di previsione Vertex AI che hai creato in Crea una tabella di previsione Vertex AI. Il formato è
project_id.dataset_id.table_id
.
In Output di previsione batch:
Nell'elenco Formato di output, seleziona Tabella BigQuery.
Inserisci gli ID progetto e set di dati in BigQuery per la tabella di output della previsione batch che stai creando. Utilizza lo stesso ID progetto e ID set di dati che hai utilizzato per le tabelle degli eventi di prodotto e utente. Il formato è
project_id.dataset_id.
Fai clic su Crea. Viene visualizzata la pagina Previsioni batch.
La previsione viene completata quando lo stato cambia da In attesa a Terminato. Riceverai un'email anche al termine della previsione batch. L'output della richiesta di previsione batch viene restituito nel set di dati del progetto BigQuery specificato. Il nome della nuova tabella di output è "predictions_" seguito dal timestamp dell'inizio del job di previsione. Per saperne di più su come recuperare e interpretare i risultati delle previsioni, consulta Recuperare i risultati della previsione batch e Interpretare i risultati della previsione nella documentazione di Vertex AI.