Panoramica dell'analisi del contributo

Puoi utilizzare l'analisi del contributo, chiamata anche analisi dei fattori chiave, per generare informazioni sulle variazioni delle metriche chiave nei dati multidimensionali. Ad esempio, puoi utilizzare l'analisi del contributo per vedere la variazione dei dati sulle entrate in due trimestri o per confrontare due insiemi di dati di addestramento per comprendere le variazioni nel rendimento di un modello di ML. Puoi utilizzare un istruzione CREATE MODEL per creare un modello di analisi del contributo in BigQuery.

L'analisi dei contributi è una forma di analisi avanzata, ovvero l'utilizzo dell'intelligenza artificiale (AI) per migliorare e automatizzare l'analisi e la comprensione dei dati. L'analisi del contributo consente di raggiungere uno degli scopi principali dell'analisi aumentata, ovvero aiutare gli utenti a trovare pattern nei loro dati.

Un modello di analisi del contributo rileva i segmenti di dati che mostrano variazioni statisticamente significative in una metrica nel tempo, confrontando un set di dati di test con un set di dati di controllo. In questo modo puoi vedere come cambiano i dati nel tempo, in base alla località, al segmento di clienti o a qualsiasi altra metrica che ti interessa. Ad esempio, puoi confrontare un istantanea della tabella acquisita alla fine del 2023 con un'istantanea della tabella acquisita alla fine del 2022 per vedere come cambiano i dati tra due anni.

La metrica è il valore numerico utilizzato dai modelli di analisi del contributo per misurare e confrontare le variazioni tra i dati di test e di controllo. Puoi specificare una metrica sommabile o una metrica del rapporto sommabile con i modelli di analisi del contributo.

Un segmento è una sezione dei dati identificata da una determinata combinazione di valori delle dimensioni. Ad esempio, per un modello di analisi del contributo basato sulle dimensioni store_number, customer_id e day, ogni combinazione univoca di questi valori di dimensione rappresenta un segmento. Nella tabella seguente, ogni riga rappresenta un segmento diverso:

store_number customer_id day
negozio 1
negozio 1 cliente 1
negozio 1 cliente 1 Lunedì
negozio 1 cliente 1 Martedì
negozio 1 cliente 2
negozio 2

Per creare un modello solo dei segmenti più grandi e quindi più pertinenti, specifica una soglia di supporto a priori che impedisca l'utilizzo dei segmenti più piccoli da parte del modello. In questo modo si riduce anche il tempo di creazione del modello.

Dopo aver creato un modello di analisi del contributo, puoi utilizzare la funzione ML.GET_INSIGHTS per recuperare le informazioni sulle metriche calcolate dal modello.

Passaggi successivi