Genera insight sui dati in BigQuery

Per assistenza, invia un'email dataplex-data-insights-help@google.com.

Gli insight sui dati offrono un modo automatizzato per esplorare e comprendere i tuoi dati. Usa Gemini per generare query in base ai metadati di una tabella e ti consente di scoprire pattern, della qualità ed eseguire analisi statistiche.

Questo documento descrive le funzionalità principali degli insight sui dati e il processo per Automatizzare la generazione di query per un'esplorazione approfondita dei dati.

Informazioni sugli insight sui dati

Gli analisti di dati devono affrontare il problema dell'avvio a freddo nell'esplorazione dei dati quando esplorano una nuovo set di dati con conoscenze scarse o nulle. Il problema spesso comporta incertezze sulla struttura dei dati, sui pattern chiave e sugli insight pertinenti. Di utilizzando la generazione automatica di query basate su metadati, insight sui dati consente di risolvere il problema dell'avvio a freddo nell'esplorazione dei dati. Gli approfondimenti forniscono segnali preziosi per aiutarti a prendere decisioni consapevoli e ottenere informazioni più approfondite i tuoi dati. Anziché iniziare con uno slate vuoto, puoi iniziare più rapidamente esplorazione dei dati con query significative che offrono insight preziosi.

Le query generate utilizzando insight sui dati si basano sui dati dati della scansione del profilo. Gli insight sui dati utilizzano dati pubblicati durante la scansione dei profili per creare query che diano risultati, il recupero delle informazioni, efficiente e affidabile. Ciò accelera significativamente l'avvio del processo di analisi dei dati e ti consente di approfondire i dati con una direzione e uno scopo più chiari.

Gli insight sui dati sono uno strumento guida che risolve i problemi la sfida di orientarsi in set di dati sconosciuti, consentendoti di realizzare prendere decisioni informate e scoprire gli schemi in modo più rapido durante l'esplorazione dei dati.

Esempio di un'esecuzione di insight

Considera una tabella chiamata telco_churn con i seguenti metadati:

Nome campo Tipo
CustomerID STRING
Genere STRING
Periodo di incarico INT64
PhoneService STRING
OnlineBackup STRING
Dipendenti BOOLEAN
Contratto STRING
TechSupport STRING
PaymentMethod STRING
MonthlyCharges FLOAT
Tasso di abbandono BOOLEAN

Di seguito sono riportati alcuni esempi di query per gli insight sui dati genera per questa tabella:

  • Identificare i clienti che hanno sottoscritto un abbonamento a tutti i servizi premium e che sono stati per un cliente da più di 50 mesi.

    SELECT
      CustomerID,
      Contract,
      Tenure
    FROM
      agentville_datasets.telco_churn
    WHERE
      OnlineSecurity = 'Yes'
      AND OnlineBackup = 'Yes'
      AND DeviceProtection = 'Yes'
      AND TechSupport = 'Yes'
      AND StreamingTV = 'Yes'
      AND StreamingMovies = 'Yes'
      AND Tenure > 50;
    
  • Identificare quale servizio internet ha i clienti che abbandonano il sito.

    SELECT
      InternetService,
      COUNT(DISTINCT CustomerID) AS total_customers
    FROM
      agentville_datasets.telco_churn
    WHERE
      Churn = TRUE
    GROUP BY
      InternetService
    ORDER BY
      total_customers DESC
    LIMIT 1;
    
  • Identifica i tassi di abbandono per segmento tra i clienti di alto valore.

    SELECT
      Contract,
      InternetService,
      Gender,
      PaymentMethod,
      COUNT(DISTINCT CustomerID) AS total_customers,
      SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) AS churned_customers,
      (SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) / COUNT(DISTINCT CustomerID))
    * 100 AS churn_rate
    FROM
      agentville_datasets.telco_churn
    WHERE
      MonthlyCharges > 100
    GROUP BY
      Contract,
      InternetService,
      Gender,
      PaymentMethod;
    

Informazioni sul grounding degli insight tramite le scansioni del profilo

Quando crea una scansione del profilo dati per una tabella, puoi scegliere di pubblicare i risultati della scansione in BigQuery Data Catalog (Catalogo dati). BigQuery utilizza la scansione del profilo pubblicato per generare query più accurate e pertinenti per la tabella.

Puoi visualizzare i dati pubblicati della scansione del profilo nella console Google Cloud. Per ulteriori informazioni informazioni su come visualizzare i dati della scansione del profilo pubblicati, consulta Visualizzare i risultati pubblicati.

I dati della scansione del profilo forniscono informazioni sulla distribuzione dei dati, tipi di dati e riassunti statistici del set di dati. La scansione è utilizzata generare insight nella tabella. Se non sono disponibili analisi, vengono forniti insight formulati in base ai nomi delle colonne e alle rispettive descrizioni.

Per ulteriori informazioni sulle scansioni del profilo, vedi Generare insight sul profilo dati con le scansioni.

Per ulteriori informazioni sulla creazione e la pubblicazione delle scansioni del profilo, consulta Crea un'analisi del profilo dati.

Le seguenti sezioni descrivono in che modo gli insight sui dati utilizzano il profilo pubblicato eseguire la scansione dei dati verso le query terrestri.

Informazioni sui dati della scansione del profilo

I dati della scansione del profilo sono i metadati che descrivono i contenuti di una tabella. it include le seguenti informazioni:

  • Tipi di dati delle colonne
  • Valori minimo e massimo
  • Distribuzione dei valori
  • Valori nulli o mancanti
  • Valori principali
  • Valori unici e frequenza

Gli insight sui dati utilizzano queste informazioni per generare query personalizzate una tabella specifica.

In che modo gli insight sui dati basano le query utilizzando i dati della scansione del profilo

Gli insight sui dati utilizzano i dati della scansione del profilo per creare query basate distribuzione e pattern effettivi dei dati all'interno del set di dati. Questo processo comporta segui questi passaggi:

  • L'analisi dei dati della scansione del profilo per identificare modelli, tendenze outlier nei dati
  • Generare query incentrate su questi pattern, tendenze o outlier per scopri approfondimenti
  • Convalida le query generate rispetto ai dati della scansione del profilo per garantire che le query restituiscono risultati significativi

Suggerimenti per massimizzare i vantaggi degli insight sui dati

Le query con grounding assicurano che le informazioni ottenute siano accurate, pertinenti e strategici, in modo da prendere decisioni migliori basate sui dati. Per fare in modo che al massimo delle query con grounding che utilizzano i dati della scansione del profilo, segui queste suggerimenti:

  • Assicurati che nella tabella siano stati pubblicati dati aggiornati della scansione del profilo. Questo permette agli insight sui dati di generare query più accurate e pertinenti.
  • Esamina le query generate per capire come si basano dei dati della scansione del profilo. In questo modo puoi interpretare i risultati e ottenere informazioni insight sui tuoi dati.
  • Modifica le impostazioni dell'analisi del profilo della tabella o fornisci contesto aggiuntivo agli insight sui dati se le query generate non sono pertinenti o utili.

Prezzi

La funzionalità degli insight sui dati di BigQuery non viene fatturata durante preview.

Limitazioni

  • Gli insight sui dati sono disponibili per tabelle BigQuery, Tabelle BigLake, tabelle esterne e viste.
  • Per i clienti multi-cloud, non sono disponibili dati da altri cloud.
  • Gli insight sui dati non supportano i tipi di colonna Geo o JSON.
  • Le esecuzioni degli insight non garantiscono la presentazione delle query ogni volta. A aumenta la probabilità di generare query più coinvolgenti, avvia nuovamente una pipeline di insight.
  • Per le tabelle con controllo dell'accesso a livello di colonna (ACL) e utente con restrizioni autorizzazioni, puoi generare insight se hai accesso in lettura in tutte le colonne della tabella. Per eseguire le query generate, devi avere sufficiente autorizzazioni.

Prima di iniziare

Ruoli e autorizzazioni richiesti

Per creare, gestire e recuperare insight sui dati, chiedi all'amministratore di concedere i seguenti ruoli IAM:

Per ottenere l'accesso di sola lettura agli insight generati, chiedi all'amministratore per concederti il seguente ruolo IAM:

Per ulteriori informazioni sulla concessione dei ruoli, consulta Gestire l'accesso agli account di servizio.

Potresti anche riuscire a ottenere le autorizzazioni richieste ruoli personalizzati o altro ruoli predefiniti.

Abilita API

Per utilizzare gli insight sui dati, abilita le API seguenti nel progetto:

Per saperne di più sull'abilitazione dell'API Cloud AI Companion, consulta Abilita l'API Cloud AI Companion in un progetto Google Cloud.

Genera insight per una tabella BigQuery

Per generare insight per una tabella BigQuery, devi accedere alla classe in BigQuery utilizzando BigQuery Studio.

  1. Nella console Google Cloud, vai a BigQuery Studio.

    Vai a BigQuery Studio

  2. Nel riquadro Explorer, seleziona la tabella da generare insight per i nostri clienti.

  3. Fai clic sulla scheda Approfondimenti. Se la scheda è vuota, significa che gli approfondimenti per questa tabella non sono stati ancora generati.

  4. Per attivare la pipeline di insight, fai clic su Genera insight.

    Il completamento degli insight richiede 5-10 minuti.

    Se una scansione del profilo pubblicato per la tabella è accessibile, viene utilizzata per generare insight completi. Altrimenti, gli insight vengono formulati sui nomi delle colonne e le relative descrizioni. Questo approccio ti garantisce di ricevere insight indipendentemente dalla disponibilità di un scansione del profilo.

  5. Nella scheda Approfondimenti, esplora le query generate e le relative descrizioni.

  6. Per aprire una query in BigQuery, fai clic su Apri in BigQuery.

  7. Per generare un nuovo insieme di query, fai clic su Genera insight e attiva di nuovo nella pipeline.

Genera insight per una tabella BigQuery esterna

Gli insight sui dati di BigQuery supportano le tabelle esterne di BigQuery nello stesso progetto Google Cloud. Se La tabella BigQuery fa riferimento a dati archiviati in Cloud Storage in un altro progetto Google Cloud, la generazione degli insight non riesce.

Per generare insight per una tabella BigQuery esterna, segui le le istruzioni descritte in Generare insight per una tabella BigQuery di questo documento.

Genera insight per una tabella BigLake

Per generare insight per un Tabella BigLake, segui questi passaggi:

  1. Abilita l'API BigQuery Connection nel tuo progetto.

    Abilita l'API BigQuery Connection

  2. Creare una connessione BigQuery. Per ulteriori informazioni, vedi Gestire le connessioni.

  3. Concedi il visualizzatore oggetti Storage (roles/storage.objectViewer) ruolo IAM all'account di servizio corrispondente Connessione BigQuery creata da te.

    Puoi recuperare l'ID dell'account di servizio dal dettagli della connessione.

  4. Per generare insight, segui le istruzioni descritte in Generare insight per una tabella BigQuery di questo documento.

Passaggi successivi