Gli Approfondimenti dei dati offrono un modo automatizzato per esplorare e comprendere i tuoi dati. Con gli approfondimenti dei dati, Gemini utilizza i metadati per generare domande in linguaggio naturale sulla tua tabella e le query per rispondere. In questo modo, puoi individuare pattern, valutare la qualità dei dati ed eseguire analisi statistiche.
Questo documento descrive le funzionalità chiave degli approfondimenti sui dati e come visualizzarli per esplorare i dati in modo approfondito.
Prima di iniziare
Gli approfondimenti sui dati vengono generati utilizzando
Gemini in BigQuery
e possono essere generati solo in BigQuery Studio.
Innanzitutto,
configura Gemini in BigQuery,
poi
genera approfondimenti in BigQuery.
Gemini elabora i metadati per gli approfondimenti esclusivamente nella regione us-central1
. Per ulteriori informazioni, consulta
Località di pubblicazione di Gemini.
Dopo aver generato gli approfondimenti, puoi visualizzarli in Dataplex.
Ruoli obbligatori
Per ottenere l'accesso di sola lettura ai dati generati, chiedi all'amministratore di concederti il seguente ruolo IAM:
- DataViewer di DataScan di Dataplex (
roles/dataplex.dataScanDataViewer
) nel progetto contenente le tabelle BigQuery per le quali vuoi visualizzare gli approfondimenti.
Per ulteriori informazioni sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite ruoli personalizzati o altri ruoli predefiniti. Per visualizzare le autorizzazioni esatte necessarie per generare approfondimenti, espandi la sezione Autorizzazioni richieste:
Autorizzazioni obbligatorie
dataplex.datascans.get
dataplex.datascans.getData
Abilita API
Per utilizzare gli approfondimenti sui dati, abilita le seguenti API nel tuo progetto:
Per saperne di più sull'attivazione dell'API Gemini for Google Cloud, consulta Attivare l'API Gemini for Google Cloud in un progetto Google Cloud.
Informazioni sugli approfondimenti sui dati
Quando esplorano una nuova tabella sconosciuta, gli analisti di dati si trovano spesso a dover affrontare il problema del cold start. Il problema spesso comporta incertezze sulla struttura dei dati, sui pattern chiave e sugli approfondimenti pertinenti al loro interno, rendendo difficile iniziare a scrivere query.
Gli approfondimenti dei dati risolvono il problema del cold start generando automaticamente query in linguaggio naturale e i relativi equivalenti SQL in base ai metadati di una tabella. Anziché iniziare con un editor di query vuoto, puoi iniziare rapidamente l'esplorazione dei dati con query significative che offrono approfondimenti utili. Per approfondire, puoi fare domande aggiuntive nel canvas di dati.
Esempio di esecuzione di Approfondimenti
Considera una tabella denominata telco_churn
con i seguenti metadati:
Nome campo | Tipo |
---|---|
CustomerID | STRING |
Genere | STRING |
Periodo di incarico | INT64 |
InternetService | STRING |
StreamingTV | STRING |
OnlineBackup | STRING |
Contratto | STRING |
TechSupport | STRING |
PaymentMethod | STRING |
MonthlyCharges | FLOAT |
Tasso di abbandono | BOOLEAN |
Di seguito sono riportate alcune delle query di esempio generate da Approfondimenti dei dati per questa tabella:
Identifica i clienti che hanno sottoscritto tutti i servizi premium e sono clienti da più di 50 mesi.
SELECT CustomerID, Contract, Tenure FROM agentville_datasets.telco_churn WHERE OnlineBackup = 'Yes' AND TechSupport = 'Yes' AND StreamingTV = 'Yes' AND Tenure > 50;
Identifica il servizio internet con il maggior numero di clienti dimissionari.
SELECT InternetService, COUNT(DISTINCT CustomerID) AS total_customers FROM agentville_datasets.telco_churn WHERE Churn = TRUE GROUP BY InternetService ORDER BY total_customers DESC LIMIT 1;
Identifica i tassi di abbandono per segmento tra i clienti di alto valore.
SELECT Contract, InternetService, Gender, PaymentMethod, COUNT(DISTINCT CustomerID) AS total_customers, SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) AS churned_customers, (SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) / COUNT(DISTINCT CustomerID)) * 100 AS churn_rate FROM agentville_datasets.telco_churn WHERE MonthlyCharges > 100 GROUP BY Contract, InternetService, Gender, PaymentMethod;
Visualizza insight
Per visualizzare gli approfondimenti per una tabella BigQuery, accedi alla voce della tabella in Dataplex utilizzando la ricerca Dataplex.
Nella console Google Cloud, vai alla pagina Ricerca di Dataplex.
Cerca la voce della tabella in Dataplex.
Fai clic sulla scheda Approfondimenti. Se la scheda è vuota, significa che le informazioni per questa tabella non sono ancora state generate. Puoi generare approfondimenti sui dati in BigQuery Studio.
Prezzi
Per informazioni dettagliate sui prezzi di questa funzionalità, consulta la panoramica dei prezzi di Gemini in BigQuery.
Quote e limiti
Per informazioni su quote e limiti per questa funzionalità, consulta Quote per Gemini in BigQuery.
Limitazioni
- Le statistiche dei dati sono disponibili per le tabelle BigQuery, le tabelle BigLake, le tabelle esterne e le viste.
- Per i clienti multicloud, i dati di altri cloud non sono disponibili.
- Approfondimenti dei dati non supporta i tipi di colonne
Geo
oJSON
. - Le esecuzioni degli approfondimenti non garantiscono la presentazione delle query ogni volta. Per aumentare la probabilità di generare query più coinvolgenti, rigenera gli approfondimenti in BigQuery Studio.
Passaggi successivi
- Scopri come generare approfondimenti in BigQuery.
- Scopri come generare una scansione di profilazione dei dati.
- Scopri come scrivere query con l'assistenza di Gemini in BigQuery.