Os insights de dados oferecem uma maneira automatizada de explorar e entender seus dados. Ela usa o Gemini para gerar consultas com base nos metadados de uma tabela e permite descobrir padrões, avaliar a qualidade dos dados e realizar análises estatísticas.
Este documento descreve os principais recursos dos insights de dados e como visualizá-los para uma análise detalhada de dados.
Antes de começar
Os insights de dados são gerados usando o Gemini no BigQuery e só podem ser gerados no BigQuery Studio. Primeiro, configure o Gemini no BigQuery e, depois, gere insights no BigQuery. Depois de gerar insights, você pode acessá-los no Dataplex.
Funções exigidas
Para ter acesso somente leitura aos insights gerados, peça ao administrador para conceder a você o seguinte papel do IAM:
- Leitor de dados do DataScan Dataplex (
roles/dataplex.dataScanDataViewer
) no projeto que contém as tabelas do BigQuery para as quais você quer visualizar insights.
Para mais informações sobre como conceder papéis, consulte Gerenciar o acesso a contas de serviço.
Também é possível receber as permissões necessárias com papéis personalizados ou outros papéis predefinidos. Para conferir as permissões exatas necessárias para gerar insights, abra a seção Permissões necessárias:
Permissões necessárias
dataplex.datascans.get
dataplex.datascans.getData
Ativar APIs
Para usar insights de dados, ative as seguintes APIs no seu projeto:
Para mais informações sobre como ativar a API Gemini para o Google Cloud, consulte Ativar a API Gemini para o Google Cloud em um projeto do Google Cloud.
Sobre os insights de dados
Ao analisar uma tabela nova e desconhecida, os analistas de dados geralmente enfrentam o problema da inicialização a frio. O problema geralmente envolve incertezas sobre a estrutura dos dados, os principais padrões e insights relevantes nos dados, dificultando o início da criação de consultas. Os insights de dados resolvem o problema de inicialização a frio gerando consultas automaticamente em linguagem natural e SQL com base nos metadados da tabela. Em vez de começar com um editor de consulta vazio, você pode iniciar rapidamente a exploração de dados com consultas significativas que oferecem insights valiosos. As consultas geradas com insights de dados são fundamentadas com resultados de criação de perfil de dados publicados para melhorar a precisão e a utilidade delas.
Exemplo de execução de insights
Considere uma tabela chamada telco_churn
com os seguintes metadados:
Nome do campo | Tipo |
---|---|
CustomerID | STRING |
Gênero | STRING |
Tempo de casa | INT64 |
InternetService | STRING |
StreamingTV | STRING |
OnlineBackup | STRING |
Contrato | STRING |
TechSupport | STRING |
PaymentMethod | STRING |
MonthlyCharges | FLOAT |
Desligamento | BOOLEAN |
Veja a seguir algumas das consultas de amostra que os insights de dados geram para essa tabela:
Identifique os clientes que assinaram todos os serviços premium e são clientes há mais de 50 meses.
SELECT CustomerID, Contract, Tenure FROM agentville_datasets.telco_churn WHERE OnlineBackup = 'Yes' AND TechSupport = 'Yes' AND StreamingTV = 'Yes' AND Tenure > 50;
Identifique qual serviço de Internet tem mais clientes desistentes.
SELECT InternetService, COUNT(DISTINCT CustomerID) AS total_customers FROM agentville_datasets.telco_churn WHERE Churn = TRUE GROUP BY InternetService ORDER BY total_customers DESC LIMIT 1;
Identifique as taxas de desistência de usuários por segmento entre os clientes de alto valor.
SELECT Contract, InternetService, Gender, PaymentMethod, COUNT(DISTINCT CustomerID) AS total_customers, SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) AS churned_customers, (SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) / COUNT(DISTINCT CustomerID)) * 100 AS churn_rate FROM agentville_datasets.telco_churn WHERE MonthlyCharges > 100 GROUP BY Contract, InternetService, Gender, PaymentMethod;
Exibir insight
Para conferir insights de uma tabela do BigQuery, acesse a entrada da tabela no Dataplex usando a Pesquisa do Dataplex.
No console do Google Cloud, acesse a página Pesquisa do Dataplex.
Pesquise a entrada da tabela no Dataplex.
Clique na guia Insights. Se a guia estiver vazia, isso significa que os insights da tabela ainda não foram gerados. É possível gerar insights de dados no BigQuery Studio.
Preços
Para saber mais sobre os preços desse recurso, consulte Visão geral dos preços do Gemini no BigQuery.
Cotas e limites
Para informações sobre cotas e limites desse recurso, consulte Cotas do Gemini no BigQuery.
Limitações
- Os insights de dados estão disponíveis para visualizações e tabelas do BigQuery, do BigLake e externas.
- Para clientes que têm várias nuvens, os dados de outras nuvens não estão disponíveis.
- Os insights de dados não são compatíveis com os tipos de coluna
Geo
ouJSON
. - A execução de insights não garante a apresentação de consultas todas as vezes. Para aumentar a probabilidade de gerar consultas mais engajadoras, gere novamente insights no BigQuery Studio.
A seguir
- Saiba como gerar insights no BigQuery.
- Saiba como gerar uma verificação de criação de perfil de dados.
- Saiba como escrever consultas com a assistência do Gemini no BigQuery.