Os insights de dados oferecem uma maneira automatizada de explorar e entender seus dados. Com os insights de dados, o Gemini usa metadados para gerar perguntas em linguagem natural sobre a tabela e as consultas para respondê-las. Isso ajuda a descobrir padrões, avaliar a qualidade dos dados e realizar análises estatísticas.
Neste documento, descrevemos os principais recursos de insights de dados e como acessá-los para uma análise detalhada.
Antes de começar
Os insights de dados são gerados usando o Gemini no BigQuery e só podem ser gerados no BigQuery Studio.
Primeiro,
configure o Gemini no BigQuery e, depois,
gere insights no BigQuery.
O Gemini processa seus metadados para insights exclusivamente na
região us-central1
. Para mais informações, consulte
Locais de veiculação do Gemini.
Depois de gerar insights, você pode acessá-los no Dataplex.
Funções exigidas
Para ter acesso somente leitura aos insights gerados, peça ao administrador para conceder a você o seguinte papel do IAM:
- Leitor de dados do DataScan Dataplex (
roles/dataplex.dataScanDataViewer
) no projeto que contém as tabelas do BigQuery para as quais você quer visualizar insights.
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível receber as permissões necessárias com papéis personalizados ou outros papéis predefinidos. Para conferir as permissões exatas necessárias para gerar insights, abra a seção Permissões necessárias:
Permissões necessárias
dataplex.datascans.get
dataplex.datascans.getData
Ativar APIs
Para usar insights de dados, ative as seguintes APIs no seu projeto:
Para mais informações sobre como ativar a API Gemini para o Google Cloud, consulte Ativar a API Gemini para o Google Cloud em um projeto do Google Cloud.
Sobre os insights de dados
Ao analisar uma tabela nova e desconhecida, os analistas de dados geralmente enfrentam o problema da inicialização a frio. O problema geralmente envolve incertezas sobre a estrutura dos dados, os principais padrões e insights relevantes nos dados, dificultando o início da criação de consultas.
Os insights de dados resolvem o problema de inicialização a frio gerando consultas de linguagem natural e os equivalentes em SQL com base nos metadados de uma tabela. Em vez de começar com um editor de consulta vazio, você pode iniciar rapidamente a exploração de dados com consultas significativas que oferecem insights valiosos. Para investigar mais, você pode fazer perguntas de acompanhamento na tela de dados.
Exemplo de execução de insights
Considere uma tabela chamada telco_churn
com os seguintes metadados:
Nome do campo | Tipo |
---|---|
CustomerID | STRING |
Gênero | STRING |
Tempo de casa | INT64 |
InternetService | STRING |
StreamingTV | STRING |
OnlineBackup | STRING |
Contrato | STRING |
TechSupport | STRING |
PaymentMethod | STRING |
MonthlyCharges | FLOAT |
Desligamento | BOOLEAN |
Veja a seguir algumas das consultas de amostra que os insights de dados geram para essa tabela:
Identifique os clientes que assinaram todos os serviços premium e são clientes há mais de 50 meses.
SELECT CustomerID, Contract, Tenure FROM agentville_datasets.telco_churn WHERE OnlineBackup = 'Yes' AND TechSupport = 'Yes' AND StreamingTV = 'Yes' AND Tenure > 50;
Identifique qual serviço de Internet tem mais clientes desistentes.
SELECT InternetService, COUNT(DISTINCT CustomerID) AS total_customers FROM agentville_datasets.telco_churn WHERE Churn = TRUE GROUP BY InternetService ORDER BY total_customers DESC LIMIT 1;
Identifique as taxas de desistência de usuários por segmento entre os clientes de alto valor.
SELECT Contract, InternetService, Gender, PaymentMethod, COUNT(DISTINCT CustomerID) AS total_customers, SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) AS churned_customers, (SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) / COUNT(DISTINCT CustomerID)) * 100 AS churn_rate FROM agentville_datasets.telco_churn WHERE MonthlyCharges > 100 GROUP BY Contract, InternetService, Gender, PaymentMethod;
Exibir insight
Para conferir insights de uma tabela do BigQuery, acesse a entrada da tabela no Dataplex usando a Pesquisa do Dataplex.
No console do Google Cloud, acesse a página Pesquisa do Dataplex.
Pesquise a entrada da tabela no Dataplex.
Clique na guia Insights. Se a guia estiver vazia, isso significa que os insights da tabela ainda não foram gerados. É possível gerar insights de dados no BigQuery Studio.
Preços
Para saber mais sobre os preços desse recurso, consulte Visão geral dos preços do Gemini no BigQuery.
Cotas e limites
Para informações sobre cotas e limites desse recurso, consulte Cotas do Gemini no BigQuery.
Limitações
- Os insights de dados estão disponíveis para visualizações e tabelas do BigQuery, do BigLake e externas.
- Para clientes que têm várias nuvens, os dados de outras nuvens não estão disponíveis.
- Os insights de dados não são compatíveis com os tipos de coluna
Geo
ouJSON
. - A execução de insights não garante a apresentação de consultas todas as vezes. Para aumentar a probabilidade de gerar consultas mais engajadoras, gere novamente insights no BigQuery Studio.
A seguir
- Saiba como gerar insights no BigQuery.
- Saiba como gerar uma verificação de perfil de dados.
- Saiba como escrever consultas com a assistência do Gemini no BigQuery.