Visão geral da análise de contribuição
Você pode usar a análise de contribuição, também chamada de análise de principais fatores, para gerar insights sobre mudanças nas principais métricas dos seus dados multidimensionais. Por
exemplo, é possível usar a análise de contribuição para conferir a mudança nos números de receita
em dois trimestres ou comparar dois conjuntos de dados de treinamento para entender
as mudanças na performance de um modelo de ML. É possível usar uma instrução CREATE MODEL
para criar um modelo de análise de contribuição no BigQuery.
A análise de contribuição é uma forma de análise aumentada, que é o uso de inteligência artificial (IA) para aprimorar e automatizar a análise e a compreensão dos dados. A análise de contribuição alcança uma das principais metas da análise aumentada, que é ajudar os usuários a encontrar padrões nos dados.
Um modelo de análise de contribuição detecta segmentos de dados que mostram mudanças estatisticamente significativas em uma métrica ao longo do tempo, comparando um conjunto de dados de teste com um conjunto de dados de controle. Assim, você pode conferir como os dados mudam com o tempo, o local, o segmento de clientes ou qualquer outra métrica que seja importante para você. Por exemplo, você pode comparar um snapshot de tabela feito no final de 2023 com um snapshot de tabela feito no final de 2022 para saber como os dados são diferentes em dois anos.
A métrica é o valor numérico que os modelos de análise de contribuição usam para medir e comparar as mudanças entre os dados de teste e de controle. É possível especificar uma métrica somavel ou uma proporção somável com modelos de análise de contribuição.
Um segmento é um recorte dos dados identificados por uma determinada combinação de valores de dimensão. Por exemplo, para um modelo de análise de contribuição com base nas dimensões store_number
, customer_id
e day
, cada combinação exclusiva desses valores de dimensão representa um segmento. Na tabela a seguir,
cada linha representa um segmento diferente:
store_number |
customer_id |
day |
Loja 1 | ||
Loja 1 | Cliente 1 | |
Loja 1 | Cliente 1 | Segunda-feira |
Loja 1 | Cliente 1 | Terça-feira |
Loja 1 | Cliente 2 | |
Loja 2 |
Para modelar apenas os segmentos maiores e, portanto, mais relevantes, especifique um limite de suporte a priori que elimine os segmentos pequenos do uso pelo modelo. Isso também reduz o tempo de criação do modelo.
Depois de criar um modelo de análise de contribuição, use a
função ML.GET_INSIGHTS
para recuperar as informações de métrica calculadas pelo modelo.
A seguir
- Criar um modelo de análise de contribuição
- Receber insights de dados de um modelo de análise de contribuição