Vista geral da análise da contribuição

Use este documento para compreender o exemplo de utilização da análise de contribuição e as opções para realizar a análise de contribuição no BigQuery ML.

O que é a análise da contribuição?

A análise de contribuição, também denominada análise de fatores principais, é um método usado para gerar estatísticas sobre as alterações às métricas principais nos seus dados multidimensionais. Por exemplo, pode usar a análise de contribuição para ver que dados contribuíram para uma alteração nos números de receita em dois trimestres ou para comparar dois conjuntos de dados de preparação para compreender as alterações no desempenho de um modelo de ML.

A análise de contribuição é uma forma de estatísticas aumentadas, que é a utilização da inteligência artificial (IA) para melhorar e automatizar a análise e a compreensão dos dados. A análise de contribuições cumpre um dos principais objetivos das estatísticas aumentadas, que é ajudar os utilizadores a encontrar padrões nos respetivos dados.

Análise de contribuições com o BigQuery ML

Para usar a análise de contribuição no BigQuery ML, crie um modelo de análise de contribuição com a declaração CREATE MODEL.

Um modelo de análise de contribuição deteta segmentos de dados que mostram alterações numa determinada métrica comparando um conjunto de dados de teste com um conjunto de dados de controlo. Por exemplo, pode usar uma imagem instantânea da tabela dos dados de vendas tirada no final de 2023 como dados de teste e uma imagem instantânea da tabela tirada no final de 2022 como dados de controlo, e compará-los para ver como as vendas mudaram ao longo do tempo. Um modelo de análise de contribuição pode mostrar-lhe que segmento de dados, como clientes online numa região específica, gerou a maior alteração nas vendas de um ano para o outro.

Uma métrica é o valor numérico que os modelos de análise de contribuição usam para medir e comparar as alterações entre os dados de teste e de controlo. Pode especificar os seguintes tipos de métricas com um modelo de análise de contribuição:

  • Somável: soma os valores de uma coluna de métricas especificada por si e, em seguida, determina um total para cada segmento dos dados.
  • Rácio somável: soma os valores de duas colunas numéricas que especificar e determina o rácio entre elas para cada segmento dos dados.
  • Somável por categoria: soma o valor de uma coluna numérica e divide-o pelo número de valores distintos de uma coluna categorial.

Um segmento é uma fatia dos dados identificada por uma determinada combinação de valores de dimensões. Por exemplo, para um modelo de análise de contribuição baseado nas dimensões store_number, customer_id e day, cada combinação única desses valores de dimensão representa um segmento. Na tabela seguinte, cada linha representa um segmento diferente:

store_number customer_id day
store 1
store 1 cliente 1
store 1 cliente 1 Segunda-feira
store 1 cliente 1 Terça-feira
store 1 cliente 2
store 2

Para reduzir o tempo de criação do modelo, especifique um limite de suporte a priori. Um limite de suporte apriori permite-lhe remover segmentos pequenos e menos relevantes para que o modelo use apenas os segmentos maiores e mais relevantes.

Depois de criar um modelo de análise de contribuições, pode usar a função ML.GET_INSIGHTS para obter as informações das métricas calculadas pelo modelo. O resultado do modelo consiste em linhas de estatísticas, em que cada estatística corresponde a um segmento e fornece as métricas correspondentes do segmento.

Percurso do utilizador da análise de contribuições

A tabela seguinte descreve as declarações e as funções que pode usar com os modelos de análise de contribuição:

Criação de modelos Pré-processamento de funcionalidades Geração de estatísticas Tutoriais
CREATE MODEL Pré-processamento manual ML.GET_INSIGHTS

O que se segue?