Previsão em visualizações

Com a previsão, os analistas podem adicionar rapidamente projeções de dados a consultas novas ou existentes do Google Analytics/Google Analytics 360 para ajudar os usuários a prever e monitorar pontos de dados específicos. Os resultados e as visualizações previstos da Análise podem ser adicionados aos dashboards e salvos como Looks. As visualizações e os resultados previstos também podem ser criados e visualizados no conteúdo incorporado do Looker.

Será possível prever dados se você tiver permissão para criar previsões.

Como os resultados previstos são criados e exibidos

O recurso Previsão usa os resultados dos dados da tabela de uma Análise para calcular pontos de dados futuros. Os cálculos de previsão incluem apenas os resultados mostrados de uma consulta de Análise. todos os resultados que não forem exibidos por causa dos limites de linha não serão incluídos. Para mais informações sobre o algoritmo usado para calcular as previsões, consulte a seção Algoritmo ARIMA nesta página.

Os resultados previstos são uma continuação das visualizações atuais da Análise e estão sujeitos às configurações da visualização definidas. Os pontos de dados previstos são diferenciados dos não previstos das seguintes maneiras:

  1. Nos gráficos cartesianos compatíveis, os pontos de dados previstos são diferenciados dos não previstos pela renderização em uma tonalidade mais clara ou por linhas tracejadas.
  2. Nos tipos de gráficos de texto e tabela compatíveis, os pontos de dados previstos são mostrados em itálico e anexados com um asterisco.

Os dados previstos também são identificados explicitamente na dica que aparece quando você passa o cursor sobre um ponto de dados previsto.

Apenas alguns tipos de visualização oferecem suporte a dados previstos, conforme discutido na próxima seção.

Algoritmo ARIMA

A previsão usa um algoritmo de média móvel integrada auto-regressiva (ARIMA, na sigla em inglês) para criar uma equação que corresponde melhor aos dados inseridos em uma previsão. Para encontrar a melhor correspondência para os dados, o Looker executa a ARIMA com um conjunto de variáveis iniciais, cria uma lista de variações das variáveis iniciais e executa a ARIMA novamente com essas variações. Se alguma das variações criar uma equação que se ajuste melhor aos dados de entrada, o Looker usará essas variações como as novas variáveis iniciais e criará outras que serão avaliadas. O Looker continua repetindo esse processo até que as melhores variáveis sejam identificadas ou até que todas as opções ou o tempo de computação alocado acabem.

Esse processo pode ser considerado um algoritmo genético, em que indivíduos ao longo de centenas de gerações criam de 1 a 10 descendentes cada (variações de variáveis baseadas no pai), e o melhor filho sobrevive para potencialmente criar "melhor". gerações. O Looker usa muitas invocações do ARIMA em uma abordagem de algoritmo genético, chamado AutoARIMA.

Para obter detalhes adicionais sobre o AutoARIMA, consulte a seção Dicas para usar o auto_arima do Guia do Usuário pmdarima. Embora essa não seja a biblioteca que o Looker usa para executar o AutoARIMA, o pmdarima fornece a melhor explicação do processo e das diferentes variáveis usadas.

Tipos de visualização aceitos

Os seguintes tipos de visualização cartesiana são compatíveis com a renderização de dados previstos:

Os seguintes tipos de gráficos de texto e tabelas oferecem suporte à renderização de dados previstos:

No momento, outros tipos de visualização, incluindo visualizações personalizadas, não podem renderizar dados previstos.

Explorar os requisitos de consulta para previsão

Para criar uma previsão, uma Análise precisa atender a estes requisitos:

  • Inclua exatamente uma dimensão, que precisa ser de período, com o preenchimento de dimensão ativado
  • Inclua pelo menos uma medida ou medida personalizada (uma previsão pode incluir até cinco medidas ou personalizadas)
  • Classificar os resultados pela dimensão do período em ordem decrescente

Informações importantes

Confira a seguir outros critérios a serem considerados ao criar uma consulta da Análise detalhada para fazer uma previsão ou adicionar uma previsão a uma consulta existente:

  • Pivôs: as previsões podem ser realizadas em análises detalhadas pivotadas, desde que os requisitos anteriores sejam atendidos.
  • Totais e subtotais de linha: os totais e subtotais de linha não incluem valores previstos. Não recomendamos usar subtotais ou totais de linha com previsão, porque isso pode gerar números inesperados.
  • Filtros que incluem períodos incompletos: para projeções precisas, a estimativa só deve ser usada em conjunto com uma lógica de período completo nos Filtros de análise quando as Análises incluem dados de períodos incompletos. Por exemplo, se um usuário prever dados para um mês no futuro enquanto uma Análise detalhada é filtrada para mostrar dados dos três meses anteriores, a Análise detalhada vai incluir os dados do mês atual incompleto. A previsão vai incorporar os dados incompletos ao cálculo e mostrar resultados menos confiáveis. Em vez disso, use a lógica de filtro nos últimos três meses completos em vez de nos últimos três meses quando uma Análise detalhada incluir períodos incompletos (por exemplo, quando uma Análise detalhada incluir dados mensais incompletos do mês atual) para garantir uma previsão mais precisa.
  • Cálculos de tabela: os cálculos de tabela baseados em uma ou mais medidas previstas serão incluídos automaticamente em uma previsão.
  • Limites de linhas: saiba como os limites de linhas se aplicam a toda a tabela de dados, incluindo as linhas previstas.

Para mais dicas e recursos de solução de problemas, consulte a seção Problemas comuns e informações importantes nesta página.

Normalmente, um conjunto de dados com mais linhas, em conjunto com um comprimento de previsão menor, resulta em uma previsão mais precisa.

Opções do menu de previsão

Use as opções no menu Previsão, localizado na guia Visualização, para personalizar os dados previstos. O menu Previsão inclui as seguintes opções:

Selecionar campo

O menu suspenso Selecionar campo exibe as medidas ou medidas personalizadas na consulta "Explorar" que estão disponíveis para previsão. É possível selecionar até cinco medidas ou personalizadas.

Duração

A opção Comprimento indica o número de linhas ou o período de tempo para prever os valores dos dados. O intervalo de duração da previsão é preenchido automaticamente com base na dimensão do período na consulta da Análise detalhada.

Normalmente, um conjunto de dados com mais linhas, em conjunto com um comprimento de previsão menor, resulta em uma previsão mais precisa.

Intervalo de previsão

A opção Intervalo de previsão permite que os analistas expressem alguma incerteza nas previsões para ajudar na precisão. Quando ativada, a opção Intervalo de previsão permite selecionar os limites dos valores de dados previstos. Por exemplo, um intervalo de previsão de 95% indica uma chance de 95% de que os valores da medida previstos fiquem entre os limites máximo e mínimo da previsão.

Quanto maior for o intervalo de previsão selecionado, mais amplos serão os limites superior e inferior.

Sazonalidade

A opção Sazonalidade permite que os analistas considerem ciclos conhecidos ou tendências de dados repetitivos em uma previsão. Ela se refere ao número de linhas de dados no ciclo. Por exemplo, se uma tabela de dados da Análise detalhada tiver uma linha por hora e os dados forem diários, a sazonalidade será 24.

Com as configurações padrão de previsão, o Looker faz referência à dimensão de data em uma análise detalhada e verifica vários ciclos de sazonalidade possíveis para encontrar a melhor correspondência para a previsão final. Por exemplo, ao usar dados por hora, o Looker pode testar ciclos diários, semanais e de quatro semanas. O Looker também considera a frequência da dimensão. Se uma dimensão representa um período de seis horas, o Looker sabe que haverá apenas quatro linhas por dia e ajustará a sazonalidade de acordo.

Para casos de uso comuns, a opção Automático detecta a melhor sazonalidade para um determinado conjunto de dados. Se você estiver ciente de ciclos específicos no conjunto de dados, a opção Personalizado permite especificar o número de linhas que compõem um ciclo para medidas individuais em uma previsão.

Ao prever valores de dados de várias medidas, é possível selecionar diferentes opções de periodicidade, incluindo nenhuma, para cada medida individual. O menu suspenso Sazonalidade tem várias opções:

A previsão aplica a opção de sazonalidade Automática às previsões por padrão, mesmo quando a opção Sazonalidade não está ativada.

Automático

Com a opção de sazonalidade Automática, o Looker seleciona a melhor opção para seus dados entre vários períodos de sazonalidade comuns, como diário, por hora, mensal e assim por diante.

Personalizado

Quando você souber o número específico de linhas que compõem cada temporada ou ciclo no conjunto de dados, poderá especificar o número no campo Período. Pode ser útil selecionar Personalizado se você souber que os ciclos de dados têm um número específico de linhas.

Quando você trabalha com dados que são cíclicos em meses, mas são expressos em maior granularidade (por exemplo, usando uma granularidade de data ou semana em uma Análise detalhada), geralmente um período de 4 semanas ou 30 dias se encaixa em ciclos mensais.

Nenhum

A sazonalidade é um componente poderoso da previsão, mas, dependendo dos dados de entrada, nem sempre é recomendada. Se não houver ciclos previsíveis nos dados, ativar a sazonalidade poderá, ocasionalmente, levar a previsões imprecisas quando o algoritmo tentará encontrar um padrão e, em seguida, tentar ajustar o padrão falso à previsão. Isso pode resultar em uma previsão obscura.

Ao prever valores de dados para várias medidas e ativar a Sazonalidade apenas para uma ou algumas delas, selecione Nenhuma para todas as medidas que você não quer ativar a Sazonalidade.

Criação de uma previsão

Somente usuários com permissão podem criar previsões.

Para criar uma previsão, siga estas etapas:

  1. Verifique se a Análise atende aos requisitos de previsão. Por exemplo, um usuário quer criar uma previsão para uma consulta da Análise com o Mês de criação dos usuários, Contagem de usuários e Contagem de pedidos, classificada por Mês de criação dos usuários em ordem decrescente. Os resultados mostram dados até dezembro de 2019.

  2. Clique em Estimativa na guia Visualização para abrir o menu Estimativa.

  3. Clique no menu suspenso Selecionar campo para escolher até cinco medidas ou medidas personalizadas para fazer a previsão. O usuário no exemplo seleciona Contagem de usuários e Contagem de pedidos.

  4. Insira a duração de tempo no futuro que você quer prever no campo Duração. No exemplo, o usuário insere 6 meses.

  5. Se preferir, clique em Intervalo de previsão ou Sazonalidade para ativar a função e personalizar as opções associadas. O usuário no exemplo não habilitou nenhuma das opções.

  6. Clique no x na guia de menu ao lado de Previsão para salvar as configurações e sair do menu.

  7. Clique em Executar para refazer a consulta. É necessário executar a análise detalhada novamente depois de fazer mudanças na previsão.

Os resultados e a visualização da Análise agora vão mostrar os valores previstos para o período especificado. Com as opções especificadas, o exemplo "Explorar" mostra dados previstos para Contagem de usuários e Contagem de pedidos de seis meses (de 01/2020 a 6 de junho de 2020).

Como os cálculos previstos dependem da ordem em que os dados são ordenados, a classificação é desativada após a execução de uma consulta prevista.

Como editar uma previsão

Somente usuários com permissão podem editar previsões.

Para editar uma previsão:

  1. Se preferir, edite a consulta da Análise detalhada conforme necessário para adicionar ou remover diferentes medidas ou campos de período. Verifique se a Análise atende aos requisitos de previsão.
  2. Clique em Previsão na guia Explorar visualização para abrir o menu Previsão.
  3. Clique no menu suspenso Selecionar campo para fazer mudanças nos campos previstos. Para remover campos previstos:
    • Clique nas caixas ao lado dos campos previstos no menu suspenso Selecionar campo expandido para removê-los da previsão.
    • Outra opção é clicar no x ao lado do nome do campo no menu recolhido Selecionar campo.
  4. Edite a duração especificada no futuro para fazer a previsão no campo Duração, conforme necessário.
  5. Se preferir, clique em Intervalo de previsão ou Sazonalidade para ativar a função e personalizar as opções associadas.
    • Se as opções Intervalo de previsão ou Periodicidade já estiverem ativadas, as personalizações serão exibidas. Edite as configurações personalizadas conforme necessário ou selecione a chave para remover a função da previsão.
  6. Clique no x na guia do menu ao lado de Previsão para salvar suas configurações e sair do menu.
  7. Clique em Run para executar novamente a consulta "Explore". É necessário executar a Análise novamente depois de fazer mudanças na previsão.

Os resultados e a visualização da Análise agora vão mostrar a previsão corrigida. Como os cálculos previstos dependem da ordem em que os dados são ordenados, a classificação é desativada após a execução de uma consulta prevista.

Como remover uma previsão

Somente usuários com permissão podem remover previsões.

Para remover uma previsão de uma Análise detalhada:

  1. Clique em Estimativa na guia Visualização para abrir o menu Estimativa.
  2. Clique em Limpar na parte de cima do menu Estimativa.

A consulta será executada novamente de forma automática para produzir os resultados sem uma previsão aplicada.

Problemas comuns e informações importantes

Qual é a precisão dela?

A precisão de uma previsão depende dos dados de entrada. A implementação da AutoARIMA do Looker pode fazer previsões incrivelmente precisas que combinam muitas nuances dos dados de entrada. Também há casos em que o algoritmo fica preso a padrões estranhos nos dados de entrada e os enfatiza demais na previsão. Verifique se foram fornecidos dados suficientes e se eles são os mais precisos possível para aproveitar a previsão ao máximo.

Não foi possível gerar uma previsão

Há motivos legítimos para que uma previsão não possa ser gerada. Geralmente, isso ocorre porque a quantidade de dados de entrada é muito pequena ou o comprimento da previsão solicitado é muito grande. Não há limite específico para nenhum dos fatores nem uma proporção exata dos dados de entrada necessários para um determinado período de previsão. Quanto mais dispersos e imprevisíveis forem os dados de entrada, mais difícil será para o algoritmo AutoARIMA encontrar uma correspondência. A maneira mais eficaz de gerar uma previsão é aumentar a quantidade de dados de entrada limpos, verificar se as configurações de sazonalidade estão corretas e reduzir a duração da previsão para apenas o necessário. Ao usar a opção Intervalo de previsão, pode ser útil escolher um intervalo menor.

A limpeza de dados de entrada pode envolver:

  • Recorte de linhas iniciais ou finais de períodos de tempo que não contêm dados
  • Reduzir o ruído no conjunto de dados escolhendo uma dimensão de data maior
  • Mudar os outliers de filtro que não beneficiam a previsão

O resultado da consulta foi retornado sem previsões, e recebi um erro obscuro

Isso não vai acontecer. Se for o caso, remova as medidas da configuração de previsão e as adicione novamente.

A previsão é exibida, mas obviamente está errada ou não é útil

Nesse caso, o melhor a fazer é adicionar mais dados de entrada, limpar o máximo possível e definir uma sazonalidade personalizada (se você souber de ciclos específicos nos dados) ou desativar completamente a opção Sazonalidade selecionando Nenhuma.

A limpeza de dados de entrada pode envolver as seguintes tarefas:

  • Recorte de linhas iniciais ou finais de períodos de tempo que não contêm dados
  • Reduzir o ruído no conjunto de dados escolhendo uma dimensão de data maior
  • Mudar os outliers de filtro que não beneficiam a previsão