Previsão em visualizações

Com a previsão, os analistas podem adicionar projeções de dados a consultas novas ou atuais da ferramenta Analisar, para ajudar os usuários a prever e monitorar pontos de dados específicos. Os resultados e as visualizações previstos da Análise podem ser adicionados aos dashboards e salvos como Looks. As visualizações e os resultados previstos também podem ser criados e visualizados no conteúdo incorporado do Looker.

Será possível prever dados se você tiver permissão para criar previsões.

Como os resultados previstos são criados e exibidos

O recurso Previsão usa os resultados dos dados da tabela de uma Análise para calcular pontos de dados futuros. Os cálculos de previsão incluem apenas os resultados mostrados de uma consulta de Análise. Os resultados que não aparecem devido aos limites de linha não são incluídos. Para mais informações sobre o algoritmo usado para calcular previsões, consulte a seção Algoritmo ARIMA nesta página.

Os resultados previstos são uma continuação das visualizações atuais da Análise e estão sujeitos às configurações da visualização definidas. Os pontos de dados previstos se distinguem dos pontos de dados não previstos das seguintes maneiras:

  1. Nos gráficos cartesianos compatíveis, os pontos de dados previstos são diferenciados dos não previstos, renderizados em um tom mais claro ou por linhas tracejadas.
  2. Nos tipos compatíveis de gráficos de texto e tabela, os pontos de dados previstos são exibidos em itálico e anexados com um asterisco.

Os dados previstos também são identificados explicitamente na dica exibida quando você passa o cursor sobre um ponto de dados previsto.

Apenas alguns tipos de visualizações são compatíveis com os dados previstos, conforme discutido na próxima seção.

Algoritmo ARIMA

A previsão utiliza um algoritmo da Média Móvel Integrada AutoRegressiva (ARIMA, na sigla em inglês) para criar uma equação que corresponda melhor aos dados inseridos em uma previsão. Para encontrar a melhor correspondência para os dados, o Looker executa o ARIMA com um conjunto de variáveis iniciais, cria uma lista de variações das variáveis iniciais e executa o ARIMA novamente com essas variações. Se alguma das variações criar uma equação que se ajuste melhor aos dados de entrada, o Looker usará essas variações como as novas variáveis iniciais e criará outras que serão avaliadas. O Looker continua repetindo esse processo até que as melhores variáveis sejam identificadas ou até que todas as opções ou o tempo de computação alocado acabem.

Esse processo pode ser considerado um algoritmo genético, em que indivíduos ao longo de centenas de gerações criam de 1 a 10 filhos (variações de variáveis baseadas no pai) e os melhores filhos sobrevivem para possivelmente criar gerações "melhores". O Looker usa muitas invocações do ARIMA em uma abordagem de algoritmo genético, chamado AutoARIMA.

Para obter detalhes adicionais sobre o AutoARIMA, consulte a seção Dicas para usar o auto_arima do Guia do Usuário pmdarima. Embora essa não seja a biblioteca que o Looker usa para executar o AutoARIMA, o pmdarima oferece a melhor explicação do processo e das diferentes variáveis usadas.

Tipos de visualização compatíveis

Os seguintes tipos de visualização cartesiana são compatíveis com a renderização de dados previstos:

Os seguintes tipos de gráficos de texto e tabela são compatíveis com a renderização de dados previstos:

No momento, outros tipos de visualização, incluindo visualizações personalizadas, não podem renderizar dados previstos.

Explorar os requisitos de consulta para previsão

Para criar uma previsão, uma Análise precisa atender a estes requisitos:

  • Inclua exatamente uma dimensão, que precisa ser de período, com o preenchimento de dimensão ativado
  • Inclua pelo menos uma medida ou medida personalizada (uma previsão pode incluir até cinco medidas ou personalizadas)
  • Classifique os resultados pela dimensão do período em ordem decrescente

Informações importantes

Confira a seguir outros critérios que precisam ser considerados ao criar uma nova consulta da Análise para conferir previsões ou adicionar uma previsão a uma consulta atual:

  • Dinâmicas: as previsões podem ser realizadas em Análises dinâmicas, desde que os requisitos anteriores sejam atendidos.
  • Totais e subtotais de linhas: os totais e subtotais das linhas não incluem valores previstos. Não recomendamos o uso de subtotais nem totais de linhas com a previsão, porque isso pode produzir números inesperados.
  • Filtros que incluem períodos incompletos: para projeções precisas, a estimativa só deve ser usada em conjunto com uma lógica de período completo nos Filtros de análise quando as Análises incluem dados de períodos incompletos. Por exemplo, se um usuário prevê dados para um mês no futuro enquanto uma Análise está filtrada para mostrar dados dos últimos três meses, ela inclui os dados do mês incompleto atual. A previsão incorporará os dados incompletos em seu cálculo e exibirá resultados mais não confiáveis. Em vez disso, use uma lógica de filtro como nos últimos três meses completos em vez de nos últimos três meses quando uma Análise incluir períodos incompletos (por exemplo, quando uma Análise inclui dados mensais incompletos do mês atual) para garantir uma previsão mais precisa.
  • Cálculos de tabela: os cálculos de tabela baseados em uma ou mais medidas previstas serão incluídos automaticamente em uma previsão.
  • Limites de linhas: saiba como os limites de linhas se aplicam a toda a tabela de dados, incluindo as linhas previstas.

Para mais dicas e recursos de solução de problemas, consulte a seção Problemas comuns e coisas importantes nesta página.

Normalmente, um conjunto de dados com mais linhas e um tamanho de previsão mais curto resulta em uma previsão mais precisa.

Opções do menu de previsão

É possível usar as opções no menu Previsão, localizado na guia Analisar visualização, para personalizar os dados previstos. O menu Previsão inclui as seguintes opções:

Selecionar campo

O menu suspenso Selecionar campo exibe as medidas ou medidas personalizadas na consulta "Explorar" que estão disponíveis para previsão. É possível selecionar até cinco medidas ou personalizadas.

Duração

A opção Comprimento indica o número de linhas ou o período para previsão de valores de dados. O intervalo de duração da previsão é preenchido automaticamente com base na dimensão de período na consulta "Análise".

Normalmente, um conjunto de dados com mais linhas e um tamanho de previsão mais curto resulta em uma previsão mais precisa.

Intervalo de previsão

A opção Intervalo de previsão permite que os analistas expressem alguma incerteza nas previsões para ajudar na precisão. Quando ativada, a opção Intervalo de previsão permite selecionar os limites dos valores de dados previstos. Por exemplo, um intervalo de previsão de 95% indica uma chance de 95% de que os valores previstos da medição fiquem entre os limites superior e inferior da previsão.

Quanto maior for o intervalo de previsão selecionado, mais amplos serão os limites superior e inferior.

Sazonalidade

A opção Sazonalidade permite que os analistas considerem ciclos conhecidos ou tendências de dados repetitivas em uma previsão e se refere ao número de linhas de dados no ciclo. Por exemplo, se uma tabela de dados da Análise tiver uma linha por hora e os dados forem atualizados diariamente, a sazonalidade será 24.

Com as configurações de previsão padrão, o Looker faz referência à dimensão de data em uma Análise e verifica vários ciclos de sazonalidade possíveis para encontrar a melhor correspondência para a previsão final. Por exemplo, ao usar dados por hora, o Looker pode testar ciclos diários, semanais e de quatro semanas. O Looker também considera a frequência da dimensão. Se uma dimensão representa um período de seis horas, o Looker sabe que haverá apenas quatro linhas em um dia e vai ajustar a sazonalidade de acordo.

Para casos de uso comuns, a opção Automático detecta a melhor sazonalidade para um determinado conjunto de dados. Se você estiver ciente de ciclos específicos no conjunto de dados, a opção Personalizado permite especificar o número de linhas que compõem um ciclo para medidas individuais em uma previsão.

Ao prever valores de dados de várias medidas, é possível selecionar diferentes opções de periodicidade, incluindo nenhuma, para cada medida individual. O menu suspenso Sazonalidade tem várias opções:

As previsões aplicam a opção de sazonalidade Automática às previsões por padrão, mesmo quando a opção Sazonalidade não está ativada.

Automático

Com a opção de sazonalidade Automática, o Looker seleciona a melhor opção para seus dados de vários períodos comuns, como diário, por hora, mensal etc.

Personalizado

Quando você souber o número específico de linhas que compõem cada temporada ou ciclo no conjunto de dados, poderá especificar o número no campo Período. Pode ser útil selecionar Personalizado se você souber que os ciclos de dados têm um número específico de linhas.

Quando você trabalha com dados que mudam em meses, mas são expressos em maior granularidade (por exemplo, usando uma granularidade de data ou semana em uma Análise), geralmente um período de 4 semanas ou 30 dias se encaixa em ciclos mensais.

Nenhuma

A sazonalidade é um componente poderoso da previsão. No entanto, dependendo dos dados de entrada, ela nem sempre é recomendada. Se não houver ciclos previsíveis nos dados, ativar a sazonalidade poderá, ocasionalmente, levar a previsões imprecisas quando o algoritmo tentará encontrar um padrão e, em seguida, tentar ajustar o padrão falso à previsão. Isso pode resultar em uma previsão obscura.

Quando você estiver prevendo valores de dados para várias medidas e quiser ativar a Sazonalidade apenas para uma ou algumas, selecione Nenhuma para todas as medidas para as quais não quer ativar a Sazonalidade.

Como criar uma previsão

Somente usuários com permissão podem criar previsões.

Para criar uma previsão, siga estas etapas:

  1. Verifique se a Análise atende aos requisitos de previsão. Por exemplo, um usuário quer criar uma previsão para uma consulta da Análise com o Mês de criação dos usuários, Contagem de usuários e Contagem de pedidos, classificada por Mês de criação dos usuários em ordem decrescente. Os resultados mostram dados até dezembro de 2019.

  2. Clique em Previsão na guia Explorar visualização para abrir o menu Previsão.

  3. Clique no menu suspenso Selecionar campo para escolher até cinco medidas ou medidas personalizadas que serão previstas. No exemplo, o usuário seleciona Contagem de usuários e Contagem de pedidos.

  4. Insira a duração de tempo no futuro que você quer prever no campo Duração. No exemplo, o usuário insere 6 meses.

  5. Também é possível clicar na chave Intervalo de previsão ou Sazonalidade para ativar uma das funções e personalizar as opções associadas. O usuário no exemplo não habilitou nenhuma das opções.

  6. Clique no x na guia do menu ao lado de Previsão para salvar suas configurações e sair do menu.

  7. Clique em Run para executar novamente a consulta "Explore". É necessário executar a Análise novamente depois de fazer alterações na previsão.

Os resultados e a visualização da Análise agora vão mostrar os valores previstos para o período especificado. Com as opções especificadas, o exemplo "Explorar" mostra dados previstos para Contagem de usuários e Contagem de pedidos de seis meses (de 01/2020 a 6 de junho de 2020).

Como os cálculos previstos dependem da ordem em que os dados são classificados, a classificação é desativada depois que uma consulta prevista é executada.

Como editar uma previsão

Somente usuários com permissão podem editar previsões.

Para editar uma previsão:

  1. Se quiser, edite a consulta “Análise” conforme necessário para adicionar ou remover diferentes campos de medidas ou prazos. Verifique se a Análise atende aos requisitos de previsão.
  2. Clique em Previsão na guia Explorar visualização para abrir o menu Previsão.
  3. Clique no menu suspenso Selecionar campo para fazer alterações nos campos previstos. Para remover campos previstos:
    • Clique nas caixas ao lado dos campos previstos no menu suspenso Selecionar campo expandido para remover os campos da previsão.
    • Outra opção é clicar no x ao lado do nome do campo no menu recolhido Selecionar campo.
  4. Edite a duração especificada no futuro para prever no campo Duração, conforme desejado.
  5. Também é possível clicar na chave Intervalo de previsão ou Sazonalidade para ativar uma das funções e personalizar as opções associadas.
    • Se as opções Intervalo de previsão ou Periodicidade já estiverem ativadas, as personalizações serão exibidas. Edite as configurações personalizadas como quiser ou selecione a chave para remover a função da estimativa.
  6. Clique no x na guia do menu ao lado de Previsão para salvar suas configurações e sair do menu.
  7. Clique em Run para executar novamente a consulta "Explore". É necessário executar a Análise novamente depois de fazer mudanças na previsão.

Os resultados e a visualização da Análise agora vão mostrar a previsão corrigida. Como os cálculos previstos dependem da ordem em que os dados são classificados, a classificação é desativada depois que uma consulta prevista é executada.

Como remover uma previsão

Somente usuários com permissão podem remover previsões.

Para remover uma previsão de uma Análise, faça o seguinte:

  1. Clique em Previsão na guia Explorar visualização para abrir o menu Previsão.
  2. Clique em Limpar na parte superior do menu Previsão.

A consulta será executada novamente de forma automática para produzir os resultados sem uma previsão aplicada.

Problemas comuns e coisas que você precisa saber

Qual é a precisão dela?

A precisão de uma previsão depende dos dados de entrada. A implementação do AutoARIMA do Looker pode fazer previsões incrivelmente precisas que combinam com sucesso muitas nuances dos dados de entrada. Há também casos em que o algoritmo se envolve em padrões estranhos nos dados de entrada e os enfatiza na previsão. Verifique se foram fornecidos dados suficientes e se eles são os mais precisos possível para aproveitar a previsão ao máximo.

Não foi possível gerar uma previsão

Há motivos legítimos para que uma estimativa não possa ser gerada. Isso geralmente acontece porque a quantidade de dados de entrada é muito pequena ou o tamanho solicitado da previsão é muito grande. Não há limite específico para nenhum dos fatores nem uma proporção exata dos dados de entrada necessários para um determinado período de previsão. Quanto mais dispersos e imprevisíveis forem os dados de entrada, mais difícil será para o algoritmo AutoARIMA encontrar uma correspondência. A maneira mais eficaz de gerar uma previsão é aumentar a quantidade de dados de entrada limpos, verificar se as configurações de sazonalidade estão corretas e reduzir a duração da previsão para apenas o necessário. Ao usar a opção Intervalo de previsão, pode ser útil escolher um intervalo menor.

A limpeza de dados de entrada pode envolver:

  • Corte das linhas à esquerda ou à direita referentes a períodos que não contêm dados
  • Reduzir o ruído no conjunto de dados escolhendo uma dimensão de data maior
  • Mudar os outliers de filtro que não beneficiam a previsão

O resultado da consulta retornou sem previsões, e recebi um erro obscuro

Isso não vai acontecer. Se isso acontecer, remova as medidas da configuração de previsão e as adicione novamente.

A previsão é exibida, mas obviamente está errada ou não é útil

Nesse caso, o melhor a fazer é adicionar mais dados de entrada, limpar o máximo possível e definir uma sazonalidade personalizada (se você souber de ciclos específicos nos dados) ou desativar completamente a opção Sazonalidade selecionando Nenhuma.

A limpeza de dados de entrada pode envolver as seguintes tarefas:

  • Corte das linhas à esquerda ou à direita referentes a períodos que não contêm dados
  • Reduzir o ruído no conjunto de dados escolhendo uma dimensão de data maior
  • Mudar os outliers de filtro que não beneficiam a previsão