Previsão em visualizações

Com a previsão, os analistas podem adicionar projeções de dados rapidamente a consultas do Explore novas ou atuais para ajudar os usuários a prever e monitorar pontos de dados específicos. Os resultados e as visualizações previstos do Explore podem ser adicionados a dashboards e salvos como Looks. As visualizações e os resultados previstos também podem ser criados e acessados em conteúdo incorporado do Looker.

É possível prever dados se você tiver permissão para criar previsões.

Como os resultados previstos são criados e exibidos

O recurso Previsão usa os resultados dos dados na tabela de uma Análise para calcular os próximos pontos de dados. Os cálculos de previsão incluem apenas os resultados exibidos de uma consulta do recurso Explorar. Os resultados não exibidos por causa dos limites de linha não são incluídos. Para mais informações sobre o algoritmo usado para calcular previsões, consulte a seção Algoritmo ARIMA nesta página.

Os resultados previstos são mostrados como uma continuação das visualizações atuais e estão sujeitos às configurações de visualização definidas. Os pontos de dados previstos se distinguem dos pontos de dados não previstos das seguintes maneiras:

  1. Nos gráficos cartesianos compatíveis, os pontos de dados previstos são diferenciados dos não previstos por meio da renderização em um tom mais claro ou por linhas tracejadas.
  2. Nos tipos de gráficos de texto e tabela compatíveis, os pontos de dados previstos aparecem em itálico e aparecem com um asterisco.

Os dados previstos também são identificados explicitamente na dica que aparece quando você passa o cursor sobre um ponto de dados previsto.

Apenas determinados tipos de visualizações são compatíveis com dados previstos, conforme discutido na próxima seção.

Algoritmo ARIMA

As previsões utilizam um algoritmo de Média Móvel Integrada Autoregressiva (ARIMA, na sigla em inglês) para criar uma equação que melhor corresponda aos dados inseridos em uma previsão. Para encontrar a melhor correspondência para os dados, o Looker executa o ARIMA com um conjunto de variáveis iniciais, cria uma lista de variações das variáveis iniciais e executa o ARIMA novamente com essas variações. Se uma das variações criar uma equação que corresponda melhor aos dados de entrada, o Looker vai usar essas variações como as novas variáveis iniciais e criar outras variações que serão avaliadas. O Looker continua repetindo esse processo até que as melhores variáveis sejam identificadas ou até que todas as opções ou o tempo de computação alocado se esgote.

Esse processo pode ser considerado um algoritmo genético. Nele, indivíduos de centenas de gerações criam de 1 a 10 filhos (variações de variáveis baseadas no pai) e os melhores filhos sobrevivem para potencialmente criar gerações "melhores". O Looker usa muitas invocações de ARIMA em uma abordagem de algoritmo genético é chamado de AutoARIMA.

Para mais detalhes sobre o AutoARIMA, consulte a seção Dicas para usar o auto_arima do Guia do usuário do pmdarima. Embora essa não seja a biblioteca que o Looker usa para executar o AutoARIMA, o pmdarima fornece a melhor explicação do processo e das diferentes variáveis usadas.

Tipos de visualização compatíveis

Os seguintes tipos de visualização cartesiana são compatíveis com a renderização de dados previstos:

Os seguintes tipos de gráfico de texto e de tabela são compatíveis com a renderização de dados previstos:

No momento, outros tipos de visualização, incluindo personalizadas, não podem renderizar dados previstos.

Explorar os requisitos de consulta para previsão

Para criar uma previsão, um Explorar precisa atender a estes requisitos:

  • Inclua exatamente uma dimensão, que precisa ser de período, com o preenchimento de dimensão ativado.
  • Incluir pelo menos uma medida ou medida personalizada (uma previsão pode incluir até cinco medidas ou medidas personalizadas)
  • Classificar os resultados pela dimensão de período em ordem decrescente

Informações importantes

Confira a seguir outros critérios a serem considerados ao criar uma nova consulta de Análises detalhadas para prever ou adicionar uma previsão a uma atual:

  • Tabelas dinâmicas: é possível realizar previsões em Análises dinâmicas dinâmicas, desde que os requisitos anteriores sejam atendidos.
  • Totais e subtotais das linhas: os totais e subtotais das linhas não incluem valores previstos. Não recomendamos o uso desses valores na previsão, já que isso pode gerar números inesperados.
  • Filtros que incluem períodos incompletos: para projeções precisas, a estimativa só deve ser usada com uma lógica de período completa nos filtros de Explorar quando as Análises incluem dados de períodos incompletos. Por exemplo, se um usuário prevê dados para um mês no futuro enquanto uma Análise é filtrada para mostrar dados dos últimos três meses, a Análise inclui os dados do mês incompleto atual. A previsão vai incorporar os dados incompletos no cálculo e exibir resultados mais não confiáveis. Em vez disso, use uma lógica de filtro, como nos últimos três meses completos, em vez de nos últimos três meses, quando uma Análise incluir períodos incompletos (por exemplo, quando uma Análise inclui dados mensais incompletos do mês atual) para garantir uma previsão mais precisa.
  • Cálculos de tabela: os cálculos de tabela baseados em uma ou mais medidas são incluídos automaticamente em uma previsão.
  • Limites de linha: explore como os limites de linhas se aplicam a toda a tabela de dados, incluindo as linhas previstas.

Para mais dicas e recursos de solução de problemas, consulte a seção Problemas comuns e informações importantes nesta página.

Normalmente, um conjunto de dados com mais linhas, em conjunto com uma previsão mais curta, resulta em uma previsão mais precisa.

Opções do menu de previsão

Use as opções no menu Previsão (na guia Explorar Visualização) para personalizar os dados previstos. O menu Previsão inclui as seguintes opções:

Selecionar campo

O menu suspenso Selecionar campo mostra as medições ou medidas personalizadas disponíveis na consulta "Explorar" que estão disponíveis para previsão. É possível selecionar até cinco medidas ou medidas personalizadas.

Duração

A opção Comprimento indica o número de linhas ou o período para a previsão dos valores de dados. O intervalo de duração da estimativa é preenchido automaticamente com base na dimensão de período na consulta de Análises detalhadas.

Normalmente, um conjunto de dados com mais linhas, em conjunto com um comprimento de previsão mais curto, resulta em uma previsão mais precisa.

Intervalo de previsão

A opção Intervalo de previsão permite que os analistas expressem alguma incerteza nas previsões para auxiliar na precisão. Quando ativada, a opção Intervalo de previsão permite selecionar os limites dos valores de dados previstos. Por exemplo, um intervalo de previsão de 95% indica 95% de chance de que os valores de medidas previstos fiquem entre os limites superior e inferior dela.

Quanto maior o intervalo de previsão selecionado, mais amplos serão os limites superior e inferior.

Sazonalidade

A opção Sazonalidade permite que os analistas considerem ciclos conhecidos ou tendências de dados repetitivos em uma previsão e se refere ao número de linhas de dados no ciclo. Por exemplo, se uma tabela de dados da Análise tiver uma linha por hora e os ciclos de dados ocorrerem diariamente, a sazonalidade será 24.

Com as configurações de previsão padrão, o Looker faz referência à dimensão de data em uma Análise e verifica vários ciclos de sazonalidade possíveis para encontrar a melhor correspondência para a previsão final. Por exemplo, ao usar dados por hora, o Looker pode testar ciclos de sazonalidade diários, semanais e de quatro semanas. O Looker também considera a frequência da dimensão. Se uma dimensão representar um período de seis horas, ele sabe que haverá apenas quatro linhas em um dia e vai ajustar a sazonalidade de acordo com isso.

Para casos de uso comuns, a opção Automático detecta a melhor sazonalidade para um determinado conjunto de dados. Se você estiver ciente de ciclos específicos no conjunto de dados, a opção Personalizado permite especificar o número de linhas que compõem um ciclo para medidas individuais em uma previsão.

Ao prever valores de dados para várias medidas, você pode selecionar diferentes opções de sazonalidade, incluindo nenhuma, para cada medida individual. O menu suspenso Sazonalidade tem várias opções:

Por padrão, a previsão aplica a opção de sazonalidade Automática às previsões, mesmo quando a opção Sazonalidade não está ativada.

Automático

Com a sazonalidade Automática, o Looker seleciona a melhor opção para seus dados entre vários períodos comuns, como diário, por hora, mensal e assim por diante.

Personalizado

Quando você sabe o número específico de linhas que compõem cada estação ou ciclo em seu conjunto de dados, pode especificar o número no campo Período. Talvez seja útil selecionar Personalizado se você sabe que os dados alternam em um número específico de linhas.

Quando você trabalha com dados que mudam em meses, mas que são expressos em maior granularidade (por exemplo, usando uma granularidade de data ou semana em uma Análise), geralmente um período de 4 ou 30 dias se encaixa em ciclos mensais.

Nenhum

A sazonalidade é um componente poderoso da previsão. No entanto, dependendo dos dados de entrada, ela nem sempre é recomendada. Se não houver ciclos previsíveis nos dados, ativar a sazonalidade pode resultar em previsões imprecisas quando o algoritmo tentará encontrar um padrão e depois tentará ajustar o padrão falso à previsão. Isso pode resultar em uma previsão obscura.

Quando estiver prevendo valores de dados para várias medidas e quiser ativar a Sazonalidade apenas para uma ou algumas, selecione Nenhuma para todas as medidas em que você não quer ativar a Sazonalidade.

Como criar uma previsão

Somente usuários com permissão podem criar previsões.

Para criar uma previsão, siga estas etapas:

  1. Verifique se a Análise atende aos requisitos de previsão. Por exemplo, um usuário quer criar uma previsão para uma consulta do Explore com Mês de criação de usuários, Contagem de usuários e Contagem de pedidos, classificada por Mês de criação de usuários em ordem decrescente. Os resultados exibem dados até dezembro de 2019.

  2. Clique em Previsão na guia Explorar visualização para abrir o menu Previsão.

  3. Clique no menu suspenso Selecionar campo para escolher até cinco medidas ou medidas personalizadas para previsão. O usuário no exemplo seleciona Contagem de usuários e Contagem de pedidos.

  4. Insira a duração no futuro que você quer prever no campo Duração. O usuário no exemplo insere 6 meses.

  5. Também é possível clicar na chave Intervalo de previsão ou Sazonalidade para ativar uma das funções e personalizar as opções associadas. O usuário no exemplo não ativa nenhuma das opções.

  6. Clique no x na guia do menu ao lado de Previsão para salvar suas configurações e sair do menu.

  7. Clique em Executar para executar de novo a consulta do Explore. É necessário executar a Análise novamente depois de fazer alterações na previsão.

Os resultados e a visualização da Análise agora vão mostrar valores previstos para o período especificado. Com as opções especificadas, o exemplo "Explorar" mostra dados previstos para Contagem de usuários e Contagem de pedidos para seis meses entre 2020/01 e 2020/06.

Como os cálculos previstos dependem da ordem em que os dados são classificados, a classificação é desativada quando uma consulta prevista é executada.

Como editar uma previsão

Somente usuários com permissão podem editar previsões.

Para editar uma previsão:

  1. Se quiser, edite a consulta "Explorar" conforme necessário para adicionar ou remover diferentes campos de medidas ou períodos. Verifique se a Análise atende aos requisitos de previsão.
  2. Clique em Previsão na guia Explorar visualização para abrir o menu Previsão.
  3. Clique no menu suspenso Selecionar campo para fazer mudanças nos campos previstos. Para remover os campos previstos, faça o seguinte:
    • Clique nas caixas ao lado dos campos previstos no menu suspenso Selecionar campo expandido para removê-los da previsão.
    • Como alternativa, clique no x ao lado do nome do campo no menu Selecionar campo recolhido.
  4. Edite a duração especificada no futuro para previsão no campo Duração, conforme desejado.
  5. Também é possível clicar na chave Intervalo de previsão ou Sazonalidade para ativar uma das funções e personalizar as opções associadas.
    • Se Intervalo de previsão ou Sazonalidade já estiver ativado, as personalizações serão exibidas. Edite as configurações personalizadas como quiser ou selecione a chave para remover a função da previsão.
  6. Clique no x na guia do menu ao lado de Previsão para salvar suas configurações e sair do menu.
  7. Clique em Executar para executar de novo a consulta do Explore. É necessário executar a Análise novamente depois de fazer qualquer alteração na previsão.

Os resultados e a visualização da ferramenta Análises vão mostrar a previsão alterada. Como os cálculos previstos dependem da ordem em que os dados são classificados, a classificação é desativada quando uma consulta prevista é executada.

Como remover uma previsão

Somente usuários com permissão podem remover previsões.

Para remover uma previsão de uma Análise:

  1. Clique em Previsão na guia Explorar visualização para abrir o menu Previsão.
  2. Clique em Limpar na parte superior do menu Previsão.

A consulta será executada de novo de forma automática para produzir os resultados sem uma previsão aplicada.

Problemas comuns e informações importantes

Qual é a precisão?

A precisão de uma previsão depende dos dados de entrada. A implementação do AutoARIMA do Looker faz previsões incrivelmente precisas que combinam com sucesso muitas nuances dos dados de entrada. Há também casos em que o algoritmo se prende a padrões estranhos nos dados de entrada e os enfatiza demais na previsão. Verifique se foram fornecidos dados suficientes e se eles são os mais precisos possíveis para aproveitar ao máximo a previsão.

Não foi possível gerar uma previsão

Existem motivos legítimos para que uma previsão não possa ser gerada. Isso geralmente tem a ver com a quantidade de dados de entrada sendo muito pequena ou com o comprimento solicitado de previsão sendo muito grande. Não há limite específico para nenhum dos fatores nem proporção exata de dados de entrada necessários para uma determinada duração de previsão. Quanto mais dispersos e imprevisíveis forem os dados de entrada, mais difícil será para o algoritmo AutoARIMA encontrar uma correspondência. A maneira mais eficaz de gerar uma previsão é aumentar a quantidade de dados de entrada limpos, verificar se as configurações de sazonalidade estão corretas e reduzir a duração da previsão para apenas o necessário. Ao usar a opção Intervalo de previsão, pode ser útil escolher um intervalo menor.

A limpeza de dados de entrada pode envolver:

  • Cortar linhas à esquerda ou à direita para períodos que não contêm dados
  • Reduzir o ruído no conjunto de dados escolhendo uma dimensão de data maior.
  • Alteração dos outliers do filtro que não beneficiam a previsão.

O resultado da consulta retornou sem previsões, e recebi um erro obscuro

Isso não ocorrerá. Se acontecer, remova a medida ou as medidas da configuração de previsão e adicione-as novamente.

A previsão é exibida, mas obviamente está errada ou inútil

Nesse caso, a melhor coisa a fazer é adicionar mais dados de entrada, limpá-los o máximo possível e definir uma sazonalidade personalizada (se você tiver conhecimento de ciclos específicos nos dados) ou desativar completamente a opção Sazonalidade selecionando Nenhum.

A limpeza de dados de entrada pode envolver as seguintes tarefas:

  • Cortar linhas à esquerda ou à direita para períodos que não contêm dados
  • Reduzir o ruído no conjunto de dados escolhendo uma dimensão de data maior.
  • Alteração dos outliers do filtro que não beneficiam a previsão.