Previsão em visualizações

Com a estimativa, os analistas podem adicionar rapidamente projeções de dados a consultas "Explorar" novas ou atuais para ajudar os usuários a prever e monitorar pontos de dados específicos. As visualizações e os resultados previstos do Explorar podem ser adicionados aos painéis e salvos como Aparências. As visualizações e os resultados previstos também podem ser criados e visualizados em conteúdo incorporado do Looker.

Você pode prever dados se tiver permissão para criar previsões.

Como os resultados previstos são criados e exibidos

O recurso Previsão usa os resultados dos dados em uma tabela de dados do Explorar para calcular pontos de dados futuros. Os cálculos de estimativa incluem apenas os resultados exibidos em uma consulta "Explorar". Os resultados que não são exibidos por causa de limites de linha não são incluídos. Para mais informações sobre o algoritmo usado para calcular as previsões, consulte a seção Algoritmo ARIMA nesta página.

Os resultados previstos são exibidos como uma continuação das visualizações do Explorar atuais e estão sujeitos às configurações de visualização configuradas. Os pontos de dados previstos são diferenciados dos pontos de dados não previstos das seguintes maneiras:

  1. Nos gráficos cartesianos compatíveis, os pontos de dados previstos são diferenciados dos pontos não previstos, renderizados em uma sombra mais clara ou em linhas tracejadas.
  2. Em tipos de gráfico de texto e de tabela compatíveis, os pontos de dados previstos estão em itálico e anexados com um asterisco.

Os dados previstos também são identificados explicitamente na dica, exibida quando você passa o cursor sobre um ponto de dados estimado:

Somente determinados tipos de visualização são compatíveis com dados previstos, conforme discutido na seção a seguir.

Algoritmo ARIMA

A previsão aproveita um algoritmo de média móvel integrada regressiva (ARIMA, na sigla em inglês) para criar uma equação que corresponda melhor aos dados inseridos em uma previsão. Para encontrar a melhor correspondência para os dados, o Looker executa o ARIMA com um conjunto de variáveis iniciais, cria uma lista de variações das variáveis iniciais e executa o ARIMA novamente com essas variações. Se alguma das variações criar uma equação que se encaixa melhor nos dados de entrada, o Looker usa essas variações como as novas variáveis iniciais e cria outras variações que são avaliadas. O Looker continua a repetir esse processo até que as melhores variáveis sejam identificadas ou até que todas as opções ou o tempo de computação alocado seja esgotado.

Esse processo pode ser considerado como um algoritmo genético, em que indivíduos de centenas de gerações criam de 1 a 10 filhotes cada (variações de variáveis com base no pai) e a melhor filha sobrevive a possíveis gerações "quot;melhor". A forma como o Looker usa muitas invocações de ARIMA em uma abordagem de algoritmo genético é chamada de AutoARIMA.

Para ver mais detalhes sobre o AutoARIMA, consulte a seção Dicas para usar o auto_arima do Guia do usuário do pmdarima. Embora não seja a biblioteca que o Looker usa para executar o AutoARIMA, o pmdarima fornece a melhor explicação do processo e as diferentes variáveis usadas.

Tipos de visualização compatíveis

Os tipos de visualização cartesiana a seguir são compatíveis com a renderização de dados previstos:

Os tipos de gráfico e texto a seguir são compatíveis com a renderização de dados previstos:

No momento, outros tipos de visualização, incluindo visualizações personalizadas, não podem renderizar dados previstos.

Explore os requisitos de consulta para previsão

Para criar uma previsão, um recurso Explorar precisa atender a estes requisitos:

  • Inclua exatamente uma dimensão, que precisa ser de dimensão de período, com preenchimento de dimensão ativado
  • Inclua pelo menos uma medida ou medida personalizada (a estimativa pode incluir até cinco medidas ou medidas personalizadas)
  • Ordenar os resultados pela dimensão de período em ordem decrescente

Considerações

Veja a seguir critérios adicionais ao criar uma nova consulta "Explorar" para previsão ou adicionar uma previsão a uma consulta de exploração existente:

  • Tabelas dinâmicas: as previsões podem ser realizadas em explorações dinamizadas, desde que os requisitos anteriores sejam atendidos.
  • Totais e subtotais de linhas: os totais e subtotais de linhas não incluem valores previstos. Não recomendamos o uso de subtotais ou totais de linhas com estimativa, porque isso pode produzir números inesperados.
  • Filtros que incluem períodos incompletos: para projeções precisas, a previsão só deve ser usada em conjunto com uma lógica de período completa em Filtros de exploração quando os explorados incluem dados de períodos incompletos. Por exemplo, se um usuário prevê dados de um mês no futuro enquanto uma exploração é filtrada para exibir dados dos últimos três meses, ela inclui os dados do mês incompleto atual. A previsão vai incorporar os dados incompletos ao cálculo e mostrar resultados mais não confiáveis. Em vez disso, use uma lógica de filtro como nos últimos três meses completos em vez de nos últimos três meses, quando uma exploração inclui períodos incompletos (por exemplo, quando ela inclui dados mensais incompletos para o mês atual) para garantir uma previsão mais precisa.
  • Cálculos de tabela: os cálculos da tabela baseados em uma ou mais medidas previstas serão incluídos automaticamente em uma previsão.
  • Limites de linhas: explore como os limites de linhas se aplicam à tabela de dados inteira, incluindo linhas previstas.

Veja mais dicas e recursos de solução de problemas na seção Problemas comuns e coisas que você precisa saber nesta página.

Normalmente, um conjunto de dados com mais linhas em conjunto com uma duração de previsão mais curta resultará em uma previsão mais precisa.

Opções do menu de previsão

Você pode usar as opções no menu Estimativa, localizado na guia Explorar visualização, para personalizar os dados previstos. O menu Estimativa inclui as seguintes opções:

Selecionar campo

O menu suspenso Selecionar campo mostra as medidas ou medidas personalizadas na consulta "Explorar" disponíveis para previsão. É possível selecionar até cinco medidas ou medidas personalizadas.

Duração

A opção Length (Duração) indica o número de linhas ou o período pelo qual os valores de dados serão previstos. O intervalo da duração da previsão é preenchido automaticamente com base na dimensão de período na consulta "Explorar".

Normalmente, um conjunto de dados com mais linhas, junto com uma duração de previsão mais curta, resulta em uma previsão mais precisa.

Intervalo de previsão

A configuração de intervalo de previsão mostra opções de intervalo de 99%, 98%, 95%, 90% e 80%

Com a opção Intervalo de previsão, os analistas podem expressar incertezas nas previsões para aumentar a precisão. Quando ativada, a opção Intervalo de previsão permite selecionar os limites dos valores de dados previstos. Por exemplo, um intervalo de previsão de 95% indica uma chance de 95% de que os valores de medição previstos fiquem entre os limites superior e inferior da previsão.

Quanto maior o intervalo de previsão selecionado, mais amplos são os limites superior e inferior.

Sazonalidade

Com a opção de Periodicidade, os analistas consideram os ciclos conhecidos ou as tendências de dados repetitivos em uma estimativa e se referem ao número de linhas de dados no ciclo. Por exemplo, se uma tabela de dados "Explorar" tiver uma linha por hora e os dados forem ciclos diariamente, a sazonalidade será 24.

Com as configurações de previsão padrão, o Looker faz referência à dimensão de data em uma exploração e verifica vários ciclos sazonais possíveis para encontrar a melhor correspondência para a previsão final. Por exemplo, ao usar dados por hora, o Looker pode testar ciclos de sazonalidade diários, semanais e quatro semanas. O Looker também considera a frequência da dimensão. Se uma dimensão representa um período de seis horas, o Looker sabe que haverá apenas quatro linhas em um dia e ajustará a sazonalidade de forma adequada.

Em casos de uso comuns, a opção Automática detecta a melhor sazonalidade para um determinado conjunto de dados. Se você estiver ciente de ciclos específicos no conjunto de dados, a opção Personalizado permitirá especificar o número de linhas que compõem um ciclo para medidas individuais em uma previsão.

Ao prever valores de dados para várias medidas, você pode selecionar diferentes opções de sazonalidade, incluindo nenhuma, para cada medida individual. O menu suspenso Sazonalidade tem várias opções:

Por padrão, a previsão aplica a opção de sazonalidade Automática às previsões, mesmo quando a opção Periodicidade não está ativada.

Automática

Com a opção de sazonalidade Automática, o Looker seleciona a melhor opção para seus dados de vários períodos sazonais comuns, como diário, por hora, mensal e assim por diante.

Personalizado

Quando você sabe o número específico de linhas que compõem cada temporada ou ciclo no conjunto de dados, é possível especificar o número no campo Período. Pode ser útil selecionar Personalizado se você sabe que os dados mudam em um número específico de linhas.

Quando você trabalha com dados que variam em meses, mas são expressos em maior granularidade (por exemplo, usando uma granularidade de data ou semana em uma exploração), geralmente um período de quatro semanas ou 30 dias se encaixa nos ciclos mensais.

Nenhum

A sazonalidade é um componente poderoso da estimativa, mas, dependendo dos dados de entrada, nem sempre é recomendada. Se não houver ciclos previsíveis nos dados, a ativação da sazonalidade pode levar a previsões imprecisas quando o algoritmo tenta encontrar um padrão e, em seguida, encaixar o padrão falso na previsão. Isso pode resultar em uma previsão obscura.

Quando você está prevendo valores de dados para várias medidas e quer ativar a Periodicidade apenas para uma ou algumas, selecione Nenhuma para todas as medidas em que você não ativa a Periodicidade.

Como criar uma previsão

Apenas usuários com permissão podem criar previsões.

Para criar uma previsão:

  1. Verifique se a ferramenta Explorar atende aos requisitos de previsão. Por exemplo, uma consulta de exploração com os recursos Mês de criação dos usuários, Contagem de usuários e Contagem de pedidos selecionados e classificados por Mês de criação de usuários em ordem decrescente:

  2. Selecione Previsão na guia "Explorar" Visualização para abrir o menu Previsão.

  3. Selecione o menu suspenso Selecionar campo para escolher até cinco medidas ou medidas personalizadas a serem previstas.

  4. Insira o período futuro no campo Duração.

  5. Selecione a chave Intervalo de previsão ou Sazonalidade para ativar cada função e personalizar as opções associadas.

  6. Selecione o x na guia do menu ao lado de Previsão para salvar suas configurações e sair do menu.

  7. Selecione Executar para executar novamente a consulta "Explorar". É necessário executar novamente o Explorar depois de fazer mudanças na previsão.

Os resultados e a visualização da guia "Explorar" agora exibirão valores previstos para o período especificado. O exemplo "Explorar" agora exibe dados previstos para Contagem de usuários e Contagem de pedidos por seis meses de 2020 a 1o de junho de 2020:

Como os cálculos previstos dependem da ordem em que os dados são classificados, a classificação é desativadaquando uma consulta prevista é executada.

Editar uma previsão

Apenas usuários com permissão podem editar as previsões.

Para editar uma previsão:

  1. Se preferir, edite a consulta "Explorar" conforme necessário para adicionar ou remover diferentes medidas ou campos de período. Verifique se a ferramenta Explorar atende aos requisitos de previsão.

  2. Selecione Previsão na guia "Explorar" Visualização para abrir o menu Previsão.

  3. Para fazer alterações nos campos previstos, selecione o menu suspenso Selecionar campo. Para remover os campos previstos, faça o seguinte:

    • Marque as caixas ao lado dos campos previstos no menu suspenso Selecionar campo para remover os campos da previsão.
    • Se preferir, selecione o x ao lado do nome do campo no menu Selecionar campo recolhido.

  4. Edite o duração especificada no futuro para previsões no campo Duração, como desejado.

  5. Selecione a chave Intervalo de previsão ou Sazonalidade para ativar cada função e personalizar as opções associadas.

    • Se o Intervalo de previsão ou a Periodicidade já estiver ativado, as personalizações serão exibidas. Edite as configurações personalizadas conforme desejado ou selecione a chave para remover a função da previsão.
  6. Selecione o x na guia do menu ao lado de Previsão para salvar suas configurações e sair do menu.

  7. Selecione Executar para executar novamente a consulta "Explorar". É necessário executar novamente o Explorar depois de fazer qualquer mudança na previsão.

Os resultados e a visualização da guia "Explorar" agora exibirão a previsão alterada. Como os cálculos previstos dependem da ordem em que os dados são classificados, a classificação é desativadaquando uma consulta prevista é executada.

Remover uma previsão

Apenas usuários com permissão podem remover previsões.

Para remover uma previsão de uma exploração, faça o seguinte:

  1. Selecione Previsão na guia "Explorar" Visualização para abrir o menu Previsão.
  2. Selecione Limpar.

A consulta vai ser repetida automaticamente para produzir os resultados sem que uma previsão seja aplicada.

Problemas comuns e coisas que você precisa saber

Ele é preciso?

A precisão de uma previsão depende dos dados de entrada. A implementação do AutoARIMA do Looker pode fazer previsões incrivelmente precisas que combinam várias nuances dos dados de entrada. Também há casos em que o algoritmo é capturado em padrões ímpares nos dados de entrada e os enfatiza demais na previsão. Verifique se dados suficientes foram fornecidos e se os dados são os mais precisos possíveis para aproveitar a previsão ao máximo.

Não foi possível gerar uma previsão

Há razões legítimas para a geração de uma previsão. Eles geralmente têm a ver com a quantidade de dados de entrada muito baixa ou o comprimento solicitado da previsão é muito grande. Não há limite específico para nenhum dos fatores e não há uma proporção exata dos dados de entrada necessários para uma determinada duração da previsão. Quanto mais dispersos e imprevisíveis forem os dados de entrada, mais difícil vai ser para o algoritmo AutoARIMA encontrar uma correspondência. A maneira mais eficaz de gerar uma previsão é aumentar a quantidade de dados de entrada limpos, garantir que as configurações de sazonalidade estejam corretas e reduzir a duração da previsão apenas ao que for necessário. Ao usar a opção Intervalo de previsão, pode ser útil escolher um intervalo mais baixo.

A limpeza de dados de entrada pode envolver:

  • Corte linhas iniciais ou finais referentes a períodos que não contêm dados
  • Reduzir o ruído no conjunto de dados escolhendo uma dimensão de data maior
  • Mudança de outliers do filtro que não beneficiam a previsão

O resultado da consulta foi retornado sem estimativas, e recebi um erro obscuro

Isso não ocorre. Em caso afirmativo, tente remover as medidas da configuração da previsão e adicioná-las novamente.

A estimativa é exibida, mas claramente está errada ou não é útil

Nesse caso, a melhor opção é adicionar mais dados de entrada, fazer a limpeza o máximo possível e, possivelmente, definir uma sazonalidade personalizada (se você souber de ciclos específicos nos dados) ou desativar a opção Periodicidade selecionando Nenhuma.

A limpeza de dados de entrada pode envolver as seguintes tarefas:

  • Corte linhas iniciais ou finais referentes a períodos que não contêm dados
  • Reduzir o ruído no conjunto de dados escolhendo uma dimensão de data maior
  • Mudança de outliers do filtro que não beneficiam a previsão