A previsão permite que os analistas adicionem rapidamente projeções de dados a consultas de exploração novas ou existentes para ajudar os utilizadores a prever e monitorizar pontos de dados específicos. Os resultados e as visualizações da análise detalhada previstos podem ser adicionados a painéis de controlo e guardados como Looks. Também é possível criar e ver resultados previstos e visualizações em conteúdo do Looker incorporado.
Pode prever dados se tiver autorização para criar previsões.
Como são criados e apresentados os resultados previstos
A funcionalidade Previsão usa os resultados dos dados numa tabela de dados de uma exploração para calcular pontos de dados futuros. Os cálculos de previsão incluem apenas os resultados apresentados de uma consulta de exploração. Os resultados que não são apresentados devido a limites de linhas não são incluídos. Para mais informações sobre o algoritmo usado para calcular as previsões, consulte a secção Algoritmo ARIMA nesta página.
Os resultados previstos são apresentados como uma continuação das visualizações de exploração existentes e estão sujeitos às definições de visualização configuradas. Os pontos de dados previstos distinguem-se dos pontos de dados não previstos das seguintes formas:
- Nos gráficos cartesianos suportados, os pontos de dados previstos são diferenciados dos pontos de dados não previstos através da renderização num tom mais claro ou com linhas tracejadas.
- Nos tipos de gráficos de texto e tabelas suportados, os pontos de dados previstos são apresentados em itálico e com um asterisco.
Os dados previstos também são identificados explicitamente na sugestão apresentada quando passa o cursor do rato sobre um ponto de dados previsto.
Apenas determinados tipos de visualizações suportam dados previstos, conforme abordado na secção seguinte.
Algoritmo ARIMA
A previsão tira partido de um algoritmo de média móvel integrada autorregressiva (ARIMA) para criar uma equação que corresponda melhor aos dados introduzidos numa previsão. Para encontrar a melhor correspondência para os dados, o Looker executa o modelo ARIMA com um conjunto de variáveis iniciais, cria uma lista de variações das variáveis iniciais e executa novamente o modelo ARIMA com essas variações. Se alguma das variações criar uma equação que se ajuste melhor aos dados de entrada, o Looker usa essas variações como as novas variáveis iniciais e cria variações adicionais que são, em seguida, avaliadas. O Looker continua a repetir este processo até identificar as melhores variáveis ou até esgotar todas as opções ou o tempo de computação atribuído.
Este processo pode ser considerado um algoritmo genético, em que os indivíduos ao longo de centenas de gerações criam entre 1 e 10 descendentes cada (variações de variáveis com base no progenitor) e os melhores descendentes sobrevivem para potencialmente criar gerações "melhores". A forma como o Looker usa muitas invocações de ARIMA numa abordagem de algoritmo genético chama-se AutoARIMA.
Para mais detalhes sobre o AutoARIMA, consulte a secção Dicas para usar auto_arima
do manual do utilizador do pmdarima. Embora não seja a biblioteca que o Looker usa para executar o AutoARIMA, o pmdarima oferece a melhor explicação do processo e das diferentes variáveis usadas.
Tipos de visualização suportados
Os seguintes tipos de visualização cartesiana suportam a renderização de dados previstos:
Os seguintes tipos de gráficos de texto e tabelas suportam a renderização de dados previstos:
Atualmente, outros tipos de visualização, incluindo visualizações personalizadas, não conseguem renderizar dados previstos.
Explore os requisitos de consulta para a previsão
Para criar uma previsão, uma exploração tem de cumprir os seguintes requisitos:
- Inclua exatamente uma dimensão, que tem de ser uma dimensão de período, com o preenchimento da dimensão ativado
- Inclua, pelo menos, uma medida ou uma medida personalizada (uma previsão pode incluir até cinco medidas ou medidas personalizadas)
- Ordene os resultados pela dimensão do período no formato descendente
Aspetos a considerar
Seguem-se critérios adicionais a ter em conta quando cria uma nova consulta de exploração para prever ou adicionar uma previsão a uma consulta de exploração existente:
- Tabelas dinâmicas: as previsões podem ser feitas em análises detalhadas dinâmicas, desde que os requisitos anteriores sejam cumpridos.
- Totais e subtotais das linhas: os totais e os subtotais das linhas não incluem valores previstos. Não recomendamos a utilização de subtotais nem totais das linhas com previsões, uma vez que podem produzir números inesperados.
- Filtros que incluem intervalos de tempo incompletos: para projeções precisas, a previsão só deve ser usada em conjunto com uma lógica de intervalo de tempo completa nos filtros de exploração quando as explorações incluem dados de intervalos de tempo incompletos. Por exemplo, se um utilizador prevê dados para um mês no futuro enquanto uma exploração é filtrada para apresentar dados dos últimos três meses, a exploração inclui os dados do mês atual incompleto. A previsão vai incorporar os dados incompletos no cálculo e apresentar resultados menos fiáveis. Em alternativa, use uma lógica de filtro como nos últimos 3 meses completos, em vez de nos últimos 3 meses, quando uma análise detalhada inclui prazos incompletos (por exemplo, quando uma análise detalhada inclui dados mensais incompletos para o mês atual) para garantir uma previsão mais precisa.
- Cálculos de tabelas: os cálculos de tabelas baseados numa ou mais medidas previstas são incluídos automaticamente numa previsão.
- Limites de linhas: explore como os limites de linhas se aplicam a toda a tabela de dados, incluindo as linhas previstas.
Para ver sugestões adicionais e recursos de resolução de problemas, consulte a secção Problemas comuns e aspetos a ter em conta nesta página.
Normalmente, um conjunto de dados com mais linhas, juntamente com um período de previsão mais curto, resulta numa previsão mais precisa.
Opções do menu Previsão
Pode usar as opções no menu Previsão, localizado no separador Visualização de Explorar, para personalizar os dados previstos. O menu Previsão inclui as seguintes opções:
Selecionar campo
O menu pendente Selecionar campo apresenta as métricas ou as métricas personalizadas na consulta de exploração que estão disponíveis para previsão. Pode selecionar até cinco medidas ou medidas personalizadas.
Comprimento
A opção Duração indica o número de linhas ou o período durante o qual prever os valores dos dados. O intervalo de duração da previsão é preenchido automaticamente com base na dimensão do período na consulta Explorar.
Normalmente, um conjunto de dados com mais linhas, juntamente com um período de previsão mais curto, resulta numa previsão mais precisa.
Intervalo de previsão
A opção Intervalo de previsão permite que os analistas expressem alguma incerteza nas previsões para ajudar na precisão. Quando ativada, a opção Intervalo de previsão permite-lhe selecionar os limites dos valores de dados previstos. Por exemplo, um intervalo de previsão de 95% indica uma probabilidade de 95% de que os valores de medição previstos se situem entre os limites superior e inferior da previsão.
Quanto maior for o intervalo de previsão selecionado, mais amplos são os limites superior e inferior.
Periodicidade
A opção Sazonalidade permite aos analistas ter em conta os ciclos conhecidos ou as tendências de dados repetitivas numa previsão e refere-se ao número de linhas de dados no ciclo. Por exemplo, se uma tabela de dados de exploração tiver uma linha por hora e os dados se repetirem diariamente, a sazonalidade é de 24.
Com as predefinições de previsão, o Looker faz referência à dimensão de data numa exploração e analisa vários ciclos de sazonalidade possíveis para encontrar a melhor correspondência para a previsão final. Por exemplo, quando usa dados por hora, o Looker pode experimentar ciclos de sazonalidade diários, semanais e de quatro semanas. O Looker também tem em conta a frequência da dimensão. Se uma dimensão representar um período de seis horas, o Looker sabe que só haverá quatro linhas num dia e ajusta a sazonalidade em conformidade.
Para exemplos de utilização comuns, a opção Automático deteta a melhor sazonalidade para um determinado conjunto de dados. Se tiver conhecimento de ciclos específicos no conjunto de dados, a opção Personalizado permite-lhe especificar o número de linhas que compõem um ciclo para medidas individuais numa previsão.
Quando prevê valores de dados para várias medidas, pode selecionar diferentes opções de sazonalidade, incluindo nenhuma, para cada medida individual. O menu pendente Sazonalidade tem várias opções:
A previsão aplica a opção de sazonalidade Automática às previsões por predefinição, mesmo quando a opção Sazonalidade não está ativada.
Automático
Com a opção de sazonalidade Automática, o Looker seleciona a melhor opção para os seus dados a partir de vários períodos de sazonalidade comuns, como diários, por hora, mensais, etc.
Personalizado
Quando sabe o número específico de linhas que compõem cada estação ou ciclo no seu conjunto de dados, pode especificar o número no campo Período. Pode ser útil selecionar Personalizado se souber que os seus dados se repetem num número específico de linhas.
Quando trabalha com dados que se repetem em ciclos mensais, mas são expressos com maior detalhe (por exemplo, usando um nível de detalhe de data ou semana numa análise detalhada), geralmente, um período de 4 semanas ou 30 dias adapta-se aos ciclos mensais.
Nenhum
A sazonalidade é um componente poderoso da previsão. No entanto, consoante os dados de entrada, nem sempre é recomendada. Se não existirem ciclos previsíveis nos dados, a ativação da periodicidade pode, ocasionalmente, originar previsões imprecisas quando o algoritmo tenta encontrar um padrão e, em seguida, tenta ajustar o padrão falso à previsão. Isto pode resultar numa previsão obscura.
Quando prevê valores de dados para várias métricas e quer ativar a Sazonalidade apenas para uma ou algumas, pode selecionar Nenhuma para todas as métricas para as quais não quer ativar a Sazonalidade.
Criar uma previsão
Apenas os utilizadores com autorização podem criar previsões.
Para criar uma previsão, siga estes passos:
Certifique-se de que a análise detalhada cumpre os requisitos de previsão. Por exemplo, um utilizador quer criar uma previsão para uma consulta de exploração com Mês de criação dos utilizadores, Número de utilizadores e Número de encomendas, que é ordenada por Mês de criação dos utilizadores por ordem descendente. Os resultados apresentam dados até dezembro de 2019.
Clique em Previsão no separador Visualização de explorar para abrir o menu Previsão.
Clique no menu pendente Selecionar campo para escolher até cinco medidas ou medidas personalizadas para previsão. O utilizador no exemplo seleciona Contagem de utilizadores e Contagem de encomendas.
Introduza a duração no futuro que quer prever no campo Duração. O utilizador no exemplo introduz 6 meses.
Opcionalmente, clique no switch Intervalo de previsão ou Sazonalidade para ativar qualquer uma das funções e personalizar as opções associadas. O utilizador no exemplo não ativa nenhuma das opções.
Clique no x no separador do menu junto a Previsão para guardar as definições e sair do menu.
Clique em Executar para executar novamente a consulta de explorar. (Tem de executar novamente a análise detalhada depois de fazer alterações à previsão.)
Os resultados da análise detalhada e a visualização vão agora apresentar valores previstos durante o período especificado. Com as opções especificadas, o exemplo de análise detalhada apresenta dados previstos para Número de utilizadores e Número de encomendas durante seis meses, de 01/2020 a 06/2020.
Uma vez que os cálculos previstos dependem da ordem em que os dados são ordenados, a ordenação é desativada assim que uma consulta prevista é executada.
Editar uma previsão
Apenas os utilizadores com autorização podem editar previsões.
Para editar uma previsão:
- Opcionalmente, edite a consulta Explorar conforme necessário para adicionar ou remover diferentes medidas ou campos de intervalo de tempo. Certifique-se de que a análise detalhada cumpre os requisitos de previsão.
- Clique em Previsão no separador Visualização de explorar para abrir o menu Previsão.
- Clique no menu pendente Selecionar campo para fazer alterações aos campos previstos. Para remover campos previstos:
- Clique nas caixas junto aos campos previstos no menu pendente expandido Selecionar campo para remover os campos da previsão.
- Em alternativa, clique no x junto ao nome do campo no menu Selecionar campo reduzido.
- Edite o período especificado no futuro para fazer a previsão no campo Duração, conforme desejado.
- Opcionalmente, clique no switch Intervalo de previsão ou Sazonalidade para ativar qualquer uma das funções e personalizar as opções associadas.
- Se Intervalo de previsão ou Sazonalidade já estiverem ativados, as personalizações são apresentadas. Edite as definições personalizadas conforme pretendido ou selecione o interruptor para remover a função da previsão.
- Clique no x no separador do menu junto a Previsão para guardar as definições e sair do menu.
- Clique em Executar para executar novamente a consulta de explorar. (Tem de executar novamente a análise detalhada depois de fazer alterações à previsão.)
Os resultados e a visualização da análise detalhada vão agora apresentar a previsão corrigida. Uma vez que os cálculos previstos dependem da ordem em que os dados são ordenados, a ordenação é desativada assim que uma consulta prevista é executada.
Remova uma previsão
Apenas os utilizadores com autorização podem remover previsões.
Para remover uma previsão de uma análise detalhada:
- Clique em Previsão no separador Visualização de explorar para abrir o menu Previsão.
- Clique em Limpar na parte superior do menu Previsão.
A consulta é executada novamente de forma automática para produzir os resultados sem uma previsão aplicada.
Problemas comuns e informações importantes
Qual é a precisão?
A precisão de uma previsão depende dos dados de entrada. A implementação do AutoARIMA do Looker pode fazer previsões incrivelmente precisas que combinam com êxito muitas nuances dos dados de entrada. Também existem casos em que o algoritmo fica preso em padrões estranhos nos dados de entrada e dá-lhes demasiada importância na previsão. Certifique-se de que são fornecidos dados suficientes e que os dados são o mais precisos possível para tirar o máximo partido das previsões.
Não foi possível gerar uma previsão
Existem motivos legítimos pelos quais não é possível gerar uma previsão. Normalmente, isto está relacionado com a quantidade de dados de entrada ser demasiado pequena ou o período de previsão pedido ser demasiado longo. Não existe um limite específico para nenhum dos fatores, e não existe uma relação exata de dados de entrada necessários para uma determinada duração da previsão. Quanto mais dispersos e imprevisíveis forem os dados de entrada, mais difícil será para o algoritmo AutoARIMA encontrar uma correspondência. A forma mais eficaz de gerar uma previsão é aumentar a quantidade de dados de entrada limpos, certificar-se de que as definições de sazonalidade estão corretas e reduzir a duração da previsão apenas ao necessário. Quando usar a opção Intervalo de previsão, pode ser útil escolher um intervalo inferior.
A limpeza dos dados de entrada pode envolver:
- Recortar linhas iniciais ou finais relativas a períodos que não contêm dados
- Reduzir o ruído no conjunto de dados escolhendo uma dimensão de data maior
- Alterar valores atípicos de filtros que não beneficiam a previsão
O resultado da consulta foi devolvido sem previsões e recebi um erro obscuro
Isto não deve ocorrer. Se ocorrer, experimente remover a métrica ou as métricas da configuração de previsão e, em seguida, adicioná-las novamente.
A previsão é apresentada, mas está obviamente errada ou não é útil
Neste caso, o melhor é adicionar mais dados de entrada, limpá-los o máximo possível e, potencialmente, definir uma sazonalidade personalizada (se tiver conhecimento de ciclos específicos nos dados) ou desativar completamente a opção Sazonalidade selecionando Nenhuma.
A limpeza dos dados de entrada pode envolver as seguintes tarefas:
- Recortar linhas iniciais ou finais relativas a períodos que não contêm dados
- Reduzir o ruído no conjunto de dados escolhendo uma dimensão de data maior
- Alterar valores atípicos de filtros que não beneficiam a previsão