A previsão de série temporal é um tipo de abordagem estatística ou de machine learning que tenta modelar dados históricos de séries temporais para fazer previsões sobre pontos de tempo futuros.
Em comparação com outros tipos de modelo, a previsão de série temporal tem desafios únicos, como a sazonalidade, efeitos de feriados, esparsidade de dados e tendências em constante mudança. Nas séries temporais, muitas técnicas de machine learning não funcionam bem devido à natureza sequencial e à correlação temporal associadas a elas. Por exemplo, a validação cruzada k-fold pode causar vazamento de dados; os modelos precisam ser treinados novamente para gerar novas previsões. O equilíbrio entre overfitting e underfitting é complicado, sem a possibilidade de randomizar a dimensão de tempo. Como potencialmente há milhões de itens a prever, a escalonabilidade de qualquer solução de previsão também precisa ser considerada. Além da previsão, algumas tarefas podem ser importantes para os negócios, como a detecção de anomalias, quantificação de incertezas e inferência causal. A previsão de série temporal não é apenas um aprendizado supervisionado sobre dados com carimbos de data/hora. Felizmente, o Google Cloud oferece uma ampla variedade de soluções para todas as necessidades comerciais.
Por exemplo, uma grande loja de varejo talvez precise prever milhões de itens para que o inventário esteja disponível quando a demanda for alta e não seja excessivo quando a demanda for baixa.
Previsão de demanda de varejo para produtos
Crie uma solução de ponta a ponta para prever a demanda de produtos de varejo. Use dados históricos de vendas para treinar um modelo de previsão de demanda usando o BigQuery ML e visualize os valores previstos em um painel do Looker Studio, para compartilhar com as partes interessadas. Explore como a previsão de demanda pode reduzir o desperdício de alimentos.
Previsão de preço de commodities
Modelos de série temporal são usados para prever os preços de commodities essenciais para seus negócios e processos de produção, além de informar seus modelos de fluxo de caixa e planos financeiros.
Previsão de fluxo de caixa
Os modelos de série temporal geralmente são combinados com os de regressão e classificação para produzir previsões de fluxo de caixa altamente precisas com base em séries temporais históricas de contabilidade, além de lançamentos de dados transacionais e obrigações contratuais. Nessas ocasiões, é possível usar o ARIMA_PLUS com o BigQuery ML e combiná-lo com modelos supervisionados no BigQuery ML, como o GLM, modelos de árvore otimizada e AutoML.
Detecção de anomalias com previsão de demanda
Em feriados, festas ou vendas de fim de ano, às vezes, existem picos esperados. Mas quando há picos (ou quedas) inesperados? Por exemplo, como identificar uma demanda excepcionalmente alta (ou baixa) que você não esperava? Saiba como usar a detecção de anomalias do BigQuery ML para encontrar um pico anormal no aluguel de bicicletas, coincidente com o dia em que o transporte público foi interrompido em Londres.
Controle de qualidade da fabricação e monitoramento de métricas
O monitoramento de métricas pode ter várias formas, desde sensores de IoT até a análise do rendimento da produção. No entanto, o elemento comum é prever a faixa típica dessas métricas para que você possa planejar com antecedência e responder o mais rápido possível com sistemas de monitoramento.
Outros casos de uso comuns para detecção de anomalias incluem as de preço causada por preços incorretos, detecção de anomalias em tempo real e controle de qualidade da fabricação.
Eficácia dos anúncios
Os anúncios foram eficazes para gerar um crescimento da empresa? A inferência causal pode ajudar você a analisar a significância estatística das campanhas publicitárias.
Impacto dos principais eventos na série temporal
Talvez você queira saber se o impacto de grandes eventos, como o Brexit, foi estatisticamente significativo em uma série temporal. Saiba mais sobre como fazer inferências causais para responder a "Como o Brexit impactou a relação das taxas de câmbio entre a libra esterlina e o dólar americano?"
Outras áreas para análise causal de inferências incluem promoções, eficácia de incentivos e estimativas de elasticidade de preços.
Com o BigQuery ML, é possível criar e executar modelos de machine learning no BigQuery usando consultas SQL padrão. Ele oferece suporte a um tipo de modelo denominado ARIMA_PLUS para realizar previsões de séries temporais e tarefas de detecção de anomalias.
Com o modelo ARIMA_PLUS no BigQuery ML, é possível fazer previsões de milhões de séries temporais em uma única consulta SQL, sem deixar seu data warehouse.
O ARIMA_PLUS é essencialmente um pipeline de modelagem de série temporal que inclui as seguintes funcionalidades:
Milhões de séries temporais podem ser previstas de uma só vez, com uma única consulta. Pipelines de modelagem diferentes serão executados em paralelo, se houver slots do BigQuery suficientes disponíveis.
Para começar a usar o ARIMA_PLUS do BigQuery, siga estes tutoriais:
Para informações detalhadas, consulte a Documentação pública do BigQuery ML.
A Previsão do Vertex oferece várias opções para usuários treinarem o modelo de previsão de série temporal:
Para informações detalhadas, consulte a documentação pública da Previsão do Vertex.
Para começar, veja o tutorial da Previsão do Vertex.
Se você quiser trazer seu próprio código personalizado, mas usar a infraestrutura de treinamento/disponibilização no Google Cloud, use o Vertex AI Workbench para executar qualquer código em Python, R, TensorFlow ou PyTorch.
TimesFM (Time Series Foundation Model) é um modelo pré-treinado de fundação de séries temporais desenvolvido pelo Google Research para a previsão de séries temporais univariadas.
A versão 1.0 contém um checkpoint com 200 milhões de parâmetros e o código de inferência. Ele é um modelo baseado em transformador e foi treinado apenas no decodificador em um conjunto de dados pré-treinado contendo mais de 100 bilhões de pontos de tempo do mundo real. Ele realiza previsões de séries temporais univariadas para durações de contexto de até 512 pontos de tempo e qualquer extensão de horizonte, com uma entrada opcional de indicador de frequência.
Caso de uso: previsão de série temporal. O modelo usa como contexto de entrada uma série temporal univariada e um parâmetro de frequência opcional. O modelo prevê a série temporal em um horizonte futuro de qualquer duração.
Com a previsão univariada, você prevê dados futuros usando apenas os dados históricos de uma série temporal. Por exemplo, para prever a temperatura em Nova York amanhã, a previsão univariada usará uma única variável, ou seja, as temperaturas históricas, para prever as futuras. Com a previsão univariada, também é possível descobrir padrões e tendências sazonais.
Com a previsão multivariável, você prevê dados futuros usando vários fatores. Por exemplo, para prever a temperatura em Nova York amanhã, além de usar as temperaturas históricas, também é possível usar a pressão barométrica, índice UV, porcentagem de cobertura de nuvens em áreas geográficas próximas, velocidade do vento e outras variáveis.
Saiba como o BigQuery ML pode ajudar sua organização. Veja a documentação.
Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos do programa Sempre gratuito.