Cette page a été traduite par l'API Cloud Translation.

Prévoir une seule série temporelle avec un modèle univarié ARIMA_PLUS

Ce tutoriel vous explique comment utiliser un modèle de série temporelle univariée ARIMA_PLUS pour prévoir la valeur future d'une colonne donnée en fonction des valeurs historiques de cette colonne.

Ce tutoriel prévoit une seule série temporelle. Les valeurs prévues sont calculées une fois pour chaque point temporel des données d'entrée.

Ce tutoriel utilise les données de l'exemple de table publique bigquery-public-data.google_analytics_sample.ga_sessions. Ce tableau contient des données d'e-commerce obscurcies provenant du Google Merchandise Store.

Objectifs

Ce tutoriel vous guide à travers les tâches suivantes :

Créer un modèle de série temporelle pour prévoir le trafic du site à l'aide de l'instruction CREATE MODEL.
Évaluation des informations de moyenne mobile intégrée autorégressive (ARIMA) dans le modèle à l'aide de la fonction ML.ARIMA_EVALUATE.
Inspecter les coefficients du modèle à l'aide de la fonction ML.ARIMA_COEFFICIENTS.
Récupérer les informations sur le trafic du site prévues par le modèle à l'aide de la fonction ML.FORECAST.
Récupérer les composants des séries temporelles, tels que la saisonnalité et la tendance, à l'aide de la fonction ML.EXPLAIN_FORECAST. Vous pouvez inspecter ces composants de série temporelle pour expliquer les valeurs prévues.

Coûts

Ce tutoriel utilise des composants facturables de Google Cloud, y compris :

BigQuery
BigQuery ML

Pour plus d'informations sur les coûts de BigQuery, consultez la page Tarifs de BigQuery.

Pour en savoir plus sur les coûts associés à BigQuery ML, consultez la page Tarifs de BigQuery ML.

Avant de commencer

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

BigQuery est automatiquement activé dans les nouveaux projets. Pour activer BigQuery dans un projet préexistant, accédez à
Enable the BigQuery API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.
Enable the API

Autorisations requises

Pour créer l'ensemble de données, vous devez disposer de l'autorisation IAM bigquery.datasets.create.
Pour créer le modèle, vous avez besoin des autorisations suivantes :
- bigquery.jobs.create
- bigquery.models.create
- bigquery.models.getData
- bigquery.models.updateData
Pour exécuter une inférence, vous devez disposer des autorisations suivantes :
- bigquery.models.getData
- bigquery.jobs.create

Pour plus d'informations sur les rôles et les autorisations IAM dans BigQuery, consultez la page Présentation d'IAM.

Créer un ensemble de données

Créez un ensemble de données BigQuery pour stocker votre modèle de ML.

Console

Dans la console Google Cloud , accédez à la page BigQuery.

Accéder à la page "BigQuery"
Dans le volet Explorateur, cliquez sur le nom de votre projet.
Cliquez sur Afficher les actions > Créer un ensemble de données.
Sur la page Créer un ensemble de données, procédez comme suit :
- Dans le champ ID de l'ensemble de données, saisissez bqml_tutorial.
- Pour Type d'emplacement, sélectionnez Multirégional, puis sélectionnez US (plusieurs régions aux États-Unis).
- Conservez les autres paramètres par défaut, puis cliquez sur Créer un ensemble de données.

bq

Pour créer un ensemble de données, exécutez la commande bq mk en spécifiant l'option --location. Pour obtenir la liste complète des paramètres possibles, consultez la documentation de référence sur la commande bq mk --dataset.

Créez un ensemble de données nommé bqml_tutorial avec l'emplacement des données défini sur US et une description de BigQuery ML tutorial dataset :
```
bq --location=US mk -d \
 --description "BigQuery ML tutorial dataset." \
 bqml_tutorial
```
Au lieu d'utiliser l'option --dataset, la commande utilise le raccourci -d. Si vous omettez -d et --dataset, la commande crée un ensemble de données par défaut.
Vérifiez que l'ensemble de données a été créé :
```
bq ls
```

API

Appelez la méthode datasets.insert avec une ressource d'ensemble de données définie.

{
  "datasetReference": {
     "datasetId": "bqml_tutorial"
  }
}

BigQuery DataFrames

Avant d'essayer cet exemple, suivez les instructions de configuration pour BigQuery DataFrames du guide de démarrage rapide de BigQuery DataFrames. Pour en savoir plus, consultez la documentation de référence sur BigQuery DataFrames.

Pour vous authentifier auprès de BigQuery, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer les ADC pour un environnement de développement local.

import google.cloud.bigquery

bqclient = google.cloud.bigquery.Client()
bqclient.create_dataset("bqml_tutorial", exists_ok=True)

Visualiser les données d'entrée

Avant de créer le modèle, vous pouvez éventuellement visualiser vos données de série temporelle d'entrée pour avoir une idée de la distribution. Pour ce faire, utilisez Looker Studio.

Pour visualiser les données de série temporelle, procédez comme suit :

SQL

Dans la requête GoogleSQL suivante, l'instruction SELECT analyse la colonne date de la table d'entrée avec le type TIMESTAMP et la renomme parsed_date. Elle utilise également les clauses SUM(...) et GROUP BY date pour créer une valeur totals.visits quotidienne.

Dans la console Google Cloud , accédez à la page BigQuery.

Accéder à BigQuery
Dans l'éditeur de requête, collez la requête suivante, puis cliquez sur Exécuter :
```
SELECT
PARSE_TIMESTAMP("%Y%m%d", date) AS parsed_date,
SUM(totals.visits) AS total_visits
FROM
`bigquery-public-data.google_analytics_sample.ga_sessions_*`
GROUP BY date;
```
1. Une fois la requête terminée, cliquez sur Explorer les données > Explorer avec Looker Studio. Looker Studio s'ouvre dans un nouvel onglet. Procédez comme suit dans le nouvel onglet.
2. Dans Looker Studio, cliquez sur Insérer > Graphique de séries temporelles.
3. Dans le volet Graphique, sélectionnez l'onglet Configuration.
4. Dans la section Métrique, ajoutez le champ total_visits, puis supprimez la métrique par défaut Nombre d'enregistrements. Le graphique obtenu ressemble à ceci :
  
  Le graphique montre que la série temporelle d'entrée présente une tendance saisonnière hebdomadaire.
  
  Remarque : Pour en savoir plus sur l'assistance Looker Studio, consultez Intégrations de l'assistance Looker avec Google Cloud.

BigQuery DataFrames

import bigframes.pandas as bpd

# Start by loading the historical data from BigQuerythat you want to analyze and forecast.
# This clause indicates that you are querying the ga_sessions_* tables in the google_analytics_sample dataset.
# Read and visualize the time series you want to forecast.
df = bpd.read_gbq("bigquery-public-data.google_analytics_sample.ga_sessions_*")
parsed_date = bpd.to_datetime(df.date, format="%Y%m%d", utc=True)
parsed_date.name = "parsed_date"
visits = df["totals"].struct.field("visits")
visits.name = "total_visits"
total_visits = visits.groupby(parsed_date).sum()

# Expected output: total_visits.head()
# parsed_date
# 2016-08-01 00:00:00+00:00    1711
# 2016-08-02 00:00:00+00:00    2140
# 2016-08-03 00:00:00+00:00    2890
# 2016-08-04 00:00:00+00:00    3161
# 2016-08-05 00:00:00+00:00    2702
# Name: total_visits, dtype: Int64

total_visits.plot.line()

Le résultat ressemble à ce qui suit : Result_visualization

Créer le modèle de série temporelle

Créez un modèle de série temporelle pour prévoir le nombre total de visites du site, représenté par la colonne totals.visits, et entraînez-le sur les données Google Analytics 360.

SQL

Dans la requête suivante, la clause OPTIONS(model_type='ARIMA_PLUS', time_series_timestamp_col='date', ...) indique que vous créez un modèle de série temporelle basé sur ARIMA. L'option auto_arima de l'instruction CREATE MODEL est définie par défaut sur TRUE. L'algorithme auto.ARIMA ajuste donc automatiquement les hyperparamètres du modèle. L'algorithme s'adapte à des dizaines de modèles candidats et choisit le meilleur d'entre eux, qui présente l'AIC (Akaike information criterion) le plus faible. L'option data_frequency des instructions CREATE MODEL est définie par défaut sur AUTO_FREQUENCY. Le processus d'entraînement déduit donc automatiquement la fréquence des données de la série temporelle d'entrée. L'option decompose_time_series de l'instruction CREATE MODEL est définie par défaut sur TRUE. Ainsi, des informations sur les données de série temporelle sont renvoyées lorsque vous évaluez le modèle à l'étape suivante.

Pour créer le modèle, procédez comme suit :

Dans la console Google Cloud , accédez à la page BigQuery.

Accéder à BigQuery

Dans l'éditeur de requête, collez la requête suivante, puis cliquez sur Exécuter :

CREATE OR REPLACE MODEL `bqml_tutorial.ga_arima_model`
OPTIONS
(model_type = 'ARIMA_PLUS',
 time_series_timestamp_col = 'parsed_date',
 time_series_data_col = 'total_visits',
 auto_arima = TRUE,
 data_frequency = 'AUTO_FREQUENCY',
 decompose_time_series = TRUE
) AS
SELECT
PARSE_TIMESTAMP("%Y%m%d", date) AS parsed_date,
SUM(totals.visits) AS total_visits
FROM
`bigquery-public-data.google_analytics_sample.ga_sessions_*`
GROUP BY date;

L'exécution de la requête prend environ quatre secondes, après quoi le modèle ga_arima_model apparaît dans le volet Explorateur. Étant donné que la requête utilise une instruction CREATE MODEL pour créer un modèle, les résultats de la requête ne sont pas affichés.

BigQuery DataFrames

from bigframes.ml import forecasting
import bigframes.pandas as bpd

# Create a time series model to forecast total site visits:
# The auto_arima option defaults to True, so the auto.ARIMA algorithm automatically
# tunes the hyperparameters in the model.
# The data_frequency option defaults to 'auto_frequency so the training
# process automatically infers the data frequency of the input time series.
# The decompose_time_series option defaults to True, so that information about
# the time series data is returned when you evaluate the model in the next step.
model = forecasting.ARIMAPlus()
model.auto_arima = True
model.data_frequency = "auto_frequency"
model.decompose_time_series = True

# Use the data loaded in the previous step to fit the model
training_data = total_visits.to_frame().reset_index(drop=False)

X = training_data[["parsed_date"]]
y = training_data[["total_visits"]]

model.fit(X, y)

Évaluer les modèles candidats

SQL

Évaluez les modèles de séries temporelles à l'aide de la fonction ML.ARIMA_EVALUATE. La fonction ML.ARIMA_EVALUATE affiche les métriques d'évaluation de tous les modèles candidats évalués lors du processus de réglage automatique des hyperparamètres.

Pour évaluer le modèle, procédez comme suit :

Dans la console Google Cloud , accédez à la page BigQuery.

Accéder à BigQuery
Dans l'éditeur de requête, collez la requête suivante, puis cliquez sur Exécuter :
```
SELECT
*
FROM
ML.ARIMA_EVALUATE(MODEL `bqml_tutorial.ga_arima_model`);
```
Le résultat doit ressembler à ce qui suit :

BigQuery DataFrames

# Evaluate the time series models by using the summary() function. The summary()
# function shows you the evaluation metrics of all the candidate models evaluated
# during the process of automatic hyperparameter tuning.
summary = model.summary(
    show_all_candidate_models=True,
)
print(summary.peek())

# Expected output:
# row   non_seasonal_p	non_seasonal_d	non_seasonal_q	has_drift	log_likelihood	AIC	variance	seasonal_periods	has_holiday_effect	has_spikes_and_dips	has_step_changes	error_message
#  0	      0	              1	               3	      True	     -2464.255656	4938.511313	     42772.506055	        ['WEEKLY']	            False	        False	            True
#  1	      2	              1	               0	      False	     -2473.141651	4952.283303	     44942.416463	        ['WEEKLY']	            False	        False	            True
#  2	      1	              1	               0 	      False	     -2479.880885	4963.76177	     46642.953433	        ['WEEKLY']	            False	        False	            True
#  3	      0	              1	               1	      False	     -2470.632377	4945.264753	     44319.379307	        ['WEEKLY']	            False	        False	            True
#  4	      2	              1	               1	      True	     -2463.671247	4937.342493	     42633.299513	        ['WEEKLY']	            False	        False	            True

Les colonnes de sortie non_seasonal_p, non_seasonal_d, non_seasonal_q et has_drift définissent un modèle ARIMA dans le pipeline d'entraînement. Les colonnes de sortie log_likelihood, AIC et variance sont pertinentes pour le processus d'ajustement du modèle ARIMA.

L'algorithme auto.ARIMA utilise le test KPSS pour déterminer la meilleure valeur pour non_seasonal_d, qui dans ce cas est 1. Lorsque non_seasonal_d est 1, l'algorithme auto.ARIMA entraîne 42 modèles ARIMA candidats différents en parallèle. Dans cet exemple, les 42 modèles candidats sont valides. La sortie contient donc 42 lignes, une pour chaque modèle ARIMA candidat. Si certains modèles ne sont pas valides, ils sont exclus de la sortie. Ces modèles candidats sont renvoyés par ordre croissant de l'AIC. Le modèle de la première ligne présente l'AIC le plus bas, et il est considéré comme le meilleur modèle. Le meilleur modèle est enregistré en tant que modèle final. Il est utilisé lorsque vous appelez des fonctions telles que ML.FORECAST sur le modèle.

La colonne seasonal_periods contient des informations sur la tendance saisonnière identifiée dans les données de série temporelle. Il n'a rien à voir avec la modélisation ARIMA. Par conséquent, il présente la même valeur sur toutes les lignes de sortie. Il indique un schéma hebdomadaire, ce qui correspond aux résultats que vous avez obtenus si vous avez choisi de visualiser les données d'entrée.

Les colonnes has_holiday_effect, has_spikes_and_dips et has_step_changes ne sont renseignées que lorsque decompose_time_series=TRUE. Ces colonnes reflètent également des informations sur les données de série temporelle d'entrée et ne sont pas liées à la modélisation ARIMA. Ces colonnes ont également les mêmes valeurs dans toutes les lignes de sortie.

La colonne error_message indique les erreurs survenues lors du processus d'ajustement auto.ARIMA. Les erreurs peuvent s'expliquer par le fait que les colonnes non_seasonal_p, non_seasonal_d, non_seasonal_q et has_drift sélectionnées ne peuvent pas stabiliser la série temporelle. Pour récupérer le message d'erreur de tous les modèles candidats, définissez l'option show_all_candidate_models sur TRUE lorsque vous créez le modèle.

Pour en savoir plus sur les colonnes de sortie, consultez la fonction ML.ARIMA_EVALUATE.

Inspecter les coefficients du modèle

SQL

Inspectez les coefficients du modèle de série temporelle à l'aide de la fonction ML.ARIMA_COEFFICIENTS.

Pour récupérer les coefficients du modèle, procédez comme suit :

Dans la console Google Cloud , accédez à la page BigQuery.

Accéder à BigQuery
Dans l'éditeur de requête, collez la requête suivante, puis cliquez sur Exécuter :
```
SELECT
*
FROM
ML.ARIMA_COEFFICIENTS(MODEL `bqml_tutorial.ga_arima_model`);
```

La colonne de sortie ar_coefficients affiche les coefficients de modèle de la partie autorégressive (AR) du modèle ARIMA. De même, la colonne de sortie ma_coefficients affiche les coefficients de modèle de la partie moyenne mobile (MA) du modèle ARIMA. Ces deux colonnes contiennent des valeurs de tableau, dont la longueur est respectivement égale à non_seasonal_p et non_seasonal_q. Dans la sortie de la fonction ML.ARIMA_EVALUATE, vous avez vu que le meilleur modèle avait une valeur non_seasonal_p de 2 et une valeur non_seasonal_q de 3. Par conséquent, dans la sortie ML.ARIMA_COEFFICIENTS, la valeur ar_coefficients est un tableau à deux éléments et la valeur ma_coefficients est un tableau à trois éléments. La valeur intercept_or_drift est le terme constant dans le modèle ARIMA.

Pour en savoir plus sur les colonnes de sortie, consultez la fonction ML.ARIMA_COEFFICIENTS.

BigQuery DataFrames

Inspectez les coefficients du modèle de série temporelle à l'aide de la fonction coef_.

coef = model.coef_
print(coef.peek())

# Expected output:
#       ar_coefficients   ma_coefficients   intercept_or_drift
#   0	 [0.40944762]	   [-0.81168198]	      0.0

Utiliser le modèle pour prévoir des données

SQL

Prévoyez les valeurs futures des séries temporelles à l'aide de la fonction ML.FORECAST.

Dans la requête GoogleSQL suivante, la clause STRUCT(30 AS horizon, 0.8 AS confidence_level) indique que la requête prévoit 30 points temporels futurs et génère un intervalle de prédiction avec un niveau de confiance de 80 %.

Pour prévoir des données avec le modèle, procédez comme suit :

Dans la console Google Cloud , accédez à la page BigQuery.

Accéder à BigQuery

Dans l'éditeur de requête, collez la requête suivante, puis cliquez sur Exécuter :

SELECT
*
FROM
ML.FORECAST(MODEL `bqml_tutorial.ga_arima_model`,
          STRUCT(30 AS horizon, 0.8 AS confidence_level));

Le résultat doit ressembler à ce qui suit :

Sortie de ML.FORECAST.

BigQuery DataFrames

Prévoyez les valeurs futures des séries temporelles à l'aide de la fonction predict.

prediction = model.predict(horizon=30, confidence_level=0.8)

print(prediction.peek())
# Expected output:
#           forecast_timestamp	   forecast_value	standard_error	confidence_level	prediction_interval_lower_bound	    prediction_interval_upper_bound	    confidence_interval_lower_bound	    confidence_interval_upper_bound
# 11	2017-08-13 00:00:00+00:00	1845.439732	      328.060405	      0.8	                 1424.772257	                      2266.107208	                     1424.772257	                     2266.107208
# 29	2017-08-31 00:00:00+00:00	2615.993932	      431.286628	      0.8	                 2062.960849	                      3169.027015	                     2062.960849	                     3169.027015
# 7	    2017-08-09 00:00:00+00:00	2639.285993	      300.301186	      0.8	                 2254.213792	                      3024.358193	                     2254.213792	                     3024.358193
# 25	2017-08-27 00:00:00+00:00	1853.735689	      410.596551	      0.8	                 1327.233216	                      2380.238162	                     1327.233216	                     2380.238162
# 1	    2017-08-03 00:00:00+00:00	2621.33159	      241.093355	      0.8	                 2312.180802	                      2930.482379	                     2312.180802	                     2930.482379

Les lignes de sortie sont dans l'ordre chronologique de la valeur de la colonne forecast_timestamp. Dans les prévisions de séries temporelles, l'intervalle de prédiction, tel qu'il est représenté par les valeurs des colonnes prediction_interval_lower_bound et prediction_interval_upper_bound, est aussi important que la valeur de la colonne forecast_value. La valeur forecast_value est le point central de l'intervalle de prédiction. L'intervalle de prédiction dépend des valeurs des colonnes standard_error et confidence_level.

Pour en savoir plus sur les colonnes de sortie, consultez la fonction ML.FORECAST.

Expliquer les résultats des prévisions

SQL

Vous pouvez obtenir des métriques d'explicabilité en plus des données de prévision à l'aide de la fonction ML.EXPLAIN_FORECAST. La fonction ML.EXPLAIN_FORECAST prédit les valeurs futures des séries temporelles et renvoie également tous les composants distincts de la série temporelle.

Comme la fonction ML.FORECAST, la clause STRUCT(30 AS horizon, 0.8 AS confidence_level) utilisée dans la fonction ML.EXPLAIN_FORECAST indique que la requête prévoit 30 points temporels futurs et génère un intervalle de prédiction avec un indice de confiance de 80 %.

Pour expliquer les résultats du modèle, procédez comme suit :

Dans la console Google Cloud , accédez à la page BigQuery.

Accéder à BigQuery
Dans l'éditeur de requête, collez la requête suivante, puis cliquez sur Exécuter :
```
SELECT
*
FROM
ML.EXPLAIN_FORECAST(MODEL `bqml_tutorial.ga_arima_model`,
 STRUCT(30 AS horizon, 0.8 AS confidence_level));
```
Le résultat doit ressembler à ce qui suit :

Les lignes de sortie sont triées par ordre chronologique en fonction de la valeur de la colonne time_series_timestamp.

Pour en savoir plus sur les colonnes de sortie, consultez la fonction ML.EXPLAIN_FORECAST.

BigQuery DataFrames

Vous pouvez obtenir des métriques d'explicabilité en plus des données de prévision à l'aide de la fonction predict_explain. La fonction predict_explain prévoit les valeurs futures des séries temporelles et renvoie également tous les composants distincts des séries temporelles.

Comme la fonction predict, la clause horizon=30, confidence_level=0.8 utilisée dans la fonction predict_explain indique que la requête prévoit 30 points temporels futurs et génère un intervalle de prédiction avec un indice de confiance de 80 %.

ex_pred = model.predict_explain(horizon=30, confidence_level=0.8)

print(ex_pred.head(4))
# Expected output:
#       time_series_timestamp	  time_series_type	    time_series_data	time_series_adjusted_data	 standard_error	   confidence_level	   prediction_interval_lower_bound	   prediction_interval_upper_bound	  trend	   seasonal_period_yearly	  seasonal_period_quarterly	    seasonal_period_monthly	   seasonal_period_weekly	  seasonal_period_daily	    holiday_effect	   spikes_and_dips	   step_changes	   residual
# 0	  2016-08-01 00:00:00+00:00	      history	             1711.0	               505.716474	           206.939556	         <NA>	                    <NA>	                            <NA>	               0.0	           <NA>	                        <NA>	                     <NA>	                 169.611938	                  <NA>	                <NA>	            <NA>	       1205.283526	   336.104536
# 1	  2016-08-02 00:00:00+00:00	      history	             2140.0	               623.137701	           206.939556	         <NA>	                    <NA>	                            <NA>	            336.104428	       <NA>	                        <NA>	                     <NA>	                 287.033273	                  <NA>	                <NA>	            <NA>	       1205.283526	   311.578773
# 2	  2016-08-03 00:00:00+00:00	      history	             2890.0	               1008.655091	           206.939556	         <NA>	                    <NA>	                            <NA>	            563.514213	       <NA>	                        <NA>	                     <NA>	                 445.140878	                  <NA>	                <NA>	            <NA>	       1205.283526	   676.061383
# 3	  2016-08-04 00:00:00+00:00	      history	             3161.0	               1389.40959	           206.939556	         <NA>	                    <NA>	                            <NA>	            986.317236	       <NA>	                        <NA>	                     <NA>	                 403.092354	                  <NA>	                <NA>	            <NA>	       1205.283526	   566.306884
# 4	  2016-08-05 00:00:00+00:00	      history	             2702.0	               1394.395741	           206.939556	         <NA>	                    <NA>	                            <NA>	            1248.707386	       <NA>	                        <NA>	                     <NA>	                 145.688355	                  <NA>	                <NA>	            <NA>	       1205.283526	   102.320733
# 5	  2016-08-06 00:00:00+00:00	      history	             1663.0	               437.09243	           206.939556	         <NA>	                    <NA>	                            <NA>	            1188.59004	       <NA>	                        <NA>	                     <NA>	                 -751.49761	                  <NA>	                <NA>	            <NA>	       1205.283526	    20.624044

Si vous souhaitez visualiser les résultats, vous pouvez utiliser Looker Studio, comme décrit dans la section Visualiser les données d'entrée, pour créer un graphique en utilisant les colonnes suivantes comme métriques :

time_series_data
prediction_interval_lower_bound
prediction_interval_upper_bound
trend
seasonal_period_weekly
step_changes

Effectuer un nettoyage

Pour éviter que les ressources utilisées lors de ce tutoriel soient facturées sur votre compte Google Cloud, supprimez le projet contenant les ressources, ou conservez le projet et supprimez les ressources individuelles.

Supprimez le projet que vous avez créé.
Ou conservez le projet et supprimez l'ensemble de données.

Supprimer l'ensemble de données

Si vous supprimez votre projet, tous les ensembles de données et toutes les tables qui lui sont associés sont également supprimés. Si vous préférez réutiliser le projet, vous pouvez supprimer l'ensemble de données que vous avez créé dans ce tutoriel :

Si nécessaire, ouvrez la page BigQuery dans la consoleGoogle Cloud .

Accéder à la page "BigQuery"
Dans le panneau de navigation, cliquez sur l'ensemble de données bqml_tutorial que vous avez créé.
Cliquez sur Delete dataset (Supprimer l'ensemble de données) dans la partie droite de la fenêtre. Cette action supprime l'ensemble de données, la table et toutes les données.
Dans la boîte de dialogue Supprimer l'ensemble de données, confirmez la commande de suppression en saisissant le nom de votre ensemble de données (bqml_tutorial), puis cliquez sur Supprimer.

Supprimer votre projet

Pour supprimer le projet :

Attention : La suppression d'un projet aura les effets suivants :

Tout le contenu du projet est supprimé. Si vous avez utilisé un projet existant pour les tâches décrites dans ce document et que vous le supprimez, vous supprimerez également tout autre travail effectué dans le projet.
Les ID de projets personnalisés sont perdus. Lorsque vous avez créé ce projet, vous avez peut-être créé un ID de projet personnalisé que vous souhaitez utiliser à l'avenir. Pour conserver les URL qui utilisent l'ID de projet, telle qu'une URL appspot.com, supprimez les ressources sélectionnées dans le projet au lieu de supprimer l'ensemble du projet.

Si vous envisagez d'explorer plusieurs architectures, tutoriels et guides de démarrage rapide, réutiliser des projets peut vous aider à ne pas dépasser les limites de quotas des projets.

In the Google Cloud console, go to the Manage resources page.
Go to Manage resources
In the project list, select the project that you want to delete, and then click Delete.
In the dialog, type the project ID, and then click Shut down to delete the project.

Étapes suivantes

Découvrez comment prévoir une seule série temporelle avec un modèle multivarié.
Découvrez comment prévoir plusieurs séries temporelles avec un modèle univarié.
Découvrez comment mettre à l'échelle un modèle univarié lorsque vous prévoyez plusieurs séries temporelles sur plusieurs lignes.
Découvrez comment prévoir hiérarchiquement plusieurs séries temporelles avec un modèle univarié.
Pour obtenir plus d'informations sur BigQuery ML, consultez la présentation de l'IA et du ML dans BigQuery.

Prévoir une seule série temporelle avec un modèle univarié ARIMA_PLUS Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Objectifs

Coûts

Avant de commencer

Autorisations requises

Créer un ensemble de données

Console

bq

API

BigQuery DataFrames

Visualiser les données d'entrée

SQL

BigQuery DataFrames

Créer le modèle de série temporelle

SQL

BigQuery DataFrames

Évaluer les modèles candidats

SQL

BigQuery DataFrames

Inspecter les coefficients du modèle

SQL

BigQuery DataFrames

Utiliser le modèle pour prévoir des données

SQL

BigQuery DataFrames

Expliquer les résultats des prévisions

SQL

BigQuery DataFrames

Effectuer un nettoyage

Supprimer l'ensemble de données

Supprimer votre projet

Étapes suivantes

Prévoir une seule série temporelle avec un modèle univarié ARIMA_PLUS