Prognosen für mehrere Zeitachsen mit einer einzigen Abfrage für "NYC Citi Bike"-Fahrten durchführen

In dieser Anleitung erfahren Sie, wie Sie eine Reihe von Zeitachsenmodellen erstellen, um Prognosen für mehrere Zeitachsen mit einer einzigen Abfrage durchzuführen. Außerdem erfahren Sie, wie Sie verschiedene schnelle Trainingsstrategien anwenden, um die Abfrage erheblich zu beschleunigen, und wie Sie die Genauigkeit der Prognose bewerten. Sie verwenden die Daten aus new_york.citibike_trips. Diese Daten enthalten Informationen zu Citi Bike-Fahrten in New York City.

Bevor Sie diese Anleitung lesen, sollten Sie unbedingt Prognosen für einzelne Zeitachsen für Google Analytics-Daten durchführen lesen.

Ziele

In dieser Anleitung verwenden Sie Folgendes:

Die CREATE MODEL-Anweisung zum Erstellen eines Zeitachsenmodells oder einer Reihe von Zeitachsenmodellen.
Die ML.ARIMA_EVALUATE-Funktion zum Bewerten des Modells.
Die ML.ARIMA_COEFFICIENTS-Funktion zum Prüfen der Modellkoeffizienten.
Die Funktion ML.EXPLAIN_FORECAST zum Abrufen verschiedener Komponenten der Zeitreihe, z. B. Saisonabhängigkeit und Trend, mit denen die Prognoseergebnisse erklärt werden können.
Looker Studio zur Visualisierung der Prognoseergebnisse.
Optional: Die ML.FORECAST-Funktion zur Prognose der täglichen Gesamtbesuche.

Kosten

In dieser Anleitung werden kostenpflichtige Komponenten von Google Cloud verwendet, darunter:

BigQuery
BigQuery ML

Weitere Informationen zu den Kosten von BigQuery finden Sie auf der Seite BigQuery-Preise.

Weitere Informationen zu den Kosten für BigQuery ML finden Sie unter BigQuery ML-Preise.

Hinweis

Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.

Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

Zur Projektauswahl

Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.

Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

Zur Projektauswahl

Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.

BigQuery ist in neuen Projekten automatisch aktiviert. Zum Aktivieren von BigQuery in einem vorhandenen Projekt wechseln Sie zu
BigQuery API aktivieren.
Aktivieren Sie die API
.

Schritt 1: Dataset erstellen

Erstellen Sie ein BigQuery-Dataset zum Speichern Ihres ML-Modells:

Rufen Sie in der Google Cloud Console die Seite „BigQuery“ auf.

Zur Seite „BigQuery“
Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts.
Klicken Sie auf Aktionen ansehen > Dataset erstellen.
Führen Sie auf der Seite Dataset erstellen die folgenden Schritte aus:
- Geben Sie unter Dataset-ID bqml_tutorial ein.
- Wählen Sie als Standorttyp die Option Mehrere Regionen und dann USA (mehrere Regionen in den USA) aus.
  
  Die öffentlichen Datasets sind am multiregionalen Standort US gespeichert. Der Einfachheit halber sollten Sie Ihr Dataset am selben Standort speichern.
- Übernehmen Sie die verbleibenden Standardeinstellungen unverändert und klicken Sie auf Dataset erstellen.

Schritt 2 (optional): Zeitachsen für die Prognose visualisieren

Bevor Sie das Modell erstellen, sollten Sie sich ansehen, wie Ihre Eingabezeitachse aussieht. Verwenden Sie dazu Looker Studio.

In der folgenden Abfrage gibt die FROM bigquery-public-data.new_york.citibike_trips-Klausel an, dass Sie die Tabelle citibike_trips im Dataset new_york abfragen.

In der SELECT-Anweisung verwendet die Abfrage die EXTRACT-Funktion, um die Datumsinformationen aus der Spalte starttime zu extrahieren. Die Abfrage verwendet die COUNT(*)-Klausel, um die Gesamtzahl der Citi Bike-Touren pro Tag abzurufen.

#standardSQL
SELECT
   EXTRACT(DATE from starttime) AS date,
   COUNT(*) AS num_trips
FROM
  `bigquery-public-data.new_york.citibike_trips`
GROUP BY date

Die Abfrage führen Sie so aus:

Klicken Sie in der Google Cloud Console auf Neue Abfrage erstellen.

Geben Sie im Textfeld des Abfrageeditors die folgende GoogleSQL-Abfrage ein.

#standardSQL
SELECT
   EXTRACT(DATE from starttime) AS date,
   COUNT(*) AS num_trips
FROM
  `bigquery-public-data.new_york.citibike_trips`
GROUP BY date

Klicken Sie auf Ausführen.

Nachdem die Abfrage ausgeführt wurde, sieht die Ausgabe dem folgenden Screenshot ähnlich. Im Screenshot sehen Sie, dass diese Zeitreihe 1184 tägliche Datenpunkte hat, die sich über mehr als vier Jahre erstrecken. Klicken Sie auf die Schaltfläche Daten auswerten und dann auf Mit Looker Studio auswerten. Looker Studio wird in einem neuen Tab geöffnet. Führen Sie die folgenden Schritte in dem neuen Tab aus.
Wählen Sie im Bereich Diagramm die Option Zeitachsendiagramm aus:

Hinweis: Im linken Bereich wird ein Diagramm geöffnet. Wenn in diesem Diagramm "Zu viele Zeilen" angezeigt wird, klicken Sie oben links auf dem Bildschirm auf "Diagramm hinzufügen". Klicken Sie im Drop-down-Menü auf das Zeitreihendiagramm-Symbol.
Gehen Sie unter dem Bereich Diagramm im Bereich Daten zum Abschnitt Messwert. Fügen Sie das Feld num_trips hinzu und entfernen Sie den Standardmesswert Anzahl der Datensätze:

Nach Abschluss des obigen Schritts wird das folgende Diagramm angezeigt. Das Diagramm zeigt, dass die Eingabezeitachse sowohl Wochen- als auch Jahresmuster aufweist. Auch der Trend der Zeitreihe zeigt nach oben.

Schritt 3: Zeitreihenmodell erstellen, um eine einzelne Zeitreihe zu prognostizieren

Erstellen Sie als Nächstes ein Zeitachsenmodell mit den Daten der NYC Citi Bike-Fahrten.

Die folgende GoogleSQL-Abfrage erstellt ein Modell für die Vorhersage der täglichen Gesamtzahl der Fahrradtouren. Die CREATE MODEL-Klausel erstellt und trainiert ein Modell mit dem Namen bqml_tutorial.nyc_citibike_arima_model.

#standardSQL
CREATE OR REPLACE MODEL `bqml_tutorial.nyc_citibike_arima_model`
OPTIONS
  (model_type = 'ARIMA_PLUS',
   time_series_timestamp_col = 'date',
   time_series_data_col = 'num_trips'
  ) AS
SELECT
   EXTRACT(DATE from starttime) AS date,
   COUNT(*) AS num_trips
FROM
  `bigquery-public-data.new_york.citibike_trips`
GROUP BY date

Die OPTIONS(model_type='ARIMA_PLUS', time_series_timestamp_col='date', ...)-Klausel gibt an, dass Sie ein ARIMA-basiertes Zeitachsenmodell erstellen. Standardmäßig wird auto_arima=TRUE verwendet, sodass der auto.ARIMA-Algorithmus die Hyperparameter in ARIMA_PLUS-Modellen automatisch abstimmt. Der Algorithmus passt Dutzende von Kandidatenmodellen an und wählt das beste Modell mit dem niedrigsten Akaike-Informationskriterium (AIC) aus. Da der Standardwert data_frequency='AUTO_FREQUENCY' ist, leitet der Trainingsprozess außerdem automatisch die Datenhäufigkeit der Eingabezeitachse ab. Schließlich verwendet die CREATE MODEL-Anweisung standardmäßig decompose_time_series=TRUE, und die Nutzer können weiter verstehen, wie die Zeitreihe prognostiziert wird, indem sie die separaten Zeitreihenkomponenten, wie Saisonalität und Urlaubseffekt, abrufen.

Führen Sie die CREATE MODEL-Abfrage aus, um Ihr Modell zu erstellen und zu trainieren:

Klicken Sie in der Google Cloud Console auf Neue Abfrage erstellen.

Geben Sie im Textfeld des Abfrageeditors die folgende GoogleSQL-Abfrage ein.

#standardSQL
CREATE OR REPLACE MODEL `bqml_tutorial.nyc_citibike_arima_model`
OPTIONS
  (model_type = 'ARIMA_PLUS',
   time_series_timestamp_col = 'date',
   time_series_data_col = 'num_trips'
  ) AS
SELECT
   EXTRACT(DATE from starttime) AS date,
   COUNT(*) AS num_trips
FROM
  `bigquery-public-data.new_york.citibike_trips`
GROUP BY date

Klicken Sie auf Ausführen.

Die Abfrage dauert ungefähr 17 Sekunden. Anschließend wird das Modell (nyc_citibike_arima_model) im Navigationsbereich angezeigt. Da die Abfrage eine CREATE MODEL-Anweisung zum Erstellen eines Modells verwendet, werden keine Abfrageergebnisse ausgegeben.

Schritt 4: Zeitreihe prognostizieren und Ergebnisse visualisieren

Sie können erklären, wie die Zeitreihe prognostiziert wird, indem Sie alle Teilzeitkomponenten-Komponenten wie Saisonalität und Trend mithilfe der Funktion ML.EXPLAIN_FORECAST visualisieren.

Gehen Sie dazu so vor:

Klicken Sie in der Google Cloud Console auf Neue Abfrage erstellen.

Geben Sie im Textfeld des Abfrageeditors die folgende GoogleSQL-Abfrage ein.

#standardSQL
SELECT
  *
FROM
  ML.EXPLAIN_FORECAST(MODEL `bqml_tutorial.nyc_citibike_arima_model`,
                      STRUCT(365 AS horizon, 0.9 AS confidence_level))

Klicken Sie auf Ausführen.
Klicken Sie nach Abschluss der Abfrage auf die Schaltfläche Daten auswerten und dann auf Mit Looker Studio auswerten. Im Browser wird ein neuer Tab geöffnet. Klicken Sie dann im Bereich Diagramm auf das Symbol für Zeitachsendiagramm, wie im folgenden Screenshot gezeigt.

Hinweis: Im linken Bereich wird ein Diagramm geöffnet. Wenn in diesem Diagramm "Zu viele Zeilen" angezeigt wird, klicken Sie oben links auf dem Bildschirm auf "Diagramm hinzufügen". Klicken Sie im Drop-down-Menü auf das Zeitreihendiagramm-Symbol.
Führen Sie im Bereich Daten folgende Schritte aus:
1. Wählen Sie im Abschnitt Zeitraumdimension die Option time_series_timestamp (Date) aus.
2. Wählen Sie im Abschnitt Dimension die Option time_series_timestamp (Date) aus.
3. Entfernen Sie im Abschnitt Messwert den Standardmesswert Record Count und fügen Sie Folgendes hinzu:
  - time_series_data
  - prediction_interval_lower_bound
  - prediction_interval_upper_bound
  - trend
  - seasonal_period_yearly
  - seasonal_period_weekly
  - spikes_and_dips
  - step_changes
Scrollen Sie im Bereich Stil nach unten zur Option Fehlende Daten und verwenden Sie Zeilenumbrüche anstelle von Linie auf null.

Nachdem Sie diese Schritte ausgeführt haben, wird das folgende Diagramm im linken Bereich angezeigt.

Schritt 5: Mehrere Zeitachsen gleichzeitig prognostizieren

Als Nächstes sollten Sie die tägliche Gesamtzahl der Fahrten prognostizieren, die an verschiedenen Citi Bike-Haltestellen beginnen. Dazu müssen Sie viele Zeitachsen prognostizieren. Sie können mehrere CREATE MODEL-Abfragen schreiben. Dies kann jedoch mühsam und zeitaufwendig sein, insbesondere wenn Sie sehr viele Zeitachsen haben.

Zur Erleichterung können Sie in BigQuery ML eine Reihe von Zeitachsenmodellen erstellen, um mehrere Zeitachsen mit einer einzigen Abfrage vorherzusagen. Außerdem werden alle Zeitachsenmodelle gleichzeitig angepasst.

In der folgenden GoogleSQL-Abfrage erstellt und trainiert die CREATE MODEL-Klausel eine Reihe von Modellen mit dem Namen bqml_tutorial.nyc_citibike_arima_model_group.

 #standardSQL
CREATE OR REPLACE MODEL `bqml_tutorial.nyc_citibike_arima_model_group`
OPTIONS
  (model_type = 'ARIMA_PLUS',
   time_series_timestamp_col = 'date',
   time_series_data_col = 'num_trips',
   time_series_id_col = 'start_station_name',
   auto_arima_max_order = 5
  ) AS
SELECT
   start_station_name,
   EXTRACT(DATE from starttime) AS date,
   COUNT(*) AS num_trips
FROM
  `bigquery-public-data.new_york.citibike_trips`
WHERE start_station_name LIKE '%Central Park%'
GROUP BY start_station_name, date

Die OPTIONS(model_type='ARIMA_PLUS', time_series_timestamp_col='date', ...)-Klausel gibt an, dass Sie eine Reihe von ARIMA-basierten Zeitachsenmodellen ARIMA_PLUS erstellen. Zusätzlich zu time_series_timestamp_col und time_series_data_col müssen Sie time_series_id_col angeben, mit dem verschiedene Eingabezeitachsen annotiert werden. Die Option auto_arima_max_order steuert den Suchbereich für die Hyperparameter-Abstimmung im auto.ARIMA-Algorithmus. Standardmäßig wird mit der Anweisung CREATE MODEL standardmäßig decompose_time_series=TRUE verwendet. Nutzer können dann besser nachvollziehen, wie die Zeitreihe in der Trainingspipeline analysiert wird, indem sie die Ergebnisse der Zerlegung abrufen.

Die SELECT ... FROM ... GROUP BY ...-Klausel gibt an, dass Sie mehrere Zeitachsen bilden. Jede ist mit einem anderen start_station_name verknüpft. Der Einfachheit halber verwenden wir die WHERE ... LIKE ...-Klausel, um Starthaltestellen auf diejenigen zu beschränken, deren Namen Central Park enthalten.

Führen Sie die folgenden Schritte aus, um die CREATE MODEL-Abfrage zum Erstellen und Trainieren Ihres Modells auszuführen:

Klicken Sie in der Google Cloud Console auf Neue Abfrage erstellen.

Geben Sie im Textfeld des Abfrageeditors die folgende GoogleSQL-Abfrage ein.

#standardSQL
CREATE OR REPLACE MODEL `bqml_tutorial.nyc_citibike_arima_model_group`
OPTIONS
  (model_type = 'ARIMA_PLUS',
   time_series_timestamp_col = 'date',
   time_series_data_col = 'num_trips',
   time_series_id_col = 'start_station_name',
   auto_arima_max_order = 5
  ) AS
SELECT
   start_station_name,
   EXTRACT(DATE from starttime) AS date,
   COUNT(*) AS num_trips
FROM
  `bigquery-public-data.new_york.citibike_trips`
WHERE start_station_name LIKE '%Central Park%'
GROUP BY start_station_name, date

Klicken Sie auf Ausführen.

Die Abfrage dauert ungefähr 24 Sekunden. Anschließend wird das Modell (nyc_citibike_arima_model_group) im Navigationsbereich angezeigt. Da die Abfrage eine CREATE MODEL-Anweisung verwendet, werden keine Abfrageergebnisse angezeigt.

Hinweis: Mit dieser Abfrage werden 12 Zeitachsenmodelle erstellt, eines für jede der 12 Eingabezeitachsen. Der Zeitaufwand ist mit etwa 24 Sekunden aufgrund der Parallelität nur 1,4-mal höher als bei der Erstellung eines Modells mit nur einer Zeitreihe. Wenn Sie jedoch die WHERE ... LIKE ...-Klausel entfernen, gibt es mehr als 600 Zeitachsen für die Prognose, die aufgrund der Slot-Kapazität nicht vollständig parallel prognostiziert werden. Daher kann es etwa 15 Minuten dauern, bis die Abfrage abgeschlossen ist. Wenn Sie die Abfragelaufzeit reduzieren möchten, ohne dass sich die Modellqualität möglicherweise verschlechtert, können Sie den Wert von AUTO_ARIMA_MAX_ORDER vom Standardwert 5 auf 3 oder 4 verringern. Dadurch wird der Suchbereich der Hyperparameter-Feinabstimmung im auto.ARIMA-Algorithmus verkleinert. Weitere Informationen finden Sie unter: Large-scale time series forecasting best practices.

Schritt 6: Bewertungsmesswerte der Zeitachsenmodelle prüfen

Nachdem Sie Ihre Modelle erstellt haben, können Sie mit der Funktion ML.ARIMA_EVALUATE die Bewertungsmesswerte aller erstellten Modelle anzeigen.

In folgender GoogleSQL-Abfrage verwendet die FROM-Klausel die ML.ARIMA_EVALUATE-Funktion für Ihr Modell, bqml_tutorial.nyc_citibike_arima_model_group. Die Bewertungsmesswerte hängen nur von der Trainingseingabe ab, daher ist Ihr Modell die einzige Eingabe.

Führen Sie die ML.ARIMA_EVALUATE-Abfrage mit folgenden Schritten aus:

Klicken Sie in der Google Cloud Console auf Neue Abfrage erstellen.

Geben Sie im Textfeld des Abfrageeditors die folgende GoogleSQL-Abfrage ein.

#standardSQL
SELECT
 *
FROM
 ML.ARIMA_EVALUATE(MODEL `bqml_tutorial.nyc_citibike_arima_model_group`)

Klicken Sie auf Ausführen.
Die Abfrage dauert weniger als eine Sekunde. Sobald die Abfrage abgeschlossen ist, klicken Sie unterhalb des Textbereichs der Abfrage auf den Tab Ergebnisse. Die Ergebnisse sollten so aussehen:

Die Ergebnisse enthalten die folgenden Spalten:
- start_station_name
- non_seasonal_p
- non_seasonal_d
- non_seasonal_q
- has_drift
- log_likelihood
- AIC
- variance
- seasonal_periods
- has_holiday_effect
- has_spikes_and_dips
- has_step_changes
- error_message
start_station_name, die erste Spalte, annotiert die Zeitreihe, an die das jeweilige Zeitreihenmodell angepasst wird. Dies entspricht der Angabe für time_series_id_col.

Die folgenden vier Spalten (non_seasonal_p, non_seasonal_d, non_seasonal_q und has_drift) definieren ein ARIMA-Modell in der Trainingspipeline. Die drei folgenden Messwerte (log_likelihood, AIC und variance) sind für den ARIMA-Modellanpassungsprozess relevant. Der Anpassungsprozess bestimmt mithilfe des Algorithmus auto.ARIMA für jede Zeitreihe das beste ARIMA-Modell.

Die Spalten has_holiday_effect, has_spikes_and_dips und has_step_changes werden nur ausgefüllt, wenn decompose_time_series=TRUE verwendet wird.

Die Spalte seasonal_periods ist das saisonale Muster innerhalb der Eingabezeitachse. Jede Zeitreihe kann unterschiedliche saisonale Muster haben. In der Abbildung sehen Sie beispielsweise, dass eine Zeitreihe ein Jahresmuster aufweist, andere hingegen nicht.

Schritt 7: Koeffizienten Ihrer Modelle prüfen

Mit der Funktion ML.ARIMA_COEFFICIENTS werden die Modellkoeffizienten Ihres ARIMA_PLUS-Modells, bqml_tutorial.nyc_citibike_arima_model_group, abgerufen. ML.ARIMA_COEFFICIENTS verwendet das Modell als einzige Eingabe.

Führen Sie die ML.ARIMA_COEFFICIENTS-Abfrage mit folgenden Schritten aus:

Klicken Sie in der Google Cloud Console auf Neue Abfrage erstellen.

Geben Sie im Textfeld des Abfrageeditors die folgende GoogleSQL-Abfrage ein.

#standardSQL
SELECT
 *
FROM
 ML.ARIMA_COEFFICIENTS(MODEL `bqml_tutorial.nyc_citibike_arima_model_group`)

Klicken Sie auf Ausführen.

Die Abfrage dauert weniger als eine Sekunde. Die Ergebnisse sollten in etwa so aussehen:

Die Ergebnisse enthalten die folgenden Spalten:
- start_station_name
- ar_coefficients
- ma_coefficients
- intercept_or_drift
start_station_name, die erste Spalte, annotiert die Zeitreihe, an die das jeweilige Zeitreihenmodell angepasst wird.

ar_coefficients zeigt die Modellkoeffizienten des autoregressiven (AR) Teils des ARIMA-Modells an. Auf ähnliche Weise zeigt ma_coefficients die Modellkoeffizienten des gleitenden Durchschnitts (Moving Average, MA) an. Beide sind Arrays, deren Länge non_seasonal_p bzw. non_seasonal_q entspricht. intercept_or_drift ist der konstante Begriff im ARIMA-Modell.

Schritt 8: Modell zur gleichzeitigen Prognose mehrerer Zeitachsen verwenden

Die Funktion ML.EXPLAIN_FORECAST prognostiziert zukünftige Zeitachsenwerte mit einem Vorhersageintervall mithilfe des Modells bqml_tutorial.nyc_citibike_arima_model_group. Gleichzeitig werden alle separaten Komponenten der Zeitachsen zurückgegeben.

Die STRUCT(3 AS horizon, 0.9 AS confidence_level)-Klausel gibt an, dass die Abfrage drei zukünftige Zeitpunkte vorhergesagt und ein Vorhersageintervall mit einer Konfidenz von 90 % generiert. Die Funktion ML.EXPLAIN_FORECAST verwendet das Modell sowie einige optionale Argumente.

Führen Sie die ML.EXPLAIN_FORECAST-Abfrage mit folgenden Schritten aus:

Klicken Sie in der Google Cloud Console auf Neue Abfrage erstellen.

Geben Sie im Textfeld des Abfrageeditors die folgende GoogleSQL-Abfrage ein.

#standardSQL
SELECT
 *
FROM
 ML.EXPLAIN_FORECAST(MODEL `bqml_tutorial.nyc_citibike_arima_model_group`,
                     STRUCT(3 AS horizon, 0.9 AS confidence_level))

Klicken Sie auf Ausführen.

Die Abfrage dauert weniger als eine Sekunde. Die Ergebnisse sollten so aussehen:

Die Ergebnisse enthalten die folgenden Spalten:
- start_station_name
- time_series_timestamp
- time_series_type
- time_series_data
- time_series_adjusted_data
- standard_error
- confidence_level
- prediction_interval_lower_bound
- prediction_interval_lower_bound
- trend
- seasonal_period_yearly
- seasonal_period_quarterly
- seasonal_period_monthly
- seasonal_period_weekly
- seasonal_period_daily
- holiday_effect
- spikes_and_dips
- step_changes
- residual
Die Ausgabezeilen sind nach start_station_name sortiert. Bei jedem start_station_name sind die Ausgabezeilen in chronologischer Reihenfolge von time_series_timestamp angeordnet. Verschiedene Komponenten werden als Spalten der Ausgabe aufgeführt. Weitere Informationen finden Sie in der Definition von ML.EXPLAIN_FORECAST.

Optional: Schritt 9: Modell für die Vorhersage mehrerer Zeitachsen gleichzeitig verwenden

Die ML.FORECAST-Funktion kann auch verwendet werden, um zukünftige Zeitachsenwerte mit einem Vorhersageintervall mithilfe Ihres Modells bqml_tutorial.nyc_citibike_arima_model_group vorherzusagen.

Wie ML.EXPLAIN_FORECAST gibt auch die Klausel STRUCT(3 AS horizon, 0.9 AS confidence_level) an, dass die Abfrage für jede Zeitreihe drei zukünftige Zeitpunkte prognostiziert und ein Vorhersageintervall mit einer Konfidenz von 90 % generiert.

Die Funktion ML.FORECAST verwendet das Modell sowie einige optionale Argumente.

Führen Sie die ML.FORECAST-Abfrage mit folgenden Schritten aus:

Klicken Sie in der Google Cloud Console auf Neue Abfrage erstellen.

Geben Sie im Textfeld des Abfrageeditors die folgende GoogleSQL-Abfrage ein.

#standardSQL
SELECT
 *
FROM
 ML.FORECAST(MODEL `bqml_tutorial.nyc_citibike_arima_model_group`,
             STRUCT(3 AS horizon, 0.9 AS confidence_level))

Klicken Sie auf Ausführen.

Die Abfrage dauert weniger als eine Sekunde. Die Ergebnisse sollten so aussehen:

Die Ergebnisse enthalten die folgenden Spalten:
- start_station_name
- forecast_timestamp
- forecast_value
- standard_error
- confidence_level
- prediction_interval_lower_bound
- prediction_interval_upper_bound
- confidence_interval_lower_bound (bald eingestellt)
- confidence_interval_upper_bound (bald eingestellt)
Die erste Spalte, start_station_name, annotiert die Zeitreihe, an die das jeweilige Zeitreihenmodell angepasst wird. Für jeden start_station_name sind mehrere Zeilen Prognoseergebnisse vorhanden. Die Anzahl entspricht dem Wert für horizon.

Für jeden start_station_name werden die Ausgabezeilen in chronologischer Reihenfolge von forecast_timestamp angeordnet. In der Zeitachsenprognose ist das Vorhersageintervall, das sich aus der Unter- und Obergrenze ergibt, genauso wichtig wie forecast_value. forecast_value ist der Mittelpunkt des Vorhersageintervall. Das Vorhersageintervall hängt von standard_error und confidence_level ab.

Bereinigen

Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, löschen Sie entweder das Projekt, das die Ressourcen enthält, oder Sie behalten das Projekt und löschen die einzelnen Ressourcen.

Sie können das von Ihnen erstellte Projekt löschen.
Sie können das Projekt aber auch behalten und das Dataset löschen.

Dataset löschen

Wenn Sie Ihr Projekt löschen, werden alle Datasets und Tabellen entfernt. Wenn Sie das Projekt wieder verwenden möchten, können Sie das in dieser Anleitung erstellte Dataset löschen:

Rufen Sie, falls erforderlich, die Seite "BigQuery" in der Google Cloud Console auf.

Zur Seite "BigQuery"
Wählen Sie im Navigationsbereich das Dataset bqml_tutorial aus, das Sie erstellt haben.
Klicken Sie auf Dataset löschen, um das Dataset, die Tabelle und alle Daten zu löschen.
Bestätigen Sie im Dialogfeld Dataset löschen den Löschbefehl. Geben Sie dazu den Namen des Datasets (bqml_tutorial) ein und klicken Sie auf Löschen.

Projekt löschen

So löschen Sie das Projekt:

Achtung: Das Löschen von Projekten hat folgende Auswirkungen:

Alle Inhalte des Projekts werden gelöscht. Wenn Sie für die Aufgaben in diesem Dokument ein bereits bestehendes Projekt verwendet haben und dieses löschen, werden auch alle anderen im Rahmen des Projekts erstellten Daten gelöscht.
Benutzerdefinierte Projekt-IDs gehen verloren. Beim Erstellen dieses Projekts haben Sie möglicherweise eine benutzerdefinierte Projekt-ID erstellt, die Sie weiterhin verwenden möchten. Damit die URLs, die die Projekt-ID nutzen, z. B. eine appspot.com-URL, erhalten bleiben, sollten Sie ausgewählte Ressourcen innerhalb des Projekts löschen, statt das gesamte Projekt.

Wenn Sie mehrere Architekturen, Anleitungen und Kurzanleitungen durcharbeiten möchten, können Sie die Überschreitung von Projektkontingenten verhindern, indem Sie Projekte wiederverwenden.

Wechseln Sie in der Google Cloud Console zur Seite Ressourcen verwalten.
Zur Seite „Ressourcen verwalten“
Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie dann auf Löschen.
Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Shut down (Beenden), um das Projekt zu löschen.

Nächste Schritte

Erfahren Sie, wie Sie ARIMA_PLUS beschleunigen, um eine Million Zeitachsen innerhalb von Stunden zu prognostizieren
Mehr über maschinelles Lernen im Machine Learning Crash Course erfahren
Einführung in BigQuery ML
Weitere Informationen zur Google Cloud Console finden Sie unter Google Cloud Console verwenden.