Diese Seite wurde von der Cloud Translation API übersetzt.

Prognosemodell trainieren

Auf dieser Seite wird gezeigt, wie Sie mithilfe der Google Cloud Console oder der Vertex AI API ein Prognosemodell aus einem tabellarischen Dataset trainieren.

Hinweise

Bevor Sie ein Prognosemodell trainieren, müssen Sie die folgenden Schritte ausführen:

Modell trainieren

Google Cloud Console

Rufen Sie in der Google Cloud Console im Abschnitt „Vertex AI“ die Seite Datasets auf.

Zur Seite „Datasets“
Klicken Sie auf den Namen des Datasets, das Sie zum Trainieren Ihres Modells verwenden möchten, um dessen Detailseite zu öffnen.
Wenn Ihr Datentyp Annotationssätze verwendet, wählen Sie den Annotationssatz aus, den Sie für dieses Modell verwenden möchten.
Klicken Sie auf Neues Modell trainieren.
Wählen Sie Sonstiges aus.
Konfigurieren Sie auf der Seite Trainingsmethode Folgendes:
1. Wählen Sie die Modelltrainingsmethode aus. Weitere Informationen finden Sie unter Methoden für das Modelltraining.
2. Klicken Sie auf Weiter.
Konfigurieren Sie auf der Seite Modelldetails Folgendes:
1. Geben Sie den Anzeigenamen für das neue Modell ein.
2. Wählen Sie die Zielspalte aus.
  
  Die Zielspalte enthält den Wert, den das Modell prognostiziert. Weitere Informationen zu den Anforderungen an Zielspalten.
3. Wenn Sie die Spalten Achsenkennzeichnung und Zeitstempel für Ihr Dataset nicht festgelegt haben, wählen Sie sie jetzt aus.
4. Wählen Sie die Detaillierungsgrad der Daten aus. Wählen Sie Daily aus, wenn Sie die Effektmodellierung für Feiertage verwenden möchten. Weitere Informationen zum Auswählen des Daten-Detaillierungsgrads
5. Optional: Wählen Sie im Drop-down-Menü Feiertagsregionen eine oder mehrere geografische Regionen aus, um die Effektmodellierung für Feiertage zu aktivieren. Während des Trainings erstellt Vertex AI innerhalb des Modells kategoriale Features basierend auf dem Datum aus der Spalte Zeitstempel und den angegebenen geografischen Regionen. Sie können diese Option nur auswählen, wenn der Detaillierungsgrad der Daten auf Daily gesetzt ist. Standardmäßig ist die Effektmodellierung deaktiviert. Weitere Informationen zu den geografischen Regionen, die für die Effektmodellierung für Feiertage verwendet werden, finden Sie unter Feiertagsregionen.
6. Geben Sie das Kontextfenster und den Prognosezeitraum ein.
  
  Der Prognosezeitraum bestimmt, wie weit das Modell den Zielwert für jede Zeile mit Inferenzdaten prognostiziert. Der Prognosezeitraum wird in Einheiten von Datengranularität angegeben.
  
  Das Kontextfenster legt fest, wie weit das Modell während des Trainings (und für Prognosen) zurückblickt. Mit anderen Worten: Für jeden Trainingsdatenpunkt bestimmt das Kontextfenster, wie weit das Modell nach Vorhersagemustern sucht. Das Kontextfenster wird in Einheiten von Datengranularität angegeben.
  
  Weitere Informationen.
7. Wenn Sie Ihr Test-Dataset nach BigQuery exportieren möchten, klicken Sie das Kästchen Test-Dataset nach BigQuery exportieren an und geben Sie den Namen der Tabelle ein.
8. Wenn Sie Ihre Datenaufteilung manuell steuern oder das Prognosefenster konfigurieren möchten, gehen Sie zu Erweiterte Optionen.
9. Die Standarddatenaufteilung ist chronologisch und mit den standardmäßigen Prozentsätzen von 80/10/10. Wenn Sie manuell festlegen möchten, welche Zeilen welcher Aufteilung zugewiesen werden, wählen Sie Manuell aus und geben Sie die Spalte für die Datenaufteilung an.
  
  Weitere Informationen zur Datenaufteilung.
10. Wählen Sie eine Strategie für rollierende Fenster zur Generierung von Prognosefenstern aus. Die Standardstrategie ist Anzahl.
  - Anzahl: Legen Sie den Wert für die maximale Anzahl von Fenstern im bereitgestellten Textfeld fest.
  - Schrittlänge: Legen Sie den Wert der Schrittlänge im bereitgestellten Textfeld fest.
  - Spalte: Wählen Sie den entsprechenden Spaltennamen aus dem Drop-down-Menü aus.
  Weitere Informationen finden Sie unter Strategien für rollierende Fenster.
11. Klicken Sie auf Weiter.
Konfigurieren Sie auf der Seite Trainingsoptionen Folgendes:
1. Falls noch nicht geschehen, klicken Sie auf Statistiken generieren.
  
  Durch das Generieren von Statistiken werden die Transformation-Drop-down-Menüs ausgefüllt.
2. Prüfen Sie die Spaltenliste und schließen Sie Spalten aus dem Training aus, die nicht zum Trainieren des Modells verwendet werden sollen.
  
  Wenn Sie eine Spalte für die Datenaufteilung verwenden, sollte sie enthalten sein.
3. Prüfen Sie die für Ihre enthaltenen Features ausgewählten Transformationen und nehmen Sie die erforderlichen Änderungen vor.
  
  Zeilen mit Daten, die für die ausgewählte Transformation ungültig sind, werden vom Training ausgeschlossen. Weitere Informationen zu Transformationen.
4. Geben Sie für jede Spalte, die Sie für das Training angegeben haben, den Featuretyp an, wie sich dieses Feature auf seine Zeitreihe bezieht und ob es zum Zeitpunkt der Prognose verfügbar ist. Weitere Informationen zu Featuretypen und Verfügbarkeit
5. Wenn Sie eine Gewichtungsspalte angeben, ein anderes Optimierungsziel als das standardmäßig nutzen oder die hierarchische Prognose aktivieren möchten, öffnen Sie Erweiterte Optionen.
6. Optional: Wenn Sie eine Gewichtungsspalte angeben möchten, wählen Sie diese aus der Drop-down-Liste aus. Weitere Informationen zu Gewichtungsspalten.
7. Optional: Wenn Sie das Optimierungsziel auswählen möchten, wählen Sie es aus der Liste aus. Weitere Informationen zu Optimierungszielen.
8. Optional: Wenn Sie die hierarchische Prognose verwenden möchten, wählen Sie Hierarchische Prognose aktivieren aus. Sie können zwischen drei Gruppierungsoptionen wählen:
  - No grouping
  - Group by columns
  - Group all
  Sie können auch die folgenden aggregierten Verlustgewichtungen festlegen:
  - Group total weight. Dieses Feld kann nur festgelegt werden, wenn Sie die Option Group by columns oder Group all wählen.
  - Temporal total weight.
  - Group temporal total weight. Dieses Feld kann nur festgelegt werden, wenn Sie die Option Group by columns oder Group all wählen.
  Weitere Informationen zur hierarchischen Prognose.
9. Klicken Sie auf Weiter.
Konfigurieren Sie auf der Seite Computing und Preise Folgendes:
1. Geben Sie an, wie viele Stunden das Modell maximal trainiert werden soll. Mit dieser Einstellung können Sie die Trainingskosten begrenzen. Die tatsächlich benötigte Zeit kann aber länger sein als dieser Wert, da auch noch andere Vorgänge am Erstellen eines neuen Modells beteiligt sind.
  
  Die vorgeschlagene Trainingszeit hängt von der Größe Ihres Prognosezeitraums und Ihren Trainingsdaten ab. In der folgenden Tabelle finden Sie einige Beispiel-Trainingsläufe für Prognosen und den Bereich der Trainingszeit, der für das Trainieren eines qualitativ hochwertigen Modells erforderlich war.
  
  Zeilen Features Prognosezeitraum Trainingszeit
  
  12 Millionen 10 6 3 - 6 Stunden
  
  20 Millionen 50 13 6 - 12 Stunden
  
  16 Millionen 30 365 24 - 48 Stunden
  
  Informationen zu den Preisen für Trainings finden Sie auf der Seite "Preise".
2. Klicken Sie auf Training starten.
  Das Modelltraining kann viele Stunden dauern, je nach Größe und Komplexität Ihrer Daten und Ihres Trainingsbudgets, sofern Sie eines angegeben haben. Sie können diesen Tab schließen und später zu ihm zurückkehren. Wenn das Training für Ihr Modell abgeschlossen ist, erhalten eine E-Mail.
  
  Tabellarische Trainingsdaten in Cloud Storage oder BigQuery werden nicht in Vertex AI importiert. (Beim Importieren aus lokalen Dateien werden diese in Cloud Storage importiert.) Wenn Sie ein Dataset mit Tabellendaten erstellen, werden die Daten dem Dataset zugeordnet. Änderungen, die Sie nach dem Erstellen des Datasets an der Datenquelle in Cloud Storage oder BigQuery vornehmen, werden in die Modelle übernommen, die anschließend mit diesem Dataset trainiert wurden. Ein Snapshot des Datasets wird erstellt, wenn das Modelltraining beginnt.

Zeilen	Features	Prognosezeitraum	Trainingszeit
12 Millionen	10	6	3 - 6 Stunden
20 Millionen	50	13	6 - 12 Stunden
16 Millionen	30	365	24 - 48 Stunden

API

Wählen Sie einen Tab für Ihre Sprache oder Ihre Umgebung aus:

REST

Sie verwenden den Befehl trainingPipelines.create, um ein Modell zu trainieren.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

LOCATION: Ihre Region.
PROJECT: Ihre Projekt-ID.
TRAINING_PIPELINE_DISPLAY_NAME: Anzeigename für die Trainingspipeline, die für diesen Vorgang erstellt wurde.
TRAINING_TASK_DEFINITION: Die Trainingsmethode des Modells.
- Zeitreihen-Dense-Encoder (TiDE)
  gs://google-cloud-aiplatform/schema/trainingjob/definition/time_series_dense_encoder_forecasting_1.0.0.yaml
- Temporal Fusion Transformer (TFT)
  gs://google-cloud-aiplatform/schema/trainingjob/definition/temporal_fusion_transformer_time_series_forecasting_1.0.0.yaml
- AutoML (L2L)
  gs://google-cloud-aiplatform/schema/trainingjob/definition/automl_forecasting_1.0.0.yaml
- Seq2Seq+
  gs://google-cloud-aiplatform/schema/trainingjob/definition/seq2seq_plus_time_series_forecasting_1.0.0.yaml
Weitere Informationen finden Sie unter Methoden für das Modelltraining.
TARGET_COLUMN: Die Spalte (Wert), für die das Modell Vorhersagen treffen soll.
Spalte TIME_COLUMNTime (Zeit) Weitere Informationen
TIME_SERIES_IDENTIFIER_COLUMN: Die Zeitachsenkennzeichnungs-Spalte. Weitere Informationen
WEIGHT_COLUMN: (Optional) Die Gewichtungsspalte. Weitere Informationen
TRAINING_BUDGET: Die maximale Zeit, die das Modell trainiert werden soll, in Milli-Knotenstunden (1.000 Milli-Knotenstunden entsprechen einer Knotenstunde).
GRANULARITY_UNIT: Die Einheit, die für die Granularität Ihrer Trainingsdaten und den Prognosezeitraum und das Kontextfenster verwendet werden soll. Kann minute, hour, day, week, month oder year sein. Wählen Sie day aus, wenn Sie die Effektmodellierung für Feiertage verwenden möchten. Weitere Informationen zum Auswählen des Daten-Detaillierungsgrads
GRANULARITY_QUANTITY: Die Anzahl der Granularitätseinheiten, aus denen das Intervall zwischen Beobachtungen in den Trainingsdaten besteht. Muss für alle Einheiten mit Ausnahme von Minuten eins sein, entweder 1, 5, 10, 15 oder 30. Weitere Informationen zum Auswählen des Daten-Detaillierungsgrads
GROUP_COLUMNS: Spaltennamen in der Trainingseingabetabelle, die die Gruppierung für die Hierarchieebene identifizieren. Die Spalten müssen `time_series_attribute_columns` sein. Weitere Informationen
GROUP_TOTAL_WEIGHT: Gewichtung der aggregierten Verluste der Gruppe im Verhältnis zum individuellen Verlust. Deaktiviert, wenn "0,0" oder nichts festgelegt ist. Ist die Gruppenspalte nicht festgelegt, werden alle Zeitachsen als Teil derselben Gruppe behandelt und die Aggregierung erfolgt über alle Zeitachsen. Weitere Informationen
TEMPORAL_TOTAL_WEIGHT: Gewichtung des aggregierten Verlusts über die Zeit relativ zum individuellen Verlust. Deaktiviert, wenn "0,0" oder nichts festgelegt ist. Weitere Informationen
GROUP_TEMPORAL_TOTAL_WEIGHT: Gewichtung des Gesamtverlusts (Gruppe x Zeit) im Verhältnis zum individuellen Verlust. Deaktiviert, wenn "0,0" oder nichts festgelegt ist. Ist die Gruppenspalte nicht festgelegt, werden alle Zeitachsen als Teil derselben Gruppe behandelt und die Aggregierung erfolgt über alle Zeitachsen. Weitere Informationen
HOLIDAY_REGIONS: (Optional) Sie können eine oder mehrere geografische Regionen auswählen, um die Effektmodellierung für Feiertage zu aktivieren. Während des Trainings erstellt Vertex AI innerhalb des Modells kategoriale Features basierend auf dem Datum aus TIME_COLUMN und den angegebenen geografischen Regionen. Setzen Sie zur Aktivierung GRANULARITY_UNIT auf day und geben Sie eine oder mehrere Regionen im Feld HOLIDAY_REGIONS an. Standardmäßig ist die Effektmodellierung deaktiviert. Weitere Informationen finden Sie unter Feiertagsregionen.
FORECAST_HORIZON: Der Prognosezeitraum bestimmt, wie weit das Modell den Zielwert für jede Zeile mit Inferenzdaten prognostiziert. Der Prognosezeitraum wird in Einheiten der Datengranularität angegeben (GRANULARITY_UNIT). Weitere Informationen.
CONTEXT_WINDOW: Das Kontextfenster legt fest, wie weit das Modell während des Trainings (und für Prognosen) zurückblickt. Mit anderen Worten: Für jeden Trainingsdatenpunkt bestimmt das Kontextfenster, wie weit das Modell nach Vorhersagemustern sucht. Das Kontextfenster wird in der Datengranularität angegeben (GRANULARITY_UNIT). Weitere Informationen
OPTIMIZATION_OBJECTIVE: Standardmäßig minimiert Vertex AI die Wurzel der mittleren Fehlerquadratsumme (Root Mean Squared Error, RMSE). Wenn Sie ein anderes Optimierungsziel für Ihr Prognosemodell benötigen, wählen Sie eine der Optionen unter Optimierungsziele für Prognosemodelle aus. Wenn Sie den Quantilverlust minimieren möchten, müssen Sie auch einen Wert für QUANTILES angeben.
PROBABILISTIC_INFERENCE: (Optional) Wenn der Wert auf true gesetzt ist, modelliert Vertex AI die Wahrscheinlichkeitsverteilung der Prognose. Die probabilistische Inferenz kann die Modellqualität verbessern, indem ungenaue Daten verarbeitet und Unsicherheiten quantifiziert werden. Wenn QUANTILES angegeben sind, gibt Vertex AI auch die Quantile der Wahrscheinlichkeitsverteilung zurück. Die probabilistische Inferenz ist nur mit den Trainingsmethoden Time series Dense Encoder (TiDE) und AutoML (L2L) kompatibel. Sie ist nicht mit hierarchischen Prognosen und dem Optimierungsziel minimize-quantile-loss kompatibel.
QUANTILES: Quantile für das minimize-quantile-loss-Optimierungsziel und die probabilistische Inferenz. Geben Sie eine Liste mit bis zu fünf eindeutigen Zahlen zwischen 0 und 1 an.
TIME_SERIES_ATTRIBUTE_COL: Der Name oder die Namen der Spalten, die Zeitachsenattribute sind. Weitere Informationen
AVAILABLE_AT_FORECAST_COL: Der Name oder die Namen der kovariativen Spalten, deren Wert zum Zeitpunkt der Prognose bekannt ist. Weitere Informationen
UNAVAILABLE_AT_FORECAST_COL: Der Name oder die Namen der kovariativen Spalten, deren Wert zum Zeitpunkt der Prognose unbekannt ist. Weitere Informationen
TRANSFORMATION_TYPE: Der Transformationstyp wird für jede Spalte bereitgestellt, die zum Trainieren des Modells verwendet wird. Weitere Informationen
COLUMN_NAME: Der Name der Spalte mit dem angegebenen Transformationstyp. Jede Spalte, die zum Trainieren des Modells verwendet wird, muss angegeben werden.
MODEL_DISPLAY_NAME: Anzeigename für das neu trainierte Modell.
DATASET_ID: ID für das Trainings-Dataset.
Sie können ein Split-Objekt zur Steuerung Ihrer Datenaufteilung bereitstellen. Weitere Informationen zur Datenaufteilung finden Sie unter Datenaufteilung mit REST steuern.
Sie können ein windowConfig-Objekt angeben, um eine Strategie für rollierende Fenster für die Generierung von Prognosefenstern zu konfigurieren. Weitere Informationen finden Sie unter Strategie mit rollierendem Fenster mit REST konfigurieren.
PROJECT_NUMBER: Die automatisch generierte Projektnummer Ihres Projekts.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/trainingPipelines

JSON-Text anfordern:

{
    "displayName": "TRAINING_PIPELINE_DISPLAY_NAME",
    "trainingTaskDefinition": "TRAINING_TASK_DEFINITION",
    "trainingTaskInputs": {
        "targetColumn": "TARGET_COLUMN",
        "timeColumn": "TIME_COLUMN",
        "timeSeriesIdentifierColumn": "TIME_SERIES_IDENTIFIER_COLUMN",
        "weightColumn": "WEIGHT_COLUMN",
        "trainBudgetMilliNodeHours": TRAINING_BUDGET,
        "dataGranularity": {"unit": "GRANULARITY_UNIT", "quantity": GRANULARITY_QUANTITY},
        "hierarchyConfig": {"groupColumns": GROUP_COLUMNS, "groupTotalWeight": GROUP_TOTAL_WEIGHT, "temporalTotalWeight": TEMPORAL_TOTAL_WEIGHT, "groupTemporalTotalWeight": GROUP_TEMPORAL_TOTAL_WEIGHT}
        "holidayRegions" : ["HOLIDAY_REGIONS_1", "HOLIDAY_REGIONS_2", ...]
        "forecast_horizon": FORECAST_HORIZON,
        "context_window": CONTEXT_WINDOW,
        "optimizationObjective": "OPTIMIZATION_OBJECTIVE",
        "quantiles": "QUANTILES",
        "enableProbabilisticInference": "PROBABILISTIC_INFERENCE",
        "time_series_attribute_columns": ["TIME_SERIES_ATTRIBUTE_COL_1", "TIME_SERIES_ATTRIBUTE_COL_2", ...]
        "available_at_forecast_columns": ["AVAILABLE_AT_FORECAST_COL_1", "AVAILABLE_AT_FORECAST_COL_2", ...]
        "unavailable_at_forecast_columns": ["UNAVAILABLE_AT_FORECAST_COL_1", "UNAVAILABLE_AT_FORECAST_COL_2", ...]
        "transformations": [
            {"TRANSFORMATION_TYPE_1":  {"column_name" : "COLUMN_NAME_1"} },
            {"TRANSFORMATION_TYPE_2":  {"column_name" : "COLUMN_NAME_2"} },
            ...
    },
    "modelToUpload": {"displayName": "MODEL_DISPLAY_NAME"},
    "inputDataConfig": {
      "datasetId": "DATASET_ID",
    }
}

Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:

curl (Linux, macOS oder Cloud Shell)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud-Befehlszeile angemeldet haben. Dazu haben Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt, die Sie automatisch bei der gcloud-Befehlszeile anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/trainingPipelines"

PowerShell (Windows)

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud-Befehlszeile angemeldet haben. Dazu führen Sie gcloud init oder gcloud auth login aus. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/trainingPipelines" | Select-Object -Expand Content

Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:

{
  "name": "projects/PROJECT_NUMBER/locations/LOCATION/trainingPipelines/TRAINING_PIPELINE_ID",
  "displayName": "myModelName",
  "trainingTaskDefinition": "gs://google-cloud-aiplatform/schema/trainingjob/definition/automl_tabular_1.0.0.yaml",
  "modelToUpload": {
    "displayName": "myModelName"
  },
  "state": "PIPELINE_STATE_PENDING",
  "createTime": "2020-08-18T01:22:57.479336Z",
  "updateTime": "2020-08-18T01:22:57.479336Z"
}

Python

Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Python-API-Referenzdokumentation.

def create_training_pipeline_forecasting_time_series_dense_encoder_sample(
    project: str,
    display_name: str,
    dataset_id: str,
    location: str = "us-central1",
    model_display_name: str = "my_model",
    target_column: str = "target_column",
    time_column: str = "date",
    time_series_identifier_column: str = "time_series_id",
    unavailable_at_forecast_columns: List[str] = [],
    available_at_forecast_columns: List[str] = [],
    forecast_horizon: int = 1,
    data_granularity_unit: str = "week",
    data_granularity_count: int = 1,
    training_fraction_split: float = 0.8,
    validation_fraction_split: float = 0.1,
    test_fraction_split: float = 0.1,
    budget_milli_node_hours: int = 8000,
    timestamp_split_column_name: str = "timestamp_split",
    weight_column: str = "weight",
    time_series_attribute_columns: List[str] = [],
    context_window: int = 0,
    export_evaluated_data_items: bool = False,
    export_evaluated_data_items_bigquery_destination_uri: Optional[str] = None,
    export_evaluated_data_items_override_destination: bool = False,
    quantiles: Optional[List[float]] = None,
    enable_probabilistic_inference: bool = False,
    validation_options: Optional[str] = None,
    predefined_split_column_name: Optional[str] = None,
    sync: bool = True,
):
    aiplatform.init(project=project, location=location)

    # Create training job
    forecasting_tide_job = aiplatform.TimeSeriesDenseEncoderForecastingTrainingJob(
        display_name=display_name,
        optimization_objective="minimize-rmse",
    )

    # Retrieve existing dataset
    dataset = aiplatform.TimeSeriesDataset(dataset_id)

    # Run training job
    model = forecasting_tide_job.run(
        dataset=dataset,
        target_column=target_column,
        time_column=time_column,
        time_series_identifier_column=time_series_identifier_column,
        unavailable_at_forecast_columns=unavailable_at_forecast_columns,
        available_at_forecast_columns=available_at_forecast_columns,
        forecast_horizon=forecast_horizon,
        data_granularity_unit=data_granularity_unit,
        data_granularity_count=data_granularity_count,
        training_fraction_split=training_fraction_split,
        validation_fraction_split=validation_fraction_split,
        test_fraction_split=test_fraction_split,
        predefined_split_column_name=predefined_split_column_name,
        timestamp_split_column_name=timestamp_split_column_name,
        weight_column=weight_column,
        time_series_attribute_columns=time_series_attribute_columns,
        context_window=context_window,
        export_evaluated_data_items=export_evaluated_data_items,
        export_evaluated_data_items_bigquery_destination_uri=export_evaluated_data_items_bigquery_destination_uri,
        export_evaluated_data_items_override_destination=export_evaluated_data_items_override_destination,
        quantiles=quantiles,
        enable_probabilistic_inference=enable_probabilistic_inference,
        validation_options=validation_options,
        budget_milli_node_hours=budget_milli_node_hours,
        model_display_name=model_display_name,
        sync=sync,
    )

    model.wait()

    print(model.display_name)
    print(model.resource_name)
    print(model.uri)
    return model

Datenaufteilung mit REST steuern

Sie können steuern, wie Ihre Trainingsdaten auf die Trainings-, Validierungs- und Test-Datasets aufgeteilt werden. Verwenden Sie eine aufgeteilte Spalte, um die Datenaufteilung manuell für jede Zeile anzugeben und als Teil eines PredefinedSplit-Split-Objekts in der inputDataConfig der JSON-Anfrage bereitzustellen.

DATA_SPLIT_COLUMN ist die Spalte mit den Datenaufteilungswerten (TRAIN, VALIDATION, TEST).

"predefinedSplit": {
  "key": DATA_SPLIT_COLUMN
},

Weitere Informationen zur Datenaufteilung.

Rollierende Fensterstrategie mit REST konfigurieren

Geben Sie ein windowConfig-Objekt an, um eine Strategie für rollierende Fenster für die Generierung von Prognosefenstern zu konfigurieren. Die Standardstrategie ist maxCount.

Um die maxCount-Option zu verwenden, fügen Sie Folgendes dem trainingTaskInputs der JSON-Anfrage hinzu. MAX_COUNT_VALUE bezieht sich auf die maximale Anzahl an Fenstern.
```
  "windowConfig": {
    "maxCount": MAX_COUNT_VALUE
  },
  ```
```
Um die strideLength-Option zu verwenden, fügen Sie Folgendes dem trainingTaskInputs der JSON-Anfrage hinzu. STRIDE_LENGTH_VALUE bezieht sich auf den Wert der Schrittlänge.
```
  "windowConfig": {
    "strideLength": STRIDE_LENGTH_VALUE
  },
  ```
```
Um die column-Option zu verwenden, fügen Sie Folgendes dem trainingTaskInputs der JSON-Anfrage hinzu. COLUMN_NAME bezieht sich auf den Namen der Spalte mit True- oder False-Werten.
```
  "windowConfig": {
    "column": "COLUMN_NAME"
  },
  ```
```

Weitere Informationen finden Sie unter Strategien mit rollierenden Zeitfenstern.

Nächste Schritte

Modell bewerten

Prognosemodell trainieren Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Hinweise

Modell trainieren

Google Cloud Console

API

REST

curl (Linux, macOS oder Cloud Shell)

PowerShell (Windows)

Python

Datenaufteilung mit REST steuern

Rollierende Fensterstrategie mit REST konfigurieren

Nächste Schritte

Prognosemodell trainieren