Sie können eine Featuregruppe erstellen, um eine BigQuery-Tabelle oder ‐Ansicht zu registrieren, die Ihre Featuredaten enthält.
Für jede BigQuery-Tabelle oder -Ansicht, die Sie mit einer Featuregruppe verknüpfen, müssen Sie Folgendes sicherstellen:
Das Schema der Datenquelle entspricht dem Richtlinien für die Vorbereitung von Datenquellen
Die Datenquelle enthält die Entitäts-IDs als
string
-Werte in der Spalteentity_id
.Die Datenquelle enthält die Feature-Zeitstempel vom Typ
timestamp
in einer Spalte namensfeature_timestamp
Nachdem Sie eine Featuregruppe erstellt und die BigQuery-Daten verknüpft haben Quelle haben, können Sie Features erstellen, die mit den Spalten in der Datenquelle verknüpft werden. Sie können beim Erstellen der Featuregruppe eine Datenquelle angeben. Vor dem Erstellen von Features müssen Sie jedoch eine Datenquelle angeben.
Wenn Sie die Datenquelle mithilfe von Featuregruppen und Features registrieren, bestehen folgende Vorteile:
Sie können eine Featureansicht für die Onlinebereitstellung definieren. Verwenden Sie dazu bestimmte Featurespalten aus mehreren BigQuery-Datenquellen.
Sie können die Daten als Zeitreihe formatieren, indem Sie die Spalte
feature_timestamp
einfügen. Vertex AI Feature Store stellt nur die neuesten Featurewerte aus den Featuredaten bereit und schließt historische Werte aus.
Verwenden Sie das folgende Beispiel, um eine Featuregruppe zu erstellen und eine BigQuery-Datenquelle zu verknüpfen.
Console
Folgen Sie der Anleitung unten, um eine Featuregruppe mit der Google Cloud Console zu erstellen.
Rufen Sie im Abschnitt „Vertex AI“ der Google Cloud Console die Seite Feature Store auf.
Klicken Sie im Abschnitt Featuregruppen auf Erstellen, um den Bereich Allgemeine Informationen auf der Seite Featuregruppe erstellen zu öffnen.
Geben Sie den Namen der Featuregruppe an.
Optional: Klicken Sie auf Label hinzufügen und geben Sie den Namen und den Wert des Labels an. Sie können einer Featuregruppe mehrere Labels hinzufügen.
Klicken Sie im Feld BigQuery-Pfad auf Durchsuchen, um die BigQuery-Quelltabelle oder ‐ansicht auszuwählen, die mit der Featuregruppe verknüpft werden soll.
Optional: Klicken Sie in der Liste Entitäts-ID-Spalte auf die Entitäts-ID-Spalte in der BigQuery-Quelltabelle oder ‐ansicht.
Klicken Sie auf Weiter.
Klicken Sie im Bereich Register (Registrieren) auf eine der folgenden Optionen, um anzugeben, ob Sie der neuen Featuregruppe Features hinzufügen möchten:
Alle Spalten aus der BigQuery-Tabelle einschließen: Sie können in der Featuregruppe Features für alle Spalten in der BigQuery-Quelltabelle oder ‐ansicht erstellen.
Features manuell eingeben: Sie können Features basierend auf bestimmten Spalten in der BigQuery-Quelle erstellen. Geben Sie für jedes Feature einen Feature-Namen ein und klicken Sie in der Liste auf den Namen der entsprechenden BigQuery-Quellspalte.
Wenn Sie weitere Features hinzufügen möchten, klicken Sie auf Weiteres Feature hinzufügen.
Leere Featuregruppe erstellen: Sie erstellen die Featuregruppe, ohne ihr Features hinzuzufügen.
Klicken Sie auf Erstellen.
REST
So erstellen Sie eine FeatureGroup
-Ressource:
Senden Sie eine POST
-Anfrage mithilfe der
Methode featureGroups.create
.
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- LOCATION_ID: die Region, in der Sie die Featuregruppe erstellen möchten, z. B.
us-central1
. - ENTITY_ID_COLUMNS: Die Namen der Spalten mit den Entitäts-IDs. Sie können
entweder eine oder mehrere Spalten angeben.
- Wenn Sie nur eine Entitäts-ID-Spalte angeben möchten, geben Sie den Spaltennamen im folgenden Format an:
"entity_id_column_name"
- Wenn Sie mehrere Entitäts-ID-Spalten angeben möchten, geben Sie die Spaltennamen im folgenden Format an:
["entity_id_column_1_name", "entity_id_column_2_name", ...]
- Wenn Sie nur eine Entitäts-ID-Spalte angeben möchten, geben Sie den Spaltennamen im folgenden Format an:
- PROJECT_ID: Ihre Projekt-ID.
- FEATUREGROUP_NAME: der Name der neuen Featuregruppe, die Sie erstellen möchten.
- BIGQUERY_SOURCE_URI: URI der BigQuery-Quelltabelle oder -ansicht, die Sie für die Featuregruppe registrieren möchten.
HTTP-Methode und URL:
POST https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME
JSON-Text der Anfrage:
{ "big_query": { "entity_id_columns": "ENTITY_ID_COLUMNS", "big_query_source": { "input_uri": "BIGQUERY_SOURCE_URI" } } }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME" | Select-Object -Expand Content
Sie sollten in etwa folgende JSON-Antwort erhalten:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/featureGroups/FEATUREGROUP_NAME/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.UpdateFeatureGroupOperationMetadata", "genericMetadata": { "createTime": "2023-09-18T03:00:13.060636Z", "updateTime": "2023-09-18T03:00:13.060636Z" } } }
Nächste Schritte
Weitere Informationen zum Aktualisieren einer Featureansicht.
Erfahren Sie, wie Sie eine Featuregruppe löschen.