Datenmodell und Ressourcen

In den folgenden Abschnitten werden das Datenmodell und die Terminologie von Vertex AI Feature Store (Legacy) vorgestellt. Anhand dieses Datenmodells werden die Ressourcen und Komponenten von Vertex AI Feature Store (Legacy) beschrieben.

Vertex AI Feature Store-Datenmodell (Legacy)

Vertex AI Feature Store (Legacy) verwendet ein Zeitachsendatenmodell, um eine Reihe von Werten für Features zu speichern. Mit diesem Modell kann Vertex AI Feature Store (Legacy) Featurewerte beibehalten, wenn sie sich im Laufe der Zeit ändern. Vertex AI Feature Store (Legacy) organisiert Ressourcen in der folgenden Reihenfolge hierarchisch: Featurestore -> EntityType -> Feature. Sie müssen diese Ressourcen erstellen, bevor Sie Daten in den Vertex AI Feature Store (Legacy) importieren können.

Nehmen wir als Beispiel die folgenden Beispielquelldaten aus einer BigQuery-Tabelle an. Bei diesen Quelldaten geht es um Filme und deren Features.

Grafik: Beschreibt, wie Quelldaten dem Vertex AI Feature Store-Datenmodell (Legacy) zugeordnet werden

Bevor Sie diese Daten in Vertex AI Feature Store (Legacy) importieren können, müssen Sie einen Featurestore erstellen. Dies ist ein Container auf oberster Ebene für alle anderen Ressourcen. Erstellen Sie im Feature Store Entitätstypen, die diese Features gruppieren und verwandte Features enthalten. Sie können dann Features erstellen, die Features in Ihren Quelldaten entsprechen. Die Namen des Entitätstyps und der Features können die Spaltenüberschriften widerspiegeln. Dies ist jedoch nicht erforderlich.

In diesem Beispiel kann die Spaltenüberschrift movie_id einem Entitätstyp movie zugeordnet werden. Die Features average_rating, title und genre sind Features des Entitätstyps movie. Die Werte in den einzelnen Spalten entsprechen bestimmten Instanzen eines Entitätstyps oder von Features, die als Entitäten und Featurewerte bezeichnet werden.

In der Zeitstempelspalte wird angezeigt, wann die Featurewerte generiert wurden. Im Featurestore sind die Zeitstempel ein Attribut der Featurewerte und kein separater Ressourcentyp. Wenn alle Featurewerte gleichzeitig generiert wurden, müssen Sie keine Zeitstempelspalte haben. Sie können den Zeitstempel als Teil Ihrer Importanfrage angeben.

Feature Store

Ein Featurestore ist der übergeordnete Container für Entitätstypen, Features und Featurewerte. In der Regel erstellt eine Organisation einen gemeinsamen Featurestore, um Features für alle Teams der Organisation zu importieren, bereitzustellen und freizugeben. Manchmal kann es jedoch sinnvoll sein, mehrere Feature Stores innerhalb desselben Projekts zu erstellen, um Umgebungen zu isolieren. Beispielsweise könnten Sie separate Featurestores für Experimente, Tests und die Produktion verwenden.

Entitätstyp

Ein Entitätstyp ist eine Sammlung semantisch verwandter Features. Sie definieren eigene Entitätstypen anhand der für Ihren Anwendungsfall relevanten Konzepte. Ein Filmdienst kann beispielsweise die Entitätstypen movie und user haben, die verwandte Features gruppieren, die Filmen oder Kunden entsprechen.

Entity

Eine Entität ist eine Instanz eines Entitätstyps. Beispiel: movie_01 und movie_02 sind Entitäten des Entitätstyps movie. In einem Feature Store muss jede Entität eine eindeutige ID haben und vom Typ STRING sein.

Feature

Ein Feature ist eine messbare Eigenschaft oder ein Attribut eines Entitätstyps. Der Entitätstyp movie hat beispielsweise Features wie average_rating und title, mit denen verschiedene Eigenschaften von Filmen erfasst werden. Features sind mit Entitätstypen verknüpft. Features müssen innerhalb eines bestimmten Entitätstyps, aber nicht global eindeutig sein. Wenn Sie beispielsweise title für zwei verschiedene Entitätstypen verwenden, interpretiert Vertex AI Feature Store (Legacy) title als zwei verschiedene Features. Wenn Sie Featurewerte lesen, geben Sie das Feature und seinen Entitätstyp als Teil der Anfrage an.

Wenn Sie ein Feature erstellen, geben Sie den Werttyp an, z. B. BOOL_ARRAY, DOUBLE, DOUBLE_ARRAY und STRING. Von diesem Wert hängt ab, welche Werttypen Sie für ein bestimmtes Feature importieren können. Weitere Informationen zu den unterstützten Werttypen finden Sie unter valueType in der API-Referenz.

Featurewert

Vertex AI Feature Store (Legacy) erfasst Featurewerte für ein Feature zu einem bestimmten Zeitpunkt. Mit anderen Worten: Sie können mehrere Werte für eine bestimmte Entität und ein bestimmtes Feature haben. Die Entität movie_01 kann beispielsweise mehrere Featurewerte für das Feature average_rating haben. Der Wert kann 4.4 und später 4.8 sein. Vertex AI Feature Store (Legacy) ordnet jedem Featurewert (entity_id, feature_id, timestamp) eine Tupel-ID zu, die von Vertex AI Feature Store (Legacy) verwendet wird, um Werte zum Zeitpunkt der Bereitstellung zu suchen.

Vertex AI Feature Store (Legacy) speichert diskrete Werte, obwohl die Zeit kontinuierlich ist. Wenn Sie einen Featurewert zur Zeit t anfordern, gibt Vertex AI Feature Store (Legacy) den neuesten zur oder vor der Zeit t gespeicherten Wert zurück. Beispiel: Wenn der Vertex AI Feature Store (Legacy) die Standortinformationen eines Autos zu den zeiten 100 und 110 speichert, wird der Standort zur Zeit 100 für Anfragen zu allen Zeiten zwischen 100 (inklusiv) und 110 (exklusiv) genutzt. Wenn Sie eine höhere Auflösung benötigen, können Sie beispielsweise den Standort zwischen Werten ableiten oder die Daten-Abtastrate erhöhen.

Feature-Import

Der Feature-Import ist der Vorgang, bei dem Featurewerte, die von Ihren Feature-Engineering-Jobs berechnet wurden, in einen Featurestore importiert werden. Bevor Sie Daten importieren können, müssen der entsprechende Entitätstyp und die entsprechenden Features im Featurestore definiert werden. Vertex AI Feature Store (Legacy) bietet Batch- und Streamingimport, sodass Sie Featurewerte im Bulk oder in Echtzeit hinzufügen können.

Beispiel: Sie haben berechnete Quelldaten, die sich an Standorten wie BigQuery oder Cloud Storage befinden. Sie können Daten aus diesen Quellen in einem zentralen Feature Store importieren, sodass diese Featurewerte in einem einheitlichen Format bereitgestellt werden können. Wenn sich Ihre Quelldaten ändern, können Sie diese über die Streamingimport schnell in Ihren Feature Store übertragen. Auf diese Weise haben Sie die neuesten Daten für Onlinebereitstellungsszenarien.

Weitere Informationen finden Sie unter Featurewerte für Batch-Import oder Streaming-Import.

Bereitstellung von Features

Das Bereitstellen von Features ist der Export gespeicherter Featurewerte für Training oder Inferenz. Vertex AI Feature Store (Legacy) bietet zwei Methoden zur Bereitstellung von Features: Batch und Online. Die Batchbereitstellung ermöglicht einen hohen Durchsatz und die Bereitstellung großer Datenmengen zur Offlineverarbeitung (z. B. für Modelltraining oder Batchvorhersagen). Die Onlinebereitstellung dient zum Abrufen von kleinen Datenbatches mit niedriger Latenz für die Echtzeitverarbeitung (z. B. für Onlinevorhersagen).

Weitere Informationen finden Sie unter Online- oder Batchbereitstellung.

Entitätsansicht

Wenn Sie Werte aus einem Featurestore abrufen, gibt der Dienst eine Entitätsansicht mit den von Ihnen angeforderten Featurewerten zurück. Sie können sich eine Entitätsansicht als Projektion der Features und Werte vorstellen, die Vertex AI Feature Store (Legacy) aus einer Online- oder Batchbereitstellungsanfrage zurückgibt:

  • Bei Onlinebereitstellungsanfragen können Sie alle oder einen Teil der Features für einen bestimmten Entitätstyp abrufen.
  • Bei Batchbereitstellungsanfragen können Sie alle oder einen Teil der Features für einen oder mehrere Entitätstypen abrufen. Wenn beispielsweise Features auf mehrere Entitätstypen verteilt sind, können Sie sie in einer einzigen Anfrage abrufen, die diese Features miteinander verbindet. Anschließend können Sie die Ergebnisse an eine Anfrage für maschinelles Lernen oder Batchvorhersagen übergeben.

Daten exportieren

Mit Vertex AI Feature Store (Legacy) können Sie Daten aus Ihren Feature Stores exportieren, um Featurewerte zu sichern und zu archivieren. Sie können die neuesten Featurewerte (Snapshot) oder einen Wertebereich (vollständiger Export) exportieren. Weitere Informationen finden Sie unter Featurewerte exportieren.

Nächste Schritte