Einführung in Vertex AI Feature Store (Legacy)

Vertex AI Feature Store (Legacy) bietet ein zentrales Repository zum Organisieren, Speichern und Bereitstellen von ML-Features. Mithilfe eines zentralen Feature Store kann eine Organisation ML-Features im großen Maßstab effizient gemeinsam nutzen, erkennen und wiederverwenden. Dadurch kann die Entwicklung und Bereitstellung neuer ML-Anwendungen schneller erfolgen.

Vertex AI Feature Store (Legacy) ist eine vollständig verwaltete Lösung, die die zugrunde liegende Infrastruktur wie Speicher- und Rechenressourcen verwaltet und skaliert. Diese Lösung bedeutet, dass sich Ihre Data Scientists auf die Logik der Featureberechnung konzentrieren können, anstatt sich mit den Herausforderungen bei der Bereitstellung von Features in der Produktion befassen zu müssen.

Vertex AI Feature Store (Legacy) ist ein integrierter Bestandteil von Vertex AI. Sie können den Vertex AI Feature Store (Legacy) unabhängig oder als Teil von Vertex AI-Workflows verwenden. Sie können beispielsweise Daten aus Vertex AI Feature Store (Legacy) abrufen, um benutzerdefinierte oder AutoML-Modelle in Vertex AI zu trainieren.

Vertex AI Feature Store (Legacy) ist der Vorgänger von Vertex AI Feature Store. Weitere Informationen zu Vertex AI Feature Store finden Sie in der Dokumentation zu Vertex AI Feature Store.

Überblick

Mit Vertex AI Feature Store (Legacy) können Sie Feature Stores, Entitätstypen und Features erstellen und verwalten. Ein Featurestore ist ein Container auf oberster Ebene für Ihre Features und deren Werte. Wenn Sie einen Feature Store einrichten, können zulässige Nutzer ihre Features ohne zusätzlichen technischen Support hinzufügen und teilen. Nutzer können Features definieren und dann Featurewerte aus verschiedenen Datenquellen importieren. Weitere Informationen zum Datenmodell und zu den Ressourcen von Vertex AI Feature Store (Legacy)

Jeder zulässige Nutzer kann Werte im Featurestore suchen und abrufen. Beispielsweise haben Sie die Möglichkeit, Features zu finden und dann einen Batch-Export durchzuführen, um Trainingsdaten für die Erstellung von ML-Modellen abzurufen. Sie können Featurewerte auch in Echtzeit abrufen, um schnelle Onlinevorhersagen durchzuführen.

Vorteile

Bevor Sie Vertex AI Feature Store (Legacy) verwenden, haben Sie möglicherweise Featurewerte berechnet und an verschiedenen Stellen wie in Tabellen in BigQuery und als Dateien in Cloud Storage gespeichert. Darüber hinaus haben Sie möglicherweise separate Lösungen zum Speichern und Nutzen von Featurewerten erstellt und verwaltet. Im Gegensatz dazu bietet Vertex AI Feature Store (Legacy) eine einheitliche Lösung für Batch- und Onlinespeicher sowie für die Bereitstellung von ML-Features. In den folgenden Abschnitten werden die Vorteile von Vertex AI Feature Store (Legacy) erläutert.

Features innerhalb der Organisation freigeben

Wenn Sie Features in einem Featurestore erstellt haben, können Sie sie für Trainings- oder Bereitstellungsaufgaben schnell mit anderen teilen. Teams müssen Features nicht für verschiedene Projekte oder Anwendungsfälle neu entwickeln. Da Sie Features über ein zentrales Repository verwalten und bereitstellen können, können Sie außerdem die Konsistenz in Ihrer Organisation aufrechterhalten und doppelte Arbeit reduzieren, insbesondere bei sehr nützlichen Features.

Vertex AI Feature Store (Legacy) bietet Such- und Filterfunktionen, damit andere vorhandene Features finden und wiederverwenden können. Für jedes Feature können Sie relevante Metadaten aufrufen, um die Qualitäts- und Nutzungsmuster des Features zu bestimmen. Sie können beispielsweise den Anteil der Entitäten abrufen, die einen gültigen Wert für ein Feature haben (auch als Feature-Abdeckung bezeichnet), und sich die statistische Verteilung der Featurewerte ansehen.

Verwaltete Lösung für die Onlinebereitstellung im großen Maßstab

Vertex AI Feature Store (Legacy) bietet eine verwaltete Lösung für die Bereitstellung von Onlinefeatures mit niedriger Latenz, was für zeitnahe Onlinevorhersagen entscheidend ist. Sie müssen keine Infrastruktur zur Datenbereitstellung mit niedriger Latenz aufbauen und betreiben. Vertex AI Feature Store (Legacy) übernimmt dies für Sie und skaliert bei Bedarf. Sie programmieren die Logik so, dass Features generiert werden, geben aber die Aufgabe der Bereitstellung von Features ab. All diese enthaltenen Verwaltungsfunktionen vereinfachen das Erstellen neuer Features. So können Data Scientists ihre Arbeit erledigen, ohne sich Gedanken über die Bereitstellung machen zu müssen.

Abweichungen zwischen Training und Bereitstellung vermeiden

Abweichungen zwischen Training und Bereitstellung treten auf, wenn die Featuredaten-Verteilung, die Sie in der Produktion verwenden, von der Featuredaten-Verteilung abweicht, die zum Trainieren Ihres Modells verwendet wurde. Diese Abweichungen führen oft zu Diskrepanzen zwischen der Leistung eines Modells während des Trainings und seiner Leistung in der Produktion. In den folgenden Beispielen wird beschrieben, wie Vertex AI Feature Store (Legacy) potenzielle Quellen für Abweichungen zwischen Training und Bereitstellung beheben kann:

  • Vertex AI Feature Store (Legacy) sorgt dafür, dass ein Featurewert einmal in einen Featurestore importiert und derselbe Wert für Training und Bereitstellung wiederverwendet wird. Ohne einen Featurestore haben Sie möglicherweise verschiedene Codepfade zum Generieren von Features zwischen Training und Bereitstellung. Daher können sich die Featurewerte zwischen Training und Bereitstellung unterscheiden.
  • Vertex AI Feature Store (Legacy) bietet eine Suche zu einem bestimmten Zeitpunkt, um Verlaufsdaten für das Training abzurufen. Mit diesen Suchvorgängen können Sie Datenverluste verringern, indem Sie nur die Featurewerte abrufen, die vor der Vorhersage und nicht danach verfügbar waren.

Weitere Informationen zum Erkennen von Abweichungen zwischen Training und Bereitstellung finden Sie unter Merkmalswertanomalien ansehen.

Drift erkennen

Mit Vertex AI Feature Store (Legacy) können Sie erhebliche Änderungen an der Featuredatenverteilung im Laufe der Zeit erkennen, was auch als Drift bezeichnet wird. Vertex AI Feature Store (Legacy) verfolgt kontinuierlich die Verteilung von Featurewerten, die in den Feature Store importiert werden. Wenn die Drift von Features zunimmt, müssen Sie möglicherweise Modelle neu trainieren, die die betroffenen Features verwenden. Weitere Informationen zum Erkennen von Abweichungen finden Sie unter Merkmalswertanomalien ansehen.

Kontingente und Limits

In Vertex AI Feature Store (Legacy) werden Kontingente und Limits durchgesetzt, um Sie bei der Verwaltung der Ressourcen zu unterstützen, indem Sie eigene Nutzungslimits festlegen, und um die Community der Google Cloud-Nutzer zu schützen, indem unvorhergesehene Nutzungsspitzen verhindert werden. Prüfen Sie auf der Seite Kontingente und Limits die Kontingente für Vertex AI Feature Store (Legacy), um ungeplante Einschränkungen zu vermeiden. Beispielsweise legt Vertex AI Feature Store (Legacy) ein Kontingent für die Anzahl der Online-Bereitstellungsknoten und ein Kontingent für die Anzahl der Online-Bereitstellungsanfragen fest, die Sie pro Minute stellen können.

Datenaufbewahrung

Vertex AI Feature Store (Legacy) behält die Merkmalswerte bis zum Datenaufbewahrungslimit bei. Dieses Limit basiert auf dem Zeitstempel, der mit den Featurewerten verknüpft ist, nicht auf dem Zeitpunkt, zu dem die Werte importiert wurden. Vertex AI Feature Store (Legacy) plant das Löschen von Werten mit Zeitstempeln, die das Limit überschreiten.

Preise

Die Preise für Vertex AI Feature Store (Legacy) hängen von mehreren Faktoren ab, z. B. davon, wie viele Daten Sie speichern und wie viele Feature-Store-Onlineknoten Sie verwenden. Die Gebühren beginnen direkt nach dem Erstellen eines Feature Stores. Weitere Informationen finden Sie unter Preise für Vertex AI Feature Store (Legacy).

Nächste Schritte