将特征数据同步到在线存储区

数据同步是从 BigQuery 中的特征数据源刷新或同步在线存储区的特征视图中的数据的过程。如需同步整个在线存储区的数据,您需要同步其所有特征视图的数据。

功能视图进行数据同步的方式有两种:

  • 定期数据同步:根据使用 FeatureView.sync_config 参数为特征视图配置的同步时间表,自动刷新特征数据。

  • 手动数据同步:您可以通过为特征视图手动启动数据同步,跳过两个定期数据同步操作之间的等待。

数据同步可能会产生 BigQuery 资源使用费。如需了解在为特征视图设置同步时间表时如何优化费用,请参阅在同步期间优化费用

准备工作

向 Vertex AI 进行身份验证,除非您已完成此操作。

如需在本地开发环境中使用本页面上的 REST API 示例,请使用您提供给 gcloud CLI 的凭据。

    Install the Google Cloud CLI, then initialize it by running the following command:

    gcloud init

如需了解详情,请参阅 Google Cloud 身份验证文档中的使用 REST 时进行身份验证

手动启动数据同步

使用以下示例可在特征视图中手动启动数据同步。请注意,在任何时候,一个特征视图都只能有一个数据同步操作处于活动状态。如果正在进行另一个同步期间尝试手动启动数据同步,则新的同步操作只会在正在进行的同步操作结束后才开始。

REST

如需在 FeatureView 中手动启动数据同步,请使用 featureViews.sync 方法发送 POST 请求。

在使用任何请求数据之前,请先进行以下替换:

  • LOCATION_ID:在线存储区所在的区域,例如 us-central1
  • PROJECT_ID:您的项目 ID。
  • FEATUREONLINESTORE_NAME:包含特征视图的在线存储区的名称。
  • FEATUREVIEW_NAME:您要在其中手动启动数据同步的特征视图的名称。

HTTP 方法和网址:

POST https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureOnlineStores/FEATUREONLINESTORE_NAME/featureViews/FEATUREVIEW_NAME:sync

如需发送请求,请选择以下方式之一:

curl

执行以下命令:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d "" \
"https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureOnlineStores/FEATUREONLINESTORE_NAME/featureViews/FEATUREVIEW_NAME:sync"

PowerShell

执行以下命令:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-Uri "https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureOnlineStores/FEATUREONLINESTORE_NAME/featureViews/FEATUREVIEW_NAME:sync" | Select-Object -Expand Content

您应该收到类似以下内容的 JSON 响应:

{
  "featureViewSync": "projects/PROJECT_ID/locations/LOCATION_ID/featureOnlineStores/FEATUREONLINESTORE_NAME/featureViews/FEATUREVIEW_NAME/featureViewSyncs/OPERATION_ID"
}

后续步骤