Vertex AI Feature Store를 사용하여 온라인으로 특성을 서빙하려면 먼저 다음과 같이 BigQuery에서 특성 데이터 소스를 설정해야 합니다.
특성 데이터를 사용하여 BigQuery 테이블이나 뷰를 만듭니다. 특성 데이터를 BigQuery 테이블이나 뷰에 로드하려면 데이터를 사용하여 BigQuery 데이터 세트를 만들고 BigQuery 테이블을 만든 후 특성 데이터를 데이터 세트에서 테이블로 로드하면 됩니다.
BigQuery 테이블 또는 뷰에 특성 데이터를 로드한 후에는 온라인 서빙을 위해 이 데이터 소스를 Vertex AI Feature Store에 제공해야 합니다. 온라인 스토어 및 특성 뷰 인스턴스와 같은 두 가지 방법으로 데이터 소스를 온라인 서빙 리소스에 연결할 수 있습니다.
특성 그룹과 특성을 만들어 데이터 소스 등록: 온라인 스토어의 특성 뷰 인스턴스와 특성 그룹 및 특성을 연결할 수 있습니다. 다음 두 가지 방법 중 하나로 데이터 형식을 지정할 수 있습니다.
특성 타임스탬프 열을 포함하여 데이터 형식을 시계열로 지정합니다. Vertex AI Feature Store는 이 열의 특성 타임스탬프를 기준으로 각 고유 엔티티 ID에 최신 특성 값만 서빙합니다.
특성 타임스탬프 열을 포함하지 않고 데이터 형식을 지정합니다.
Vertex AI Feature Store는 타임스탬프를 관리하고 각 고유 엔티티 ID의 최신 특성 값만 제공합니다.
특성 그룹을 만드는 방법은 특성 그룹 만들기를 참조하세요. 특성 그룹 내에서 특성을 만드는 방법은 특성 만들기를 참조하세요.
특성 그룹과 특성을 만들지 않고 데이터 소스에서 직접 특성 제공: 특성 뷰에서 데이터 소스 URI를 지정할 수 있습니다.
이 시나리오에서는 데이터의 형식을 시계열로 지정하거나 BigQuery 소스에 이전 데이터를 포함할 수 없습니다. 각 행에는 고유 ID에 해당하는 최신 특성 값이 포함되어야 합니다. 여러 행에 동일한 항목 ID가 여러 번 나타나는 것은 지원되지 않습니다.
Vertex AI Feature Store를 사용하면 BigQuery에서 특성 데이터를 유지하고 BigQuery 데이터 소스에서 특성을 서빙할 수 있으므로 오프라인 스토어로 특성을 가져오거나 복사할 필요가 없습니다.
데이터 소스 준비 가이드라인
BigQuery에서 데이터 소스를 준비하는 동안 다음 가이드라인을 따라 스키마와 제약조건을 이해합니다.
데이터 소스에 다음 열을 포함합니다.
엔티티 ID 열: 데이터 소스에 string 또는 int 값이 있는 엔티티 ID 열이 하나 이상 있어야 합니다. 이 열의 기본 이름은 entity_id입니다. 원하는 경우 이 열에 다른 이름을 사용할 수 있습니다. 이 열에 있는 각 값의 크기는 4KB 미만이어야 합니다.
여러 열의 특성을 사용하여 엔티티 ID를 구성하여 특성 레코드를 지정할 수도 있습니다. 이 시나리오에서는 데이터 소스에 여러 엔티티 ID 열을 포함할 수 있습니다. 각 엔티티 ID 열의 이름은 고유해야 합니다. 특성 그룹을 만들어 데이터 소스를 등록하는 경우 각 특성 그룹의 엔티티 ID 열을 설정합니다.
또는 데이터 소스를 특성 뷰와 직접 연결하는 경우 특성 뷰를 구성하여 엔티티 ID 열을 지정합니다.
데이터 소스에 여러 ID 열을 포함할 수 있습니다. 이러한 시나리오에서는 각 엔티티 ID 열의 이름이 고유해야 합니다. 특성 레코드의 각 열 값을 사용하여 엔티티 ID를 구성하도록 특성 그룹 또는 특성 뷰를 구성할 수 있습니다.
특성 타임스탬프 열: 선택사항. 특성 그룹과 특성을 사용하여 데이터 소스를 등록하고 데이터의 형식을 시계열로 지정해야 하는 경우 특성 타임스탬프 열을 포함합니다. 타임스탬프 열에는 timestamp 유형 값이 포함됩니다. 타임스탬프 열의 기본 이름은 feature_timestamp입니다. 다른 열 이름을 사용하려면 time_series 파라미터를 사용하여 특성 그룹의 타임스탬프 열을 설정하세요.
데이터 형식을 시계열로 지정하기 위해 타임스탬프 열을 지정하지 않으면 Vertex AI Feature Store가 특성의 타임스탬프를 관리하고 최신 특성 값을 제공합니다.
BigQuery 데이터 소스를 특성 뷰와 직접 연결하는 경우에는 feature_timestamp 열이 필요하지 않습니다. 이 시나리오에서는 데이터 소스에 최신 특성 값만 포함해야 하며 Vertex AI Feature Store는 타임스탬프를 조회하지 않습니다.
열 임베딩 및 필터링: 선택사항. 최적화된 온라인 서빙을 위해 만든 온라인 스토어에서 임베딩 관리를 사용하려면 데이터 소스에 다음 열이 포함되어야 합니다.
float 유형의 배열이 포함된 embedding 열
선택사항: string 또는 string 배열 유형의 필터링 열 한 개 이상
선택사항: int 유형의 크라우딩 열
데이터 소스의 각 행은 엔티티 ID와 연결된 특성 값의 전체 레코드입니다. 특성 값이 열 중 하나에서 누락되면 null 값으로 간주됩니다.
BigQuery 테이블이나 뷰의 각 열은 특성을 나타냅니다.
각 특성 값을 별도의 열에 제공합니다. 데이터 소스를 특성 그룹 및 특성과 연결하는 경우 각 열을 별도의 특성과 연결합니다.
특성 값에 지원되는 데이터 유형에는 bool, int, float, string, timestamp, 이러한 데이터 유형의 배열, 바이트가 포함됩니다. 데이터 동기화 중에 timestamp 유형의 특성 값이 int64로 변환됩니다.
데이터 소스는 온라인 스토어 인스턴스와 동일한 리전 또는 온라인 스토어의 리전이 포함되거나 겹치는 멀티 리전에 있어야 합니다. 예를 들어 온라인 스토어가 us-central에 있으면 BigQuery 소스가 us-central 또는 US에 있을 수 있습니다.
최신 특성 값만 제공하도록 온라인 서빙 전에 특성 뷰의 데이터를 동기화합니다.
예약된 데이터 동기화를 사용하는 경우 특성 뷰에서 데이터를 수동으로 동기화해야 할 수 있습니다.
하지만 최적화된 온라인 서빙과 함께 연속 데이터 동기화를 사용하는 경우에는 데이터를 수동으로 동기화할 필요가 없습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["이해하기 어려움","hardToUnderstand","thumb-down"],["잘못된 정보 또는 샘플 코드","incorrectInformationOrSampleCode","thumb-down"],["필요한 정보/샘플이 없음","missingTheInformationSamplesINeed","thumb-down"],["번역 문제","translationIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-09-04(UTC)"],[],[],null,["# Prepare data source\n\nBefore you can start serving features online using\nVertex AI Feature Store, you need to set up your feature data source in\nBigQuery, as follows:\n\n1. Create a BigQuery table or view using your feature data. To load\n feature data into a BigQuery table or view, you can create a\n BigQuery dataset using the data, create a BigQuery\n table, and then load the feature data from the dataset into the table.\n\n2. After you load the feature data into the BigQuery table or\n view, you need to make this data source available to\n Vertex AI Feature Store for online serving. There are two ways in\n which you can connect the data source to online serving resources, such as\n online stores and feature view instances:\n\n - **Register the data source by creating feature groups and features:**\n You can associate feature groups and features with feature view instances\n in your online store. You can format the data in either of the following ways:\n\n - Format your data as a time series by including a feature timestamp\n column. Vertex AI Feature Store serves only the latest\n feature values for each unique entity ID, based on the feature\n timestamp in this column.\n\n - Format the data without including a feature timestamp columns.\n Vertex AI Feature Store manages the timestamps and serves\n only the latest feature values for each unique entity ID.\n\n For information about how to create feature groups, see\n [Create a feature group](/vertex-ai/docs/featurestore/latest/create-featuregroup). For\n information about how to create features within a feature group, see\n [create a feature](/vertex-ai/docs/featurestore/latest/create-feature).\n - **Directly serve features from the data source without creating feature groups and features:**\n You can specify the URI of the data source in the feature view.\n Note that in this scenario, you can't format your data as a time series or\n include historical data in the BigQuery source. Each row must contain\n the latest feature values corresponding to a unique ID. Multiple occurrences\n of the same entity ID in different rows are not supported.\n\nSince Vertex AI Feature Store lets you maintain feature data\nin BigQuery and serves features from the BigQuery\ndata source, there's no need to import or copy the features to an offline\nstore.\n\nData source preparation guidelines\n----------------------------------\n\nFollow these guidelines to understand the schema and constraints while preparing\nthe data source in BigQuery:\n\n1. Include the following columns in the data source:\n\n - **Entity ID columns** : The data source must have at least one entity ID\n column with `string` or `int` values. The default name for this column is\n `entity_id`. You can optionally use a different name for this column. The\n size of each value in this column must be less than 4 KB.\n\n Note that you can also designate a feature record by constructing the entity\n ID using features from multiple columns. In this scenario, you can include\n multiple entity ID columns in the data source. The name of each entity ID\n column must be unique. If you register the data source by creating feature\n groups, set the entity ID columns for each feature group.\n Otherwise, if you directly associate the data source with a feature view,\n configure the feature views to specify the entity ID columns.\n\n Note that you can include multiple ID columns in a data source. In such a\n scenario, the name of each entity ID column must be unique. You can\n configure your feature groups or feature views to construct the entity ID\n using the values from each column for a feature record.\n - **Feature timestamp column** : Optional. If you register the data source\n using feature groups and features, and need to format the data as a time\n series, include a feature timestamp column. The timestamp column contains\n values of type `timestamp`. The default name for the timestamp column is\n `feature_timestamp`. If you want to use a different column name, use the\n `time_series` parameter to set the timestamp column for the feature group.\n\n If you don't specify a timestamp column to format your data as a time series,\n Vertex AI Feature Store manages the timestamps for the features\n and serves the latest feature values.\n\n If you directly associate a BigQuery data source with a feature\n view, the `feature_timestamp` column isn't required. In this scenario, you\n must include only the latest feature values in the data source and\n Vertex AI Feature Store doesn't look up the timestamp.\n - **Embedding and filtering columns**: Optional. If you want to use embedding\n management in an online store created for Optimized online serving, the\n data source must contain the following columns:\n\n - An `embedding` column containing arrays of type `float`.\n\n - Optional: One or more filtering columns of type `string` or `string` array.\n\n - Optional: A crowding column of type `int`.\n\n2. Each row in data source is a complete record of feature values associated\n with an entity ID. If a feature value is missing in one of the columns, then\n it's considered a null value.\n\n3. Each column of the BigQuery table or view represents a feature.\n Provide the values for each feature in a separate column. If you're associating\n the data source with a feature group and features, associate each column with a separate feature.\n\n4. Supported data types for feature values include `bool`, `int`, `float`,\n `string`, `timestamp`, arrays of these data types, and bytes. Note that during\n [data sync](/vertex-ai/docs/featurestore/latest/sync-data), feature values of type `timestamp` are converted to\n `int64`.\n\n5. The data source must be located in the same region as the online store\n instance, or in a multi-region that includes or overlaps with the region for the\n online store. For example, if the online store is in `us-central`, the\n BigQuery source might be located in `us-central` or `US`.\n\n6. [Sync the data in a feature view](/vertex-ai/docs/featurestore/latest/create-featureview#sync_featuredata)\n before online serving to ensure that you serve only the latest feature values.\n If you're using scheduled data sync, you might need to [manually sync the data\n in the feature view](/vertex-ai/docs/featurestore/latest/sync-data).\n However, if you're using continuous data sync with Optimized online serving,\n then you don't need to manually sync the data.\n\nWhat's next\n-----------\n\n- Learn how to create [feature groups](/vertex-ai/docs/featurestore/latest/create-featuregroup) and [features](/vertex-ai/docs/featurestore/latest/create-feature).\n\n- Learn how to [create a feature view](/vertex-ai/docs/featurestore/latest/create-featureview).\n\n- [Online serving types](/vertex-ai/docs/featurestore/latest/online-serving-types) in Vertex AI Feature Store."]]