다음 섹션에서는 Vertex AI Feature Store(기존) 데이터 모델을 소개하고 Vertex AI Feature Store(기존) 리소스와 구성요소를 설명하는 데 사용되는 용어를 설명합니다.
Vertex AI Feature Store(기존) 데이터 모델
Vertex AI Feature Store(기존)는 시계열 데이터 모델을 사용하여 특성의 일련의 값을 저장합니다. 이 모델을 사용하면 시간이 지나 변경되더라도 Vertex AI Feature Store(기존)가 특성 값을 유지할 수 있습니다. Vertex AI Feature Store(기존)는 Featurestore -> EntityType -> Feature
계층 구조로 리소스를 계층적으로 구성합니다. Vertex AI Feature Store(기존)로 데이터를 가져오려면 먼저 이러한 리소스를 만들어야 합니다.
예를 들어 BigQuery 테이블에서 다음과 같은 샘플 소스 데이터가 있다고 가정해 보겠습니다. 이 소스 데이터는 영화 및 영화의 특성에 관한 것입니다.
이 데이터를 Vertex AI Feature Store(기존)로 가져오려면 다른 모든 리소스의 최상위 컨테이너인 featurestore를 만들어야 합니다. featurestore에서 관련 특성을 그룹화하고 포함하는 항목 유형을 만듭니다. 그런 다음 소스 데이터의 특성에 매핑되는 특성을 만들 수 있습니다. 항목 유형 및 특성의 이름은 열 헤더 이름을 미러링할 수 있지만 필수는 아닙니다.
이 예시에서 movie_id
열 헤더는 항목 유형 movie
에 매핑될 수 있습니다. average_rating
, title
, genre
는 movie
항목 유형의 특성입니다. 각 열의 값은 항목 및 특성 값이라고 부르는 항목 유형 또는 특성의 특정 인스턴스에 매핑됩니다.
타임스탬프 열은 특성 값이 생성된 시점을 나타냅니다. featurestore에서 타임스탬프는 별도의 리소스 유형이 아닌 특성 값의 속성입니다. 모든 특성 값이 동시에 생성된 경우 타임스탬프 열이 필요하지 않습니다. 가져오기 요청의 일부로 타임스탬프를 지정할 수 있습니다.
피처스토어
featurestore는 항목 유형, 특성, 특성 값의 최상위 컨테이너입니다. 일반적으로 조직에서는 조직의 모든 팀에서 특성을 가져오고, 제공하고, 공유하기 위해 하나의 공유 featurestore를 만듭니다. 하지만 환경을 격리하기 위해 동일한 프로젝트 내에 여러 featurestore를 만들 수도 있습니다. 예를 들어 실험, 테스트, 프로덕션을 위해 별도의 featurestore를 사용할 수 있습니다.
항목 유형
항목 유형은 의미론적으로 관련된 특성의 모음입니다. 사용자는 사용 사례와 관련된 개념을 기반으로 자체 항목 유형을 정의합니다. 예를 들어 영화 서비스의 경우 영화 또는 고객에게 해당하는 관련 특성을 그룹화하는 항목 유형 movie
및 user
가 있을 수 있습니다.
항목
항목은 항목 유형의 인스턴스입니다. 예를 들어 movie_01
및 movie_02
는 movie
항목 유형의 항목입니다. featurestore에서 각 항목은 고유 ID가 있어야 하며 STRING
유형이어야 합니다.
특성
특성은 항목 유형의 측정 가능한 속성입니다. 예를 들어 movie
항목 유형에는 영화의 다양한 속성을 추적하는 average_rating
및 title
과 같은 특성이 있습니다. 특성은 항목 유형과 연결됩니다.
특성은 주어진 항목 유형 내에서 고유해야 하지만 전역으로 고유할 필요는 없습니다. 예를 들어 title
를 두 가지 다른 항목 유형에 사용하면 Vertex AI Feature Store(기존)는 title
를 두 가지 다른 특성으로 해석합니다. 특성 값을 읽을 때 요청의 일부로 특성 및 항목 유형을 제공합니다.
특성을 만들 때 BOOL_ARRAY
, DOUBLE
, DOUBLE_ARRAY
, STRING
과 같은 값 유형을 지정합니다. 이 값은 특정 특성과 관련해 가져올 수 있는 값 유형을 결정합니다. 지원되는 값 유형에 대한 자세한 내용은 API 참조의 valueType
을 참조하세요.
특성 값
Vertex AI Feature Store(기존)는 특정 시점의 특성에 대한 특성 값을 캡처합니다. 즉, 특정 항목 및 특성에 여러 값이 있을 수 있습니다. 예를 들어 movie_01
항목은 average_rating
특성에 대해 특성 값을 여러 개 가질 수 있습니다. 값은 한 번에 4.4
가 될 수 있고 나중에는 4.8
이 될 수 있습니다. Vertex AI Feature Store(기존)는 튜플 식별자를 각 특성 값(entity_id
, feature_id
, timestamp
)과 연결하며, Feature Store(기존)에서 제공 시점에 값을 조회하는 데 사용합니다.
Vertex AI Feature Store(기존)는 시간이 연속적이어도 개별 값을 저장합니다. t
시간에 기능 값을 요청하면 Vertex AI Feature Store(기존)가 t
시간 또는 그 이전에 최근에 저장된 값을 반환합니다. 예를 들어 Vertex AI Feature Store(기존)가 자동차 위치 정보를 100
및 110
시간에 저장하면 100
시간의 위치가 100
(포함)에서 110
(제외) 사이의 모든 시간의 요청에 사용됩니다. 더 높은 해상도가 필요하면 값 사이의 위치를 추론하거나 데이터 샘플링 레이트를 늘릴 수 있습니다.
특성 가져오기
특성 가져오기는 특성 추출 작업으로 계산한 특성 값을 featurestore로 가져오는 프로세스입니다. 데이터를 가져오려면 해당 항목 유형과 특성을 featurestore에 정의해야 합니다. Vertex AI Feature Store(기존)는 일괄 처리와 스트리밍 가져오기를 제공하므로 특성 값을 대량으로 또는 실시간으로 추가할 수 있습니다.
예를 들어 BigQuery 또는 Cloud Storage와 같은 위치에 있는 소스 데이터가 계산되었을 수 있습니다. 이러한 특성 값을 동일한 형식으로 제공할 수 있도록 이러한 소스의 데이터를 중앙 featurestore로 일괄 가져오기할 수 있습니다. 소스 데이터가 변경되면 스트리밍 가져오기를 사용하여 이러한 변경사항을 featurestore에 빠르게 가져올 수 있습니다. 이렇게 하면 온라인 제공 시나리오에 사용할 수 있는 최신 데이터를 얻을 수 있습니다.
자세한 내용은 특성 값 일괄 가져오기 또는 스트리밍 가져오기를 참조하세요.
특성 서빙
특성 제공은 학습 또는 추론을 위해 저장된 특성 값을 내보내는 프로세스입니다. Vertex AI Feature Store(기존)는 일괄 및 온라인이라는 두 가지 특성 제공 방법을 제공합니다. 일괄 제공은 높은 처리량과 오프라인 처리용 대용량 데이터를 제공(예: 모델 학습 또는 일괄 예측)하기 위한 것입니다. 온라인 제공은 실시간 처리(예: 온라인 예측)를 위해 소규모의 데이터 배치에서 지연 시간이 짧은 데이터를 검색하기 위한 것입니다.
항목 뷰
featurestore에서 값을 가져오면 서비스에서 요청한 특성 값이 포함된 항목 뷰를 반환합니다. 항목 뷰는 Vertex AI Feature Store(기존)가 온라인 또는 일괄 제공 요청에 반환하는 특성 및 값의 프로젝션이라고 생각하면 됩니다.
- 온라인 제공 요청의 경우 특정 항목 유형의 모든 또는 일부 특성을 가져올 수 있습니다.
- 일괄 제공 요청에서는 하나 이상의 항목 유형에 대한 모든 또는 일부 특성을 가져올 수 있습니다. 예를 들어 특성이 여러 항목 유형에 분산된 경우 이러한 특성을 결합하는 단일 요청에서 함께 검색할 수 있습니다. 그런 다음 결과를 사용하여 머신러닝이나 일괄 예측 요청에 피드할 수 있습니다.
데이터 내보내기
Vertex AI Feature Store(기존)를 사용하면 피처스토어에서 데이터를 내보내 특성 값을 백업하고 보관처리할 수 있습니다. 최신 특성 값(스냅샷)을 내보내거나 값 범위(전체 내보내기)를 내보낼 수 있습니다. 자세한 내용은 특성 값 내보내기를 참조하세요.
다음 단계
- Vertex AI Feature Store(기존)의 프로젝트 설정에 대해 알아보기
- 소스 데이터 요구사항 알아보기