특성 그룹 만들기

특성 그룹을 만들어 특성 데이터가 포함된 BigQuery 테이블 또는 뷰를 등록할 수 있습니다.

특성 그룹과 연결된 모든 BigQuery 테이블 또는 뷰의 경우 다음을 확인해야 합니다.

  • 데이터 소스의 스키마가 데이터 소스 준비 가이드라인을 준수합니다.

  • 데이터 소스의 entity_id 열에 string 값으로 항목 ID가 포함됩니다.

  • 데이터 소스의 feature_timestamp 열에 timestamp 유형의 특성 타임스탬프가 포함됩니다.

특성 그룹을 만들고 BigQuery 데이터 소스를 연결한 후에는 특성을 만들어 데이터 소스의 열과 연결할 수 있습니다. 특성 그룹을 만드는 동안 데이터 소스를 지정하는 것은 선택사항입니다. 하지만 특성을 만들기 전에 데이터 소스를 지정해야 합니다.

특성 그룹과 특성을 사용하여 데이터 소스를 등록하면 다음과 같은 이점이 있습니다.

  • 여러 BigQuery 데이터 소스의 특정 특성 열을 사용하여 온라인 서빙을 위한 특성 뷰를 정의할 수 있습니다.

  • feature_timestamp 열을 포함하여 데이터의 형식을 시계열로 지정할 수 있습니다. Vertex AI Feature Store는 특성 데이터의 최신 특성 값만 서빙하며 이전 값은 제외합니다.

다음 샘플을 사용하여 특성 그룹을 만들고 BigQuery 데이터 소스를 연결합니다.

콘솔

Google Cloud 콘솔을 사용하여 특성 그룹을 만들려면 다음 안내를 따르세요.

  1. Google Cloud 콘솔의 Vertex AI 섹션에서 Feature Store 페이지로 이동합니다.

    Feature Store 페이지로 이동

  2. 특성 그룹 섹션에서 만들기를 클릭하여 특성 그룹 만들기 페이지에서 기본 정보 창을 엽니다.

  3. 특성 그룹 이름을 지정합니다.

  4. 선택사항: 라벨을 추가하려면 라벨 추가를 클릭하고 라벨 이름과 값을 지정합니다. 특성 그룹에 여러 라벨을 추가할 수 있습니다.

  5. BigQuery 경로 필드에서 찾아보기를 클릭하여 특성 그룹과 연결할 BigQuery 소스 테이블 또는 뷰를 선택합니다.

  6. 선택사항: 엔티티 ID 열 목록에서 BigQuery 소스 테이블 또는 뷰의 엔티티 ID 열을 클릭합니다.

  7. 계속을 클릭합니다.

  8. 등록 창에서 다음 옵션 중 하나를 클릭하여 새 특성 그룹에 특성을 추가할지 여부를 나타냅니다.

    • BigQuery 테이블의 모든 열 포함—BigQuery 소스 테이블 또는 뷰의 모든 열에 대해 특성 그룹 내에 특성을 만듭니다.

    • 특성 수동 입력—BigQuery 소스의 특정 열을 기준으로 특성을 만듭니다. 각 특성에 대해 특성 이름을 입력하고 목록에서 해당 BigQuery 소스 열 이름을 클릭합니다.

      더 많은 특성을 추가하려면 다른 특성 추가를 클릭합니다.

    • 빈 특성 그룹 만들기—특성을 추가하지 않고 특성 그룹을 만듭니다.

  9. 만들기를 클릭합니다.

REST

FeatureGroup 리소스를 만들려면 featureGroups.create 메서드를 사용하여 POST 요청을 보냅니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • LOCATION_ID: 특성 그룹을 만들 리전(예: us-central1)
  • PROJECT_ID: 프로젝트 ID
  • FEATUREGROUP_NAME: 만들려는 새 특성 그룹의 이름
  • BIGQUERY_SOURCE_URI: 특성 그룹에 등록하려는 BigQuery 소스 테이블 또는 뷰의 URI

HTTP 메서드 및 URL:

POST https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME

JSON 요청 본문:

{
  "big_query": {
    "big_query_source": {
      "input_uri": "BIGQUERY_SOURCE_URI"
    }
  }
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME"

PowerShell

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME" | Select-Object -Expand Content

다음과 비슷한 JSON 응답이 표시됩니다.

{
  "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/featureGroups/FEATUREGROUP_NAME/operations/OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.aiplatform.v1.UpdateFeatureGroupOperationMetadata",
    "genericMetadata": {
      "createTime": "2023-09-18T03:00:13.060636Z",
      "updateTime": "2023-09-18T03:00:13.060636Z"
    }
  }
}

다음 단계