특성 그룹을 만들어 특성 데이터가 포함된 BigQuery 테이블 또는 뷰를 등록할 수 있습니다.
특성 그룹과 연결하는 BigQuery 테이블 또는 뷰의 경우 다음을 확인해야 합니다.
데이터 소스의 스키마가 데이터 소스 준비 가이드라인을 준수합니다.
데이터 소스의
entity_id
열에string
값으로 항목 ID가 포함됩니다.데이터 소스의
feature_timestamp
열에timestamp
유형의 특성 타임스탬프가 포함됩니다.
특성 그룹을 만들고 BigQuery 데이터 소스를 연결한 후에는 특성을 만들어 데이터 소스의 열과 연결할 수 있습니다. 특성 그룹을 만들 때 데이터 소스를 지정하는 것은 선택사항입니다. 하지만 특성을 만들기 전에 데이터 소스를 지정해야 합니다.
특성 그룹과 특성을 사용하여 데이터 소스를 등록하면 다음과 같은 이점이 있습니다.
여러 BigQuery 데이터 소스의 특정 특성 열을 사용하여 온라인 서빙을 위한 특성 뷰를 정의할 수 있습니다.
feature_timestamp
열을 포함하여 데이터 형식을 시계열로 지정할 수 있습니다. Vertex AI Feature Store는 특성 데이터의 최신 특성 값만 서빙하며 이전 값은 제외합니다.Data Catalog에서 특성 그룹 리소스를 검색할 때 BigQuery 소스를 연결된 특성 데이터 소스로 검색할 수 있습니다.
시작하기 전에
아직 Vertex AI에 인증하지 않았다면 인증을 진행합니다.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
Python
로컬 개발 환경에서 이 페이지의 Python 샘플을 사용하려면 gcloud CLI를 설치 및 초기화한 다음 사용자 인증 정보로 애플리케이션 기본 사용자 인증 정보를 설정하세요.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
자세한 내용은 다음을 참조하세요: Set up authentication for a local development environment.
REST
로컬 개발 환경에서 이 페이지의 REST API 샘플을 사용하려면 gcloud CLI에 제공한 사용자 인증 정보를 사용합니다.
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
자세한 내용은 Google Cloud 인증 문서의 REST 사용을 위한 인증을 참고하세요.
BigQuery 소스에서 특성 그룹 만들기
다음 샘플을 사용하여 특성 그룹을 만들고 BigQuery 데이터 소스를 연결합니다.
콘솔
다음 안내에 따라 Google Cloud 콘솔을 사용하여 특성 그룹을 만듭니다.
Google Cloud 콘솔의 Vertex AI 섹션에서 Feature Store 페이지로 이동합니다.
특성 그룹 섹션에서 만들기를 클릭하여 특성 그룹 만들기 페이지의 기본 정보 창을 엽니다.
특성 그룹 이름을 지정합니다.
선택사항: 라벨을 추가하려면 라벨 추가를 클릭하고 라벨 이름과 값을 지정합니다. 특성 그룹에 여러 라벨을 추가할 수 있습니다.
BigQuery 경로 필드에서 찾아보기를 클릭하여 특성 그룹과 연결할 BigQuery 소스 테이블 또는 뷰를 선택합니다.
선택사항: 엔티티 ID 열 목록에서 BigQuery 소스 테이블 또는 뷰의 엔티티 ID 열을 클릭합니다.
계속을 클릭합니다.
등록 창에서 다음 옵션 중 하나를 클릭하여 새 특성 그룹에 특성을 추가할지 여부를 나타냅니다.
BigQuery 테이블의 모든 열 포함—BigQuery 소스 테이블 또는 뷰의 모든 열에 대해 특성 그룹 내에 특성을 만듭니다.
특성 수동 입력—BigQuery 소스의 특정 열을 기준으로 특성을 만듭니다. 각 특성에 대해 특성 이름을 입력하고 목록에서 해당 BigQuery 소스 열 이름을 클릭합니다.
더 많은 특성을 추가하려면 다른 특성 추가를 클릭합니다.
빈 특성 그룹 만들기—특성을 추가하지 않고 특성 그룹을 만듭니다.
만들기를 클릭합니다.
Python
Vertex AI SDK for Python을 설치하거나 업데이트하는 방법은 Vertex AI SDK for Python 설치를 참조하세요. 자세한 내용은 Python API 참고 문서를 확인하세요.
project
: 프로젝트 ID입니다.location
: 특성 그룹을 만들 리전입니다(예:us-central1
).feature_group_id
: 만들려는 새 특성 그룹의 이름입니다.bq_table_uri
: 특성 그룹에 등록하려는 BigQuery 소스 테이블 또는 뷰의 URI입니다.entity_id_columns
: 엔티티 ID가 포함된 열의 이름입니다. 열을 한 개 또는 여러 개 지정할 수 있습니다.- 엔티티 ID 열을 하나만 지정하려면 열 이름을 다음 형식으로 지정합니다.
"entity_id_column_name"
. - 여러 개의 엔티티 ID 열을 지정하려면 열 이름을 다음 형식으로 지정합니다.
["entity_id_column_1_name", "entity_id_column_2_name", ...]
.
- 엔티티 ID 열을 하나만 지정하려면 열 이름을 다음 형식으로 지정합니다.
REST
FeatureGroup
리소스를 만들려면 featureGroups.create 메서드를 사용해서 POST
요청을 전송합니다.
요청 데이터를 사용하기 전에 다음을 바꿉니다.
- LOCATION_ID: 특성 그룹을 만들 리전입니다(예:
us-central1
). - ENTITY_ID_COLUMNS: 엔티티 ID가 포함된 열의 이름입니다. 열을 한 개 또는 여러 개 지정할 수 있습니다.
- 엔티티 ID 열을 하나만 지정하려면 열 이름을 다음 형식으로 지정합니다.
"entity_id_column_name"
. - 여러 개의 엔티티 ID 열을 지정하려면 열 이름을 다음 형식으로 지정합니다.
["entity_id_column_1_name", "entity_id_column_2_name", ...]
.
- 엔티티 ID 열을 하나만 지정하려면 열 이름을 다음 형식으로 지정합니다.
- PROJECT_ID: 프로젝트 ID입니다.
- FEATUREGROUP_NAME: 만들려는 새 특성 그룹의 이름입니다.
- BIGQUERY_SOURCE_URI: 특성 그룹에 등록하려는 BigQuery 소스 테이블 또는 뷰의 URI입니다.
HTTP 메서드 및 URL:
POST https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME
JSON 요청 본문:
{ "big_query": { "entity_id_columns": "ENTITY_ID_COLUMNS", "big_query_source": { "input_uri": "BIGQUERY_SOURCE_URI" } } }
요청을 보내려면 다음 옵션 중 하나를 선택합니다.
curl
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME"
PowerShell
요청 본문을 request.json
파일에 저장하고 다음 명령어를 실행합니다.
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME" | Select-Object -Expand Content
다음과 비슷한 JSON 응답이 표시됩니다.
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/featureGroups/FEATUREGROUP_NAME/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.UpdateFeatureGroupOperationMetadata", "genericMetadata": { "createTime": "2023-09-18T03:00:13.060636Z", "updateTime": "2023-09-18T03:00:13.060636Z" } } }
다음 단계
특성 만들기 방법 알아보기
특성 그룹 업데이트 방법 알아보기
특성 그룹 삭제 방법 알아보기
달리 명시되지 않는 한 이 페이지의 콘텐츠에는 Creative Commons Attribution 4.0 라이선스에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다.
최종 업데이트: 2024-12-23(UTC)