Crea un gruppo di caratteristiche

Puoi creare un gruppo di caratteristiche per registrare una tabella o una vista BigQuery che contiene i dati delle tue caratteristiche.

Per qualsiasi tabella o vista BigQuery che associ a un gruppo di caratteristiche, devi verificare quanto segue:

  • Lo schema dell'origine dati è conforme alle Linee guida per la preparazione dell'origine dati.

  • L'origine dati contiene gli ID entità come valori string in una colonna denominata entity_id.

  • L'origine dati contiene i timestamp delle caratteristiche di tipo timestamp in una colonna denominata feature_timestamp.

Dopo aver creato un gruppo di caratteristiche e associato i dati BigQuery puoi creare caratteristiche da associare alle colonne nell'origine dati. Non è obbligatorio specificare un'origine dati durante la creazione gruppo di caratteristiche. Tuttavia, devi specificare un'origine dati prima di creare le funzionalità di machine learning.

La registrazione dell'origine dati utilizzando gruppi di caratteristiche e funzionalità presenta quanto segue vantaggi:

  • Puoi definire una visualizzazione caratteristiche per la pubblicazione online utilizzando una caratteristica specifica da più origini dati BigQuery.

  • Puoi formattare i dati come serie temporale includendo feature_timestamp colonna. Vertex AI Feature Store pubblica solo la funzionalità più recente dai dati delle caratteristiche ed esclude i valori storici.

  • Puoi scoprire l'origine BigQuery come caratteristica associata l'origine dati, quando cerchi la risorsa del gruppo di caratteristiche in Data Catalog (Catalogo dati).

Prima di iniziare

Autentica in Vertex AI, a meno che tu non l'abbia già fatto.

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

Python

Per utilizzare gli Python esempi in questa pagina in una località dell'ambiente di sviluppo, installare e inizializzare gcloud CLI quindi configura Credenziali predefinite dell'applicazione con le tue credenziali utente.

  1. Installa Google Cloud CLI.
  2. Per initialize gcloud CLI, esegui questo comando:

    gcloud init
  3. Crea credenziali di autenticazione locali per il tuo Account Google:

    gcloud auth application-default login

Per ulteriori informazioni, vedi Set up authentication for a local development environment.

REST

Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.

    Installa Google Cloud CLI, quindi initialize eseguendo questo comando:

    gcloud init

Per ulteriori informazioni, vedi Esegui l'autenticazione per l'utilizzo di REST nella documentazione sull'autenticazione di Google Cloud.

Creare un gruppo di caratteristiche da un'origine BigQuery

Utilizza gli esempi riportati di seguito per creare un gruppo di caratteristiche e associare un Origine dati BigQuery.

Console

Segui le istruzioni riportate di seguito per creare un gruppo di funzionalità utilizzando la console Google Cloud.

  1. Nella sezione Vertex AI della console Google Cloud, vai alla pagina Feature Store.

    Vai alla pagina Feature Store

  2. Nella sezione Gruppi di funzionalità, fai clic su Crea per aprire il riquadro Informazioni di base nella pagina Crea gruppo di funzionalità.

  3. Specifica il Nome gruppo di caratteristiche.

  4. (Facoltativo) Per aggiungere etichette, fai clic su Aggiungi etichetta e specifica il nome e il valore dell'etichetta. Puoi aggiungere più etichette a un gruppo di caratteristiche.

  5. Nel campo Percorso BigQuery, fai clic su Sfoglia per selezionare la tabella o la vista di origine BigQuery da associare al gruppo di caratteristiche.

  6. (Facoltativo) Nell'elenco Colonna ID entità, fai clic sulla colonna ID entità dalla tabella o dalla vista di origine BigQuery.

  7. Fai clic su Continua.

  8. Nel riquadro Registra, fai clic su una delle seguenti opzioni per indicare se desideri aggiungere caratteristiche al nuovo gruppo di caratteristiche:

    • Includi tutte le colonne della tabella BigQuery: crea caratteristiche all'interno del gruppo di caratteristiche per tutte le colonne nella tabella o nella vista di origine BigQuery.

    • Inserisci manualmente le caratteristiche: crea caratteristiche in base a colonne specifiche nell'origine BigQuery. Per ogni caratteristica, inserisci un Nome funzionalità e fai clic sul nome della colonna di origine BigQuery corrispondente nell'elenco.

      Per aggiungere altre funzionalità, fai clic su Aggiungi un'altra funzionalità.

    • Crea un gruppo di caratteristiche vuoto: crea il gruppo di caratteristiche senza aggiungere caratteristiche.

  9. Fai clic su Crea.

Python

Per scoprire come installare o aggiornare l'SDK Vertex AI per Python, vedi Installare l'SDK Vertex AI per Python. Per ulteriori informazioni, consulta documentazione di riferimento dell'API Python.


from google.cloud import aiplatform
from vertexai.resources.preview import feature_store
from typing import List


def create_feature_group_sample(
    project: str,
    location: str,
    feature_group_id: str,
    bq_table_uri: str,
    entity_id_columns: List[str],
):
    aiplatform.init(project=project, location=location)
    fg = feature_store.FeatureGroup.create(
        name=feature_group_id,
        source=feature_store.utils.FeatureGroupBigQuerySource(
            uri=bq_table_uri, entity_id_columns=entity_id_columns
        ),
    )
    return fg

  • project: l'ID progetto.
  • location: regione in cui vuoi creare il gruppo di caratteristiche, ad esempio us-central1.
  • feature_group_id: il nome del nuovo gruppo di caratteristiche che vuoi creare.
  • bq_table_uri: URI della tabella o della vista di origine BigQuery che vuoi registrare per il gruppo di caratteristiche.
  • entity_id_columns: i nomi delle colonne contenenti gli ID entità. Puoi specificare una o più colonne.
    • Per specificare una sola colonna di ID entità, specifica il nome della colonna nel seguente formato:
      "entity_id_column_name".
    • Per specificare più colonne di ID entità, specifica i nomi delle colonne nel seguente formato:
      ["entity_id_column_1_name", "entity_id_column_2_name", ...].

REST

Per creare una FeatureGroup Risorsa, invia una richiesta POST utilizzando featureGroups.create .

Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

  • LOCATION_ID: regione in cui vuoi creare il gruppo di caratteristiche, ad esempio us-central1.
  • ENTITY_ID_COLUMNS: i nomi delle colonne contenenti gli ID entità. Puoi specificare una o più colonne.
    • Per specificare una sola colonna di ID entità, specifica il nome della colonna nel seguente formato:
      "entity_id_column_name".
    • Per specificare più colonne di ID entità, specifica i nomi delle colonne nel seguente formato:
      ["entity_id_column_1_name", "entity_id_column_2_name", ...].
  • PROJECT_ID: l'ID progetto.
  • FEATUREGROUP_NAME: il nome del nuovo gruppo di caratteristiche che vuoi creare.
  • BIGQUERY_SOURCE_URI: URI della tabella o della vista di origine BigQuery che vuoi registrare per il gruppo di caratteristiche.

Metodo HTTP e URL:

POST https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME

Corpo JSON della richiesta:

{
  "big_query": {
    "entity_id_columns": "ENTITY_ID_COLUMNS",
    "big_query_source": {
      "input_uri": "BIGQUERY_SOURCE_URI"
    }
  }
}

Per inviare la richiesta, scegli una delle seguenti opzioni:

curl

Salva il corpo della richiesta in un file denominato request.json. ed esegui questo comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME"

PowerShell

Salva il corpo della richiesta in un file denominato request.json. ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME" | Select-Object -Expand Content

Dovresti ricevere una risposta JSON simile alla seguente:

{
  "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/featureGroups/FEATUREGROUP_NAME/operations/OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.aiplatform.v1.UpdateFeatureGroupOperationMetadata",
    "genericMetadata": {
      "createTime": "2023-09-18T03:00:13.060636Z",
      "updateTime": "2023-09-18T03:00:13.060636Z"
    }
  }
}

Passaggi successivi