Crea un grupo de funciones

Puedes crear un grupo de atributos para registrar una tabla o vista de BigQuery que contenga los datos de tus atributos.

Para cualquier tabla o vista de BigQuery que asocies con un grupo de atributos, debes asegurarte de lo siguiente:

  • El esquema de la fuente de datos cumple con los lineamientos de preparación de fuentes de datos.

  • La fuente de datos contiene los ID de la entidad como valores string en una columna llamada entity_id.

  • La fuente de datos contiene las marcas de tiempo de los atributos de tipo timestamp en una columna llamada feature_timestamp.

Después de crear un grupo de atributos y asociar la fuente de datos de BigQuery, puedes crear atributos para asociarlos con las columnas en la fuente de datos. Es opcional especificar una fuente de datos mientras se crea el grupo de atributos. Sin embargo, debes especificar una fuente de datos antes de crear atributos.

Registrar tu fuente de datos mediante grupos de funciones y atributos tiene las siguientes ventajas:

  • Puedes definir una vista de atributos para la entrega en línea mediante columnas de atributos específicas de varias fuentes de datos de BigQuery.

  • Puedes dar formato a tus datos como una serie temporal si incluyes la columna feature_timestamp. Vertex AI Feature Store solo entrega los valores de atributos más recientes de los datos de atributos y excluye los valores históricos.

Usa el siguiente ejemplo para crear un grupo de atributos y asociar una fuente de datos de BigQuery.

Console

Usa las siguientes instrucciones para crear un grupo de atributos con la consola de Google Cloud.

  1. En la sección de Vertex AI de la consola de Google Cloud, ve a la página Feature Store.

    Ir a la página Feature Store

  2. En la sección Grupos de atributos, haz clic en Crear para abrir el panel Información básica en la página Crear grupo de atributos.

  3. Especifica el Nombre del grupo de funciones.

  4. Opcional: Para agregar etiquetas, haz clic en Agregar etiqueta y especifica su nombre y valor. Puedes agregar varias etiquetas a un grupo de atributos.

  5. En el campo Ruta de acceso de BigQuery, haz clic en Explorar para seleccionar la tabla de origen de BigQuery o la vista para asociarla con el grupo de atributos.

  6. Opcional: En la lista columna ID de entidad, haz clic en la columna ID de entidad de la tabla o vista de origen de BigQuery.

  7. Haz clic en Continuar.

  8. En el panel Registrar, haz clic en una de las siguientes opciones para indicar si deseas agregar funciones al grupo de atributos nuevo:

    • Incluir todas las columnas de la tabla de BigQuery: Crea atributos dentro del grupo de atributos para todas las columnas de la tabla o vista de origen de BigQuery.

    • Ingresar los atributos manualmente: Crea atributos basados en columnas específicas en la fuente de BigQuery. Para cada atributo, ingresa un Nombre del atributo y haz clic en el nombre de la columna de origen de BigQuery correspondiente en la lista.

      Para agregar más atributos, haz clic en Agregar otro atributo.

    • Crear un grupo de atributos vacío: Crea el grupo de atributos sin agregarle atributos.

  9. Haz clic en Crear.

REST

Para crear un recurso FeatureGroup, envía una solicitud POST mediante el método featureGroups.create.

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

  • LOCATION_ID: Región donde deseas crear el grupo de atributos, como us-central1.
  • PROJECT_ID: ID del proyecto
  • FEATUREGROUP_NAME: El nombre del grupo de atributos nuevo que deseas crear.
  • BIGQUERY_SOURCE_URI: URI de la tabla de origen o la vista de BigQuery que deseas registrar en el grupo de atributos.

HTTP method and URL:

POST https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME

Cuerpo JSON de la solicitud:

{
  "big_query": {
    "big_query_source": {
      "input_uri": "BIGQUERY_SOURCE_URI"
    }
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION_ID-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION_ID/featureGroups?feature_group_id=FEATUREGROUP_NAME" | Select-Object -Expand Content

Deberías recibir una respuesta JSON similar a la que se muestra a continuación:

{
  "name": "projects/PROJECT_NUMBER/locations/LOCATION_ID/featureGroups/FEATUREGROUP_NAME/operations/OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.aiplatform.v1.UpdateFeatureGroupOperationMetadata",
    "genericMetadata": {
      "createTime": "2023-09-18T03:00:13.060636Z",
      "updateTime": "2023-09-18T03:00:13.060636Z"
    }
  }
}

¿Qué sigue?