Si necesitas recuperar o entregar datos actuales y de atributos históricos, usa la entrega sin conexión para recuperar valores de atributos de BigQuery. Por ejemplo, puedes usar la entrega sin conexión para recuperar los valores de atributos de marcas de tiempo específicas para entrenar un modelo.
Todos los datos de atributos, incluidos los datos históricos de atributos, se conservan en BigQuery, que constituye el almacenamiento sin conexión para los valores de tus atributos. Para usar la entrega sin conexión, primero debes registrar tu fuente de datos de BigQuery mediante la creación de grupos de atributos y valores de atributos. Además, en el caso de la entrega sin conexión, cada fila que contenga el mismo ID de entidad debe tener una marca de tiempo diferente. Para obtener más información sobre los lineamientos de preparación de la fuente de datos, consulta Prepara la fuente de datos.
Antes de comenzar
Autentícate en Vertex AI, a menos que ya lo hayas hecho.
Para usar las muestras de Python de esta página en un entorno de desarrollo local, instala e inicializa gcloud CLI y, luego, configura las credenciales predeterminadas de la aplicación con tus credenciales de usuario.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
Para obtener más información, consulta Set up authentication for a local development environment.
Recupera valores de atributos históricos
Usa el siguiente ejemplo para recuperar los valores históricos de un atributo de varios IDs de entidades y marcas de tiempo.
Python
Antes de probar este ejemplo, sigue las instrucciones de configuración para Python incluidas en la guía de inicio rápido de Vertex AI sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de Vertex AI Python.
Para autenticarte en Vertex AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
import bigframes
import bigframes.pandas
import pandas as pd
from google.cloud import bigquery
from vertexai.resources.preview.feature_store import (Feature, FeatureGroup, offline_store)
from vertexai.resources.preview.feature_store import utils as fs_utils
fg = FeatureGroup("FEATURE_GROUP_NAME")
f1 = fg.get_feature("FEATURE_NAME_1")
f2 = fg.get_feature("FEATURE_NAME_2")
entity_df = pd.DataFrame(
data={
"ENTITY_ID_COLUMN": [
"ENTITY_ID_1",
"ENTITY_ID_2",
],
"timestamp": [
pd.Timestamp("FEATURE_TIMESTAMP_1"),
pd.Timestamp("FEATURE_TIMESTAMP_2"),
],
},
)
offline_store.fetch_historical_feature_values(
entity_df=entity_df,
features=[f1,f2],
)
Reemplaza lo siguiente:
FEATURE_GROUP_NAME: El nombre del grupo de atributos existente que contiene el atributo
FEATURE_NAME_1 y FEATURE_NAME_2: Son los nombres de los atributos registrados de los que deseas recuperar los valores de los atributos.
ENTITY_ID_COLUMN: el nombre de la columna que contiene los IDs de la entidad. Puedes especificar un nombre de columna solo si está registrado en el grupo de atributos.
ENTITY_ID_1 y ENTITY_ID_2: Los IDs de la entidad para los que deseas recuperar los valores de los atributos. Si quieres recuperar valores de atributos para el mismo ID de entidad en diferentes marcas de tiempo, especifica el mismo ID de entidad correspondiente a cada marca de tiempo.
FEATURE_TIMESTAMP_1 y FEATURE_TIMESTAMP_2: Las marcas de tiempo correspondientes a los valores de atributos históricos que deseas recuperar. FEATURE_TIMESTAMP_1 corresponde a ENTITY_ID_1, FEATURE_TIMESTAMP_2 corresponde a ENTITY_ID_2, etcétera. Especifica las marcas de tiempo en el formato de fecha y hora, por ejemplo,
2024-05-01T12:00:00
.