Se você precisar recuperar ou exibir dados de atributos atuais e históricos, use a exibição off-line para buscar valores de atributos do BigQuery. Por exemplo, é possível usar a exibição off-line para recuperar valores de atributos para carimbos de data/hora específicos para treinar um modelo.
Todos os dados de elementos, incluindo dados históricos de elementos, são mantidos no BigQuery, que constitui o armazenamento off-line dos valores de atributos. Para usar a exibição off-line, é preciso primeiro registrar sua fonte de dados do BigQuery criando grupos e valores de atributos. Além disso, na disponibilização off-line, cada linha que contém o mesmo ID de entidade deve ter um carimbo de data/hora diferente. Para mais informações sobre as diretrizes de preparação da fonte de dados, consulte Preparar a fonte de dados.
Antes de começar
Faça a autenticação na Vertex AI, a menos que já tenha feito isso.
Para usar os exemplos Python desta página em um ambiente de desenvolvimento local, instale e inicialize o gcloud CLI e e configure o Application Default Credentials com suas credenciais de usuário.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
Confira mais informações em Set up authentication for a local development environment.
Buscar valores de atributos históricos
Use o exemplo a seguir para buscar valores históricos de um atributo de vários IDs de entidade e carimbos de data/hora.
Antes de testar esse exemplo, siga as instruções de configuração para Python no Guia de início rápido da Vertex AI sobre como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Vertex AI para Python.
Para autenticar na Vertex AI, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
import bigframes
import bigframes.pandas
import pandas as pd
from google.cloud import bigquery
from vertexai.resources.preview.feature_store import (Feature, FeatureGroup, offline_store)
from vertexai.resources.preview.feature_store import utils as fs_utils
fg = FeatureGroup("FEATURE_GROUP_NAME ")
f1 = fg.get_feature("FEATURE_NAME_1 ")
f2 = fg.get_feature("FEATURE_NAME_2 ")
entity_df = pd.DataFrame(
data={
"ENTITY_ID_COLUMN ": [
"ENTITY_ID_1 ",
"ENTITY_ID_2 ",
],
"timestamp": [
pd.Timestamp("FEATURE_TIMESTAMP_1 "),
pd.Timestamp("FEATURE_TIMESTAMP_2 "),
],
},
)
offline_store.fetch_historical_feature_values(
entity_df=entity_df,
features=[f1,f2],
)
Substitua:
FEATURE_GROUP_NAME: o nome do grupo de recursos existente que contém o atributo.
FEATURE_NAME_1 e FEATURE_NAME_2: os nomes dos atributos registrados dos quais você quer recuperar os valores dos atributos.
ENTITY_ID_COLUMN: o nome da coluna que contém os IDs da entidade. Só é possível especificar um nome de coluna se ela estiver registrada no grupo de atributos.
ENTITY_ID_1 e ENTITY_ID_2: os IDs de entidade dos quais você quer buscar os valores dos atributos. Se você quer recuperar valores para o mesmo ID da entidade em carimbos de data/hora diferentes, especifique o mesmo ID da entidade correspondentes a cada carimbo de data/hora.
FEATURE_TIMESTAMP_1 e FEATURE_TIMESTAMP_2: os carimbos de data/hora que correspondem aos valores dos atributos históricos que você quer recuperar. FEATURE_TIMESTAMP_1 corresponde a ENTITY_ID_1, FEATURE_TIMESTAMP_2 corresponde a ENTITY_ID_2 e assim por diante. Especifique os carimbos de data/hora no formato de data e hora, por exemplo,
2024-05-01T12:00:00
.