Exibir valores de atributos históricos

Se você precisar recuperar ou exibir dados de atributos atuais e históricos, use a exibição off-line para buscar valores de atributos do BigQuery. Por exemplo, é possível usar a exibição off-line para recuperar valores de atributos para carimbos de data/hora específicos para treinar um modelo.

Todos os dados de elementos, incluindo dados históricos de elementos, são mantidos no BigQuery, que constitui o armazenamento off-line dos valores de atributos. Para usar a exibição off-line, é preciso primeiro registrar sua fonte de dados do BigQuery criando grupos e valores de atributos. Além disso, na disponibilização off-line, cada linha que contém o mesmo ID de entidade deve ter um carimbo de data/hora diferente. Para mais informações sobre as diretrizes de preparação da fonte de dados, consulte Preparar a fonte de dados.

Antes de começar

Faça a autenticação na Vertex AI, a menos que já tenha feito isso.

Para usar os exemplos Python desta página em um ambiente de desenvolvimento local, instale e inicialize o gcloud CLI e e configure o Application Default Credentials com suas credenciais de usuário.

  1. Install the Google Cloud CLI.
  2. To initialize the gcloud CLI, run the following command:

    gcloud init
  3. If you're using a local shell, then create local authentication credentials for your user account:

    gcloud auth application-default login

    You don't need to do this if you're using Cloud Shell.

Confira mais informações em Set up authentication for a local development environment.

Buscar valores de atributos históricos

Use o exemplo a seguir para buscar valores históricos de um atributo de vários IDs de entidade e carimbos de data/hora.

Python

Antes de testar esse exemplo, siga as instruções de configuração para Python no Guia de início rápido da Vertex AI sobre como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Vertex AI para Python.

Para autenticar na Vertex AI, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.

import bigframes
import bigframes.pandas
import pandas as pd
from google.cloud import bigquery
from vertexai.resources.preview.feature_store import (Feature, FeatureGroup, offline_store)
from vertexai.resources.preview.feature_store import utils as fs_utils

fg = FeatureGroup("FEATURE_GROUP_NAME")
f1 = fg.get_feature("FEATURE_NAME_1")
f2 = fg.get_feature("FEATURE_NAME_2")

entity_df = pd.DataFrame(
  data={
    "ENTITY_ID_COLUMN": [
      "ENTITY_ID_1",
      "ENTITY_ID_2",
    ],
    "timestamp": [
      pd.Timestamp("FEATURE_TIMESTAMP_1"),
      pd.Timestamp("FEATURE_TIMESTAMP_2"),
    ],
  },
)

offline_store.fetch_historical_feature_values(
  entity_df=entity_df,
  features=[f1,f2],
)

Substitua:

  • FEATURE_GROUP_NAME: o nome do grupo de recursos existente que contém o atributo.

  • FEATURE_NAME_1 e FEATURE_NAME_2: os nomes dos atributos registrados dos quais você quer recuperar os valores dos atributos.

  • ENTITY_ID_COLUMN: o nome da coluna que contém os IDs da entidade. Só é possível especificar um nome de coluna se ela estiver registrada no grupo de atributos.

  • ENTITY_ID_1 e ENTITY_ID_2: os IDs de entidade dos quais você quer buscar os valores dos atributos. Se você quer recuperar valores para o mesmo ID da entidade em carimbos de data/hora diferentes, especifique o mesmo ID da entidade correspondentes a cada carimbo de data/hora.

  • FEATURE_TIMESTAMP_1 e FEATURE_TIMESTAMP_2: os carimbos de data/hora que correspondem aos valores dos atributos históricos que você quer recuperar. FEATURE_TIMESTAMP_1 corresponde a ENTITY_ID_1, FEATURE_TIMESTAMP_2 corresponde a ENTITY_ID_2 e assim por diante. Especifique os carimbos de data/hora no formato de data e hora, por exemplo, 2024-05-01T12:00:00.