Apresente valores de funcionalidades históricos

Se precisar de obter ou publicar dados de caraterísticas atuais e do histórico, use a publicação offline para obter valores de caraterísticas do BigQuery. Por exemplo, pode usar a publicação offline para obter os valores das funcionalidades para datas/horas específicas para preparar um modelo.

Todos os dados das funcionalidades, incluindo os dados do histórico das funcionalidades, são mantidos no BigQuery, que constitui o armazenamento offline dos valores das funcionalidades. Para usar a publicação offline, tem de registar primeiro a sua origem de dados do BigQuery criando grupos de funcionalidades e valores de funcionalidades. Além disso, no caso da publicação offline, cada linha que contenha o mesmo ID da entidade tem de ter uma data/hora diferente. Para mais informações sobre as diretrizes de preparação da origem de dados, consulte o artigo Prepare a origem de dados.

Antes de começar

Autentique o Vertex AI, a menos que já o tenha feito.

Para usar os Python exemplos nesta página num ambiente de desenvolvimento local, instale e inicialize a CLI gcloud e, em seguida, configure as Credenciais predefinidas da aplicação com as suas credenciais de utilizador.

    Instale a CLI Google Cloud.

    Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.

    If you're using a local shell, then create local authentication credentials for your user account:

    gcloud auth application-default login

    You don't need to do this if you're using Cloud Shell.

    If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.

Para mais informações, consulte Set up authentication for a local development environment.

Obtenha valores históricos de atributos

Use o exemplo seguinte para obter valores do histórico de uma funcionalidade de vários IDs de entidades e datas/horas.

Python

Antes de experimentar este exemplo, siga as Pythoninstruções de configuração no início rápido do Vertex AI com bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API Python Vertex AI.

Para se autenticar no Vertex AI, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.

import bigframes
import bigframes.pandas
import pandas as pd
from google.cloud import bigquery
from vertexai.resources.preview.feature_store import (Feature, FeatureGroup, offline_store)
from vertexai.resources.preview.feature_store import utils as fs_utils

fg = FeatureGroup("FEATURE_GROUP_NAME")
f1 = fg.get_feature("FEATURE_NAME_1")
f2 = fg.get_feature("FEATURE_NAME_2")

entity_df = pd.DataFrame(
  data={
    "ENTITY_ID_COLUMN": [
      "ENTITY_ID_1",
      "ENTITY_ID_2",
    ],
    "timestamp": [
      pd.Timestamp("FEATURE_TIMESTAMP_1"),
      pd.Timestamp("FEATURE_TIMESTAMP_2"),
    ],
  },
)

offline_store.fetch_historical_feature_values(
  entity_df=entity_df,
  features=[f1,f2],
)

Substitua o seguinte:

  • FEATURE_GROUP_NAME: o nome do grupo de elementos existente que contém o elemento.

  • FEATURE_NAME_1 e FEATURE_NAME_2: os nomes das funcionalidades registadas a partir das quais quer obter os valores das funcionalidades.

  • ENTITY_ID_COLUMN: o nome da coluna que contém os IDs das entidades. Só pode especificar um nome de coluna se estiver registado no grupo de funcionalidades.

  • ENTITY_ID_1 e ENTITY_ID_2: os IDs das entidades para as quais quer obter os valores das caraterísticas. Se quiser obter valores de caraterísticas para o mesmo ID de entidade em diferentes informações de data/hora, especifique o mesmo ID de entidade correspondente a cada informação de data/hora.

  • FEATURE_TIMESTAMP_1 e FEATURE_TIMESTAMP_2: as datas/horas correspondentes aos valores das caraterísticas do histórico que quer obter. FEATURE_TIMESTAMP_1 corresponde a ENTITY_ID_1, FEATURE_TIMESTAMP_2 corresponde a ENTITY_ID_2 e assim sucessivamente. Especifique as indicações de tempo no formato de data/hora, por exemplo, 2024-05-01T12:00:00.