Modello dei dati e risorse

Le sezioni seguenti illustrano il modello dei dati di Vertex AI Feature Store (legacy) e la terminologia utilizzata per descrivere le risorse e i componenti di Vertex AI Feature Store (legacy).

Modello dei dati di Vertex AI Feature Store (legacy)

Vertex AI Feature Store (legacy) utilizza un modello dei dati a serie temporali per memorizzare una serie di valori per le caratteristiche. Questo modello consente a Vertex AI Feature Store (legacy) di mantenere i valori delle funzionalità man mano che cambiano nel tempo. Vertex AI Feature Store (legacy) organizza le risorse in modo gerarchico nel seguente ordine: Featurestore -> EntityType -> Feature. Devi creare queste risorse prima di poter importare i dati in Vertex AI Feature Store (legacy).

Ad esempio, supponiamo di avere i seguenti dati di origine di esempio da una tabella BigQuery. Questi dati di origine riguardano film e relative caratteristiche.

Mostra come i dati di origine vengono mappati al modello dei dati di Vertex AI Feature Store (legacy)

Prima di poter importare questi dati in Vertex AI Feature Store (legacy), devi creare un feature store, ovvero un contenitore di primo livello per tutte le altre risorse. Nel featurestore, crea tipi di entità che raggruppano e contengono caratteristiche correlate. Poi puoi creare elementi che corrispondono a quelli nei dati di origine. I nomi del tipo di entità e delle funzionalità possono rispecchiare i nomi delle intestazioni delle colonne, ma non è obbligatorio.

In questo esempio, l'intestazione di colonna movie_id può mappare a un tipo di entità movie. average_rating, title e genre sono caratteristiche del movie tipo di entità. I valori di ogni colonna mappano a istanze specifiche di un tipo di entità o caratteristiche, che si chiamano entities e feature values.

La colonna timestamp indica quando sono stati generati i valori delle caratteristiche. Nell'archivio di caratteristiche, i timestamp sono un attributo dei valori delle caratteristiche, non un tipo di risorsa separato. Se tutti i valori delle caratteristiche sono stati generati nello stesso momento, non è necessario avere una colonna timestamp. Il timestamp può essere specificato nell'ambito della richiesta di importazione.

Archivio di caratteristiche

Un archivio di caratteristiche è un contenitore di primo livello per tipi di entità, funzionalità e valori delle funzionalità. In genere, un'organizzazione crea un unico feature store condiviso per importare, pubblicare e condividere funzionalità tra tutti i team dell'organizzazione. Tuttavia, a volte potresti scegliere di creare più feature store nello stesso progetto per isolare gli ambienti. Ad esempio, potresti avere feature store separati per la sperimentazione, i test e la produzione.

Tipo di entità

Un tipo di entità è una raccolta di caratteristiche semanticamente correlate. Puoi definire i tuoi tipi di entità in base ai concetti pertinenti al tuo caso d'uso. Ad esempio, un servizio di film potrebbe avere i tipi di entità movie e user, che raggruppano funzionalità correlate corrispondenti a film o clienti.

Entità

Un'entità è un'istanza di un tipo di entità. Ad esempio, movie_01 e movie_02 sono entità del tipo di entità movie. In un archivio di caratteristiche ogni entità deve avere un ID univoco e deve essere di tipo STRING.

Funzionalità

Una funzionalità è una proprietà o un attributo misurabile di un tipo di entità. Ad esempio, il tipo di entità movie include funzionalità come average_rating e title che monitorano varie proprietà dei film. Le caratteristiche sono associate ai tipi di entità. Le funzionalità devono essere distinte all'interno di un determinato tipo di entità, ma non devono essere necessariamente univoche a livello globale. Ad esempio, se utilizzi title per due diversi tipi di entità, Vertex AI Feature Store (legacy) interpreta title come due funzionalità diverse. Quando leggi i valori delle caratteristiche, fornisci la caratteristica e il relativo tipo di entità nell'ambito della richiesta.

Quando crei una funzionalità, ne specifichi il tipo di valore, ad esempio BOOL_ARRAY, DOUBLE, DOUBLE_ARRAY e STRING. Questo determina i tipi di valore che puoi importare per una determinata funzionalità. Per ulteriori informazioni sui tipi di valore supportati, consulta valueType nel riferimento API.

Valore della caratteristica

Vertex AI Feature Store (legacy) acquisisce i valori di una caratteristica in un momento specifico. In altre parole, è possibile avere più valori per una determinata entità e caratteristica. Ad esempio, l'entità movie_01 può avere più valori per la caratteristica average_rating. Il valore può essere 4.4 in un determinato momento e 4.8 in un momento successivo. Vertex AI Feature Store (legacy) associa un identificatore di tuple a ogni valore della funzionalità (entity_id, feature_id, timestamp), che viene utilizzato per cercare i valori al momento della pubblicazione.

Vertex AI Feature Store (legacy) memorizza valori discreti anche se il tempo è continuo. Quando richiedi un valore della funzionalità all'ora t, Vertex AI Feature Store (legacy) restituisce il valore archiviato più recente prima o all'ora t. Ad esempio, se Vertex AI Feature Store (legacy) memorizza le informazioni sulla posizione di un'auto alle ore 100 e 110, la posizione al momento 100 viene utilizzata per le richieste in qualsiasi momento compreso tra 100 (incluso) e 110 (escluso). Se hai bisogno di una risoluzione più elevata, puoi, ad esempio, dedurre la posizione tra i valori o aumentare la frequenza di campionamento dei dati.

Importazione di funzionalità

L'importazione delle caratteristiche è il processo di importazione dei valori delle caratteristiche calcolati dai job di feature engineering in un archivio di caratteristiche. Prima di poter importare i dati, il tipo di entità e le caratteristiche corrispondenti devono essere definiti nell'archivio di caratteristiche. Vertex AI Feature Store (legacy) offre l'importazione in batch e in streaming, consentendo di aggiungere i valori delle funzionalità collettivamente o in tempo reale.

Ad esempio, potresti avere dati di origine calcolati che si trovano in posizioni come BigQuery o Cloud Storage. Puoi importare i dati in batch da queste origini in un archivio di caratteristiche centrale in modo che i valori delle caratteristiche possano essere pubblicati in un formato uniforme. Quando i dati di origine cambiano, puoi utilizzare l'importazione in streaming per inserire rapidamente queste modifiche nel tuo feature store. In questo modo, avrai a disposizione i dati più recenti per gli scenari di pubblicazione online.

Per ulteriori informazioni, consulta Importazione in batch dei valori delle caratteristiche o Importazione in streaming.

Distribuzione delle caratteristiche

La distribuzione delle caratteristiche è il processo di esportazione dei valori delle caratteristiche memorizzati per l'addestramento o l'inferenza. Vertex AI Feature Store (legacy) offre due metodi per la distribuzione delle caratteristiche: batch e online. Il recupero dati in batch è quello che si usa per un'elevata velocità effettiva e per esportare grandi volumi di dati per l'elaborazione offline (ad esempio l'addestramento di modelli o le previsioni in batch). La distribuzione online si usa per il recupero a bassa latenza di piccoli batch di dati per l'elaborazione in tempo reale (come per le previsioni online).

Per ulteriori informazioni, consulta gli articoli su pubblicazione online o in batch.

Vista entità

Quando si recuperano i valori da un archivio di caratteristiche, il servizio restituisce una vista entità che contiene i valori delle caratteristiche richieste. Puoi pensare a una vista entità come a una proiezione delle caratteristiche e dei valori che Vertex AI Feature Store (legacy) restituisce da una richiesta di recupero dati in batch oppure online:

  • Per le richieste di distribuzione online, è possibile ottenere tutte o un sottoinsieme di caratteristiche per un particolar tipo di entità.
  • Per le richieste di recupero dati in batch, è possibile ottenere tutte o un sottoinsieme di funzionalità per uno o più tipi di entità. Ad esempio, se le caratteristiche sono distribuite su più tipi di entità, puoi recuperarle insieme in un'unica richiesta, che le unisce. Puoi quindi utilizzare i risultati per inviarli a una richiesta di previsione in batch o di machine learning.

Esporta i dati

Vertex AI Feature Store (legacy) ti consente di esportare i dati dai tuoi feature store in modo da poter eseguire il backup e l'archiviazione dei valori delle funzionalità. Puoi scegliere di esportare i valori più recenti delle funzionalità (istantanea) o un intervallo di valori (esportazione completa). Per ulteriori informazioni, consulta Esportare i valori delle funzionalità.

Passaggi successivi