Modello dei dati e risorse

Le seguenti sezioni introducono il modello dei dati (legacy) e la terminologia di Vertex AI Feature Store (legacy) utilizzata per descrivere le risorse e i componenti di Vertex AI Feature Store (legacy).

Modello dei dati Vertex AI Feature Store (legacy)

Vertex AI Feature Store (legacy) utilizza un modello dei dati delle serie temporali per archiviare una serie di valori per le caratteristiche. Questo modello consente a Vertex AI Feature Store (legacy) di mantenere i valori delle caratteristiche quando cambiano nel tempo. Vertex AI Feature Store (legacy) organizza le risorse in modo gerarchico nel seguente ordine: Featurestore -> EntityType -> Feature. Devi creare queste risorse prima di poter importare i dati in Vertex AI Feature Store (Legacy).

Supponi, ad esempio, di avere i seguenti dati di origine di esempio da una tabella BigQuery. I dati di origine riguardano i film e le loro funzionalità.

Mostra in che modo i dati di origine vengono mappati al modello dei dati di Vertex AI Feature Store (legacy)

Prima di poter importare questi dati in Vertex AI Feature Store (legacy), devi creare un featurestore, che è un container di primo livello per tutte le altre risorse. Nel featurestore, crea tipi di entità che raggruppano e contengono le funzionalità correlate. Puoi quindi creare caratteristiche mappate alle caratteristiche nei dati di origine. I nomi del tipo di entità e delle caratteristiche possono rispecchiare i nomi delle intestazioni di colonna, ma ciò non è obbligatorio.

In questo esempio, l'intestazione di colonna movie_id può essere mappata a un tipo di entità movie. average_rating, title e genre sono funzionalità del tipo di entità movie. I valori in ogni colonna vengono mappati a istanze specifiche di un tipo di entità o di caratteristiche, chiamate entità e valori delle caratteristiche.

La colonna del timestamp indica quando sono stati generati i valori delle caratteristiche. Nel Featurestore, i timestamp sono un attributo dei valori delle caratteristiche, non un tipo di risorsa separato. Se tutti i valori delle caratteristiche sono stati generati contemporaneamente, non è necessario disporre di una colonna timestamp. Puoi specificare il timestamp nell'ambito della richiesta di importazione.

Featurestore

Un archivio di caratteristiche è il contenitore di primo livello per tipi di entità, caratteristiche e valori delle caratteristiche. In genere, un'organizzazione crea un archivio di caratteristiche condiviso per importare, gestire e condividere funzionalità tra tutti i team dell'organizzazione. Tuttavia, a volte potresti scegliere di creare più archivi di caratteristiche all'interno dello stesso progetto per isolare gli ambienti. Ad esempio, potresti avere archivi di caratteristiche distinti per la sperimentazione, i test e la produzione.

Tipo di entità

Un tipo di entità è una raccolta di caratteristiche semanticamente correlate. Sei tu a definire i tipi di entità in base ai concetti che sono pertinenti al tuo caso d'uso. Ad esempio, un servizio di film potrebbe avere i tipi di entità movie e user, che raggruppano le funzionalità correlate che corrispondono a film o clienti.

Entità

Un'entità è un'istanza di un tipo di entità. Ad esempio, movie_01 e movie_02 sono entità del tipo di entità movie. In un Featurestore, ogni entità deve avere un ID univoco e deve essere di tipo STRING.

Funzionalità

Una caratteristica è una proprietà o un attributo misurabile di un tipo di entità. Ad esempio, il tipo di entità movie include funzionalità come average_rating e title che monitorano varie proprietà dei film. Le caratteristiche sono associate ai tipi di entità. Le caratteristiche devono essere distinte all'interno di un determinato tipo di entità, ma non è necessario che siano univoche a livello globale. Ad esempio, se utilizzi title per due diversi tipi di entità, Vertex AI Feature Store (legacy) interpreta title come due caratteristiche diverse. Durante la lettura dei valori delle caratteristiche, fornisci la funzionalità e il tipo di entità come parte della richiesta.

Quando crei una funzionalità, ne specifichi il tipo di valore, ad esempio BOOL_ARRAY, DOUBLE, DOUBLE_ARRAY e STRING. Questo valore determina i tipi di valori che puoi importare per una determinata caratteristica. Per ulteriori informazioni sui tipi di valori supportati, consulta valueType nel riferimento API.

Valore della funzionalità

Vertex AI Feature Store (legacy) acquisisce i valori delle caratteristiche per una caratteristica in un momento specifico. In altre parole, puoi avere più valori per una determinata entità e funzionalità. Ad esempio, l'entità movie_01 può avere più valori per la funzionalità average_rating. Il valore può essere 4.4 alla volta e 4.8 in un secondo momento. Vertex AI Feature Store (legacy) associa un identificatore a tuple a ogni valore delle caratteristiche (entity_id, feature_id, timestamp), che Vertex AI Feature Store (Legacy) utilizza per cercare i valori al momento della pubblicazione.

Vertex AI Feature Store (legacy) archivia i valori discreti anche se il tempo è continuo. Quando richiedi un valore delle caratteristiche al momento t, Vertex AI Feature Store (legacy) restituisce il valore archiviato più recente entro il giorno t. Ad esempio, se Vertex AI Feature Store (legacy) archivia le informazioni sulla posizione di un'auto negli orari 100 e 110, la località all'ora 100 viene utilizzata per le richieste in qualsiasi momento tra 100 (incluso) e 110 (escluso). Se hai bisogno di una risoluzione più elevata, puoi, ad esempio, dedurre la località tra i valori o aumentare la frequenza di campionamento dei dati.

Importazione delle funzionalità

L'importazione delle caratteristiche è il processo di importazione dei valori delle caratteristiche calcolati dai job di feature engineering in un archivio di caratteristiche. Prima di poter importare i dati, è necessario definire il tipo di entità e le caratteristiche corrispondenti nell'archivio di caratteristiche. Vertex AI Feature Store (legacy) offre l'importazione in modalità flusso e batch, che ti consente di aggiungere i valori delle caratteristiche in blocco o in tempo reale.

Ad esempio, potresti aver calcolato dati di origine che risiedono in località come BigQuery o Cloud Storage. Puoi importare in gruppo i dati da queste origini in un archivio di caratteristiche centrale, in modo che i valori delle caratteristiche possano essere pubblicati in un formato uniforme. Man mano che i dati di origine cambiano, puoi utilizzare l'importazione dei flussi di dati per trasferire rapidamente le modifiche nel tuo archivio di caratteristiche. In questo modo, hai a disposizione i dati più recenti per gli scenari di pubblicazione online.

Per ulteriori informazioni, consulta Valori delle funzionalità di importazione in batch o Importazione dei flussi.

Pubblicazione delle funzionalità

La pubblicazione delle caratteristiche è il processo di esportazione dei valori delle caratteristiche archiviate per l'addestramento o l'inferenza. Vertex AI Feature Store (legacy) offre due metodi per la gestione delle caratteristiche: batch e online. La pubblicazione in batch consente una velocità effettiva elevata e la fornitura di grandi volumi di dati per l'elaborazione offline (ad esempio per l'addestramento di modelli o le previsioni batch). La pubblicazione online è indicata per il recupero dei dati a bassa latenza di piccoli batch di dati per l'elaborazione in tempo reale (come per le previsioni online).

Per ulteriori informazioni, consulta la sezione relativa alla pubblicazione online o in batch.

Vista entità

Quando recuperi i valori da un archivio di caratteristiche, il servizio restituisce una vista entità contenente i valori delle funzionalità che hai richiesto. Una vista entità può essere considerata come una proiezione delle caratteristiche e dei valori che Vertex AI Feature Store (Legacy) restituisce da una richiesta di pubblicazione online o batch:

  • Per le richieste di pubblicazione online, puoi ottenere tutte o un sottoinsieme di funzionalità per un determinato tipo di entità.
  • Per le richieste di recupero dati in batch, puoi ottenere tutte o un sottoinsieme di funzionalità per uno o più tipi di entità. Ad esempio, se le caratteristiche sono distribuite in più tipi di entità, puoi recuperarle insieme in un'unica richiesta, che unisce queste caratteristiche. Puoi quindi usare i risultati per inviare una richiesta di previsione batch o di machine learning.

Esporta i dati

Vertex AI Feature Store (legacy) consente di esportare i dati dai tuoi archivi di caratteristiche in modo da poter eseguire il backup e archiviare i valori delle caratteristiche. Puoi scegliere di esportare i valori più recenti delle funzionalità (snapshot) o un intervallo di valori (esportazione completa). Per ulteriori informazioni, consulta Esportare i valori delle caratteristiche.

Passaggi successivi