Glossario di Vertex AI

  • insieme di annotazioni
    • Un set di annotazioni contiene le etichette associate ai file di origine caricati all'interno di un set di dati. Un set di annotazioni è associato sia a un tipo di dati sia a un obiettivo (ad esempio video/classificazione).
  • Endpoint API
    • Gli endpoint API sono un aspetto della configurazione dei servizi che specifica gli indirizzi di rete, noti anche come endpoint di servizio. (ad esempio, aiplatform.googleapis.com).
  • Vicino approssimato più vicino (ANN)
  • artefatto
    • Un artefatto è un'entità discreta o un dato prodotto e utilizzato da un flusso di lavoro di machine learning. Alcuni esempi di artefatti includono set di dati, modelli, file di input e log di addestramento.
  • Artifact Registry
    • Artifact Registry è un servizio universale di gestione degli artefatti. È il servizio consigliato per la gestione dei container e di altri artefatti su Google Cloud. Per ulteriori informazioni, vedi Artifact Registry.
  • autenticazione
    • Il processo di verifica dell'identità di un client (che potrebbe essere un utente o un altro processo) allo scopo di ottenere l'accesso a un sistema protetto. Un client che ha dimostrato la propria identità è considerato autenticato. Per ulteriori informazioni, consulta la sezione Metodi di autenticazione di Google.
  • previsione batch
    • La previsione batch accetta un gruppo di richieste di previsione e restituisce i risultati in un file. Per ulteriori informazioni, consulta la sezione Ottenere previsioni batch.
  • riquadro di delimitazione
    • Un riquadro di delimitazione di un oggetto nel fotogramma video può essere specificato in due modi (i) utilizzando due vertici costituiti da un insieme di coordinate x e y se sono diagonalmente opposti al punto del rettangolo. Ad esempio: x_relative_min, y_relative_min,,,x_relative_max,y_relative_max,, (ii) Utilizza tutti e quattro i vertici. Per saperne di più, consulta Preparare i dati dei video.
  • metriche di classificazione
    • Le metriche di classificazione supportate nell'SDK Vertex AI per Python sono la matrice di confusione e la curva ROC.
  • contesto
    • Un contesto viene utilizzato per raggruppare artefatti ed esecuzioni in un'unica categoria, interrogabile e digitata. I contesti possono essere utilizzati per rappresentare insiemi di metadati. Un esempio di contesto potrebbe essere l'esecuzione di una pipeline di machine learning.
  • Chiavi di crittografia gestite dal cliente (CMEK)
    • Le chiavi di crittografia gestite dal cliente (CMEK) sono integrazioni che consentono ai clienti di criptare i dati nei servizi Google esistenti utilizzando una chiave gestita in Cloud KMS (nota anche come Storky). La chiave in Cloud KMS è la chiave di crittografia della chiave che protegge i dati. Per saperne di più, vedi Chiavi di crittografia gestite dal cliente (CMEK).
  • set di dati
    • Per set di dati si intende in linea di massima una raccolta di record di dati strutturati o non strutturati. Per saperne di più, consulta Creare un set di dati.
  • incorporamento
    • Un incorporamento è un tipo di vettore utilizzato per rappresentare i dati in un modo che ne acquisisce il significato semantico. Gli incorporamenti sono in genere creati utilizzando tecniche di machine learning e sono spesso utilizzati nell'elaborazione del linguaggio naturale (NLP) e in altre applicazioni di machine learning.
  • evento
    • Un evento descrive la relazione tra artefatti ed esecuzioni. Ogni artefatto può essere prodotto da un'esecuzione e consumato da altre esecuzioni. Gli eventi consentono di determinare la provenienza degli artefatti nei loro flussi di lavoro ML concatenando artefatti ed esecuzioni.
  • dell'esecuzione
    • Un'esecuzione è un record di un singolo passaggio del flusso di lavoro di machine learning, in genere annotato con i relativi parametri di runtime. Esempi di esecuzioni includono l'importazione dati, la convalida dei dati, l'addestramento dei modelli, la valutazione e il deployment del modello.
  • esperimento
    • Un esperimento è un contesto che può contenere un insieme di n esecuzioni di esperimenti, oltre a quelle della pipeline, in cui un utente può esaminare, in gruppo, diverse configurazioni come artefatti o iperparametri di input.
  • l'esecuzione dell'esperimento
    • L'esecuzione di un esperimento può contenere metriche, parametri, esecuzioni, artefatti e risorse Vertex definiti dall'utente (ad esempio PipelineJob).
  • analisi esplorativa dei dati
    • In statistica, l'analisi esplorativa dei dati (EDA) è un approccio per analizzare i set di dati al fine di riassumerne le caratteristiche principali, spesso con metodi visivi. Si può utilizzare o meno un modello statistico, ma principalmente l'EDA serve a vedere cosa possono dirci i dati al di là della modellazione formale o della verifica delle ipotesi.
  • funzionalità
    • Nel machine learning (ML), una caratteristica è una caratteristica o un attributo di un'istanza o entità che viene utilizzata come input per addestrare un modello ML o fare previsioni.
  • il feature engineering
    • Il feature engineering è il processo di trasformazione dei dati non elaborati di machine learning (ML) in caratteristiche che possono essere utilizzate per addestrare modelli ML o per fare previsioni.
  • valore delle caratteristiche
    • Un valore di caratteristica corrisponde al valore effettivo e misurabile di una caratteristica (attributo) di un'istanza o entità. Una raccolta di valori delle caratteristiche per l'entità univoca rappresenta il record di caratteristiche corrispondente all'entità.
  • funzionalità
    • La distribuzione delle caratteristiche è il processo di esportazione o recupero dei valori delle caratteristiche per l'addestramento o l'inferenza. In Vertex AI esistono due tipi di distribuzione delle caratteristiche: pubblicazione online e pubblicazione offline. La pubblicazione online recupera gli ultimi valori delle caratteristiche di un sottoinsieme dell'origine dati delle caratteristiche per le previsioni online. La distribuzione offline o in batch esporta volumi elevati di dati delle caratteristiche per l'elaborazione offline, ad esempio l'addestramento dei modelli ML.
  • timestamp delle caratteristiche
    • Un timestamp della caratteristica indica quando è stato generato l'insieme di valori delle caratteristiche in un record di caratteristiche specifico per un'entità.
  • record di caratteristiche
    • Un record di caratteristiche è un'aggregazione di tutti i valori delle caratteristiche che descrivono gli attributi di un'entità unica in un momento specifico.
  • registro di caratteristiche
    • Un registro di caratteristiche è un'interfaccia centrale per la registrazione delle origini dati delle caratteristiche da utilizzare per le previsioni online. Per ulteriori informazioni, consulta Configurazione del Registro di caratteristiche.
  • gruppo di caratteristiche
    • Un gruppo di caratteristiche è una risorsa del registro di caratteristiche che corrisponde a una tabella o vista di origine BigQuery contenente dati delle caratteristiche. Una vista delle caratteristiche può contenere caratteristiche e può essere considerata come un raggruppamento logico di colonne di caratteristiche nell'origine dati.
  • visualizzazione delle caratteristiche
    • Una visualizzazione delle caratteristiche è una raccolta logica di caratteristiche materializzate da un'origine dati BigQuery a un'istanza di un negozio online. Una visualizzazione caratteristiche archivia e aggiorna periodicamente i dati delle caratteristiche del cliente, che vengono aggiornati periodicamente dall'origine BigQuery. Una visualizzazione delle caratteristiche è associata all'archiviazione dei dati delle caratteristiche direttamente o tramite associazioni alle risorse del registro delle caratteristiche.
  • SDK per i componenti della pipeline di Google Cloud
    • L'SDK dei componenti della pipeline di Google Cloud (GCPC) fornisce un insieme di componenti predefiniti di Kubeflow Pipelines, che offrono qualità della produzione, prestazioni elevate e facile da usare. Puoi utilizzare i componenti di pipeline di Google Cloud per definire ed eseguire pipeline ML in Vertex AI Pipelines e altri backend di esecuzione di pipeline ML conformi a Kubeflow Pipelines. Per saperne di più, consulta Introduzione ai componenti della pipeline di Google Cloud.
  • istogramma
    • Visualizzazione grafica della variazione in un insieme di dati mediante barre. Un istogramma mostra schemi difficili da individuare in una semplice tabella di numeri.
  • indice
    • Una raccolta di vettori distribuiti insieme per la ricerca di analogie. I vettori possono essere aggiunti a un indice o rimossi da un indice. Le query di ricerca di similitudine vengono inviate a un indice specifico e cercheranno nei vettori presenti in quell'indice.
  • dati empirici reali
    • Termine che si riferisce alla verifica dell'accuratezza del machine learning rispetto al mondo reale, come un set di dati di dati empirici reali.
  • Metadati di machine learning
    • ML Metadata (MLMD) è una libreria per la registrazione e il recupero di metadati associati ai flussi di lavoro di sviluppatori ML e data scientist. MLMD è parte integrante di TensorFlow Extended (TFX), ma è progettato in modo da poter essere utilizzato in modo indipendente. Poiché fa parte della più ampia piattaforma TFX, la maggior parte degli utenti interagisce con MLMD solo quando esamina i risultati dei componenti della pipeline, ad esempio nei blocchi note o in TensorBoard.
  • set di dati gestito
    • Un oggetto set di dati creato e ospitato da Vertex AI.
  • risorse metadati
    • Vertex ML Metadata espone un modello dei dati di tipo grafico per rappresentare i metadati prodotti e consumati dai flussi di lavoro ML. I concetti principali sono artefatti, esecuzioni, eventi e contesti.
  • MetadataSchema
    • Un MetadataSchema descrive lo schema per particolari tipi di artefatti, esecuzioni o contesti. Gli schemi dei metadati vengono utilizzati per convalidare le coppie chiave-valore durante la creazione delle risorse di metadati corrispondenti. La convalida dello schema viene eseguita solo sui campi corrispondenti tra la risorsa e MetadataSchema. Gli schemi dei tipi sono rappresentati utilizzando oggetti schema OpenAPI, che dovrebbero essere descritti utilizzando YAML.
  • MetadataStore
    • Un MetadataStore è il container di primo livello per le risorse dei metadati. MetadataStore è regionalizzato e associato a un progetto Google Cloud specifico. In genere, un'organizzazione utilizza un MetadataStore condiviso per le risorse di metadati all'interno di ogni progetto.
  • Pipeline ML
    • Le pipeline ML sono flussi di lavoro ML portatili e scalabili basati su container.
  • modello
    • Qualsiasi modello preaddestrato o meno.
  • nome risorsa modello
    • Il nome della risorsa per un model, come segue: projects/<PROJECT_ID>/locations/<LOCATION_ID>/models/<MODEL_ID>. Puoi trovare l'ID del modello nella console Cloud nella pagina "Model Registry".
  • negozio offline
    • Il negozio offline è una struttura di archiviazione in cui sono archiviati dati recenti e storici delle caratteristiche, che in genere vengono utilizzati per l'addestramento dei modelli ML. Un archivio offline contiene anche gli ultimi valori delle caratteristiche, che puoi utilizzare per le previsioni online.
  • negozio online
    • Nella gestione delle caratteristiche, un negozio online è una struttura di archiviazione per i valori più recenti delle caratteristiche da fornire per le previsioni online.
  • parametri
    • I parametri sono valori di input con chiave che configurano un'esecuzione, regolano il suo comportamento e ne influenzano i risultati. Alcuni esempi sono il tasso di apprendimento, il tasso di abbandono e il numero di passaggi di addestramento.
  • pipeline
    • Le pipeline ML sono flussi di lavoro ML portatili e scalabili basati su container.
  • Componente pipeline
    • Un set di codice autonomo che esegue un passaggio nel flusso di lavoro di una pipeline, come la pre-elaborazione e la trasformazione dei dati e l'addestramento di un modello.
  • job di pipeline
    • Una risorsa nell'API Vertex AI corrispondente ai job di Vertex Pipeline. Gli utenti creano un PipelineJob quando vogliono eseguire una pipeline ML su Vertex AI.
  • esecuzione della pipeline
    • È possibile associare uno o più Vertex PipelineJob a un esperimento in cui ogni PipelineJob è rappresentato come una singola esecuzione. In questo contesto, i parametri dell'esecuzione vengono dedotti dai parametri del PipelineJob. Le metriche vengono dedotte dagli artefatti di sistema.Metrica prodotti da quel job PipelineJob. Gli artefatti dell'esecuzione vengono dedotti dagli artefatti prodotti da quel PipelineJob.
  • modello di pipeline
    • Definizione di un flusso di lavoro ML che uno o più utenti possono riutilizzare per creare più esecuzioni della pipeline.
  • ricordo
    • La percentuale di veri vicini più prossimi restituiti dall'indice. Ad esempio, se una query sul vicino più prossimo per 20 vicini più prossimi ha restituito 19 dei vicini più prossimi "dati empirici reali", il richiamo sarà 19/20x100 = 95%.
  • limitazioni
    • Funzionalità per "limitare" le ricerche a un sottoinsieme dell'indice utilizzando le regole booleane. La limitazione è nota anche come "filtro". Con la ricerca vettoriale, puoi utilizzare i filtri numerici e di attributi di testo.
  • account di servizio
    • In Google Cloud, un account di servizio è un particolare tipo di account utilizzato da un'applicazione o da un'istanza di macchina virtuale (VM), non da una persona. Le applicazioni utilizzano account di servizio per effettuare chiamate API autorizzate.
  • metriche di riepilogo
    • Le metriche di riepilogo sono un singolo valore per ogni chiave di metrica nell'esecuzione di un esperimento. Ad esempio, l'accuratezza del test di un esperimento è l'accuratezza calcolata in base a un set di dati di test al termine dell'addestramento, che può essere acquisita come metrica di riepilogo con un singolo valore.
  • TensorBoard
    • TensorBoard è una suite di applicazioni web per la visualizzazione e la comprensione delle esecuzioni e dei modelli TensorFlow. Per ulteriori informazioni, vedi TensorBoard.
  • Nome risorsa TensorBoard
    • Il nome di una risorsa TensorBoard viene utilizzato per identificare completamente un'istanza Vertex AI TensorBoard. Il formato è il seguente: projects/PROJECT_ID_OR_NUMBER/locations/REGION/tensorboards/TENSORBOARD_INSTANCE_ID.
  • Istanza TensorFlow
    • Un'istanza TensorBoard è una risorsa regionalizzata che archivia gli esperimenti Vertex AI TensorBoard associati a un progetto. Puoi creare più istanze TensorBoard in un progetto se, ad esempio, vuoi che siano abilitate più istanze CMEK. Equivale alla risorsa TensorBoard nell'API.
  • TensorFlow Extended (TFX)
    • TensorFlow Extended (tfx), una piattaforma end-to-end per il deployment di pipeline di machine learning di produzione basata sulla piattaforma TensorFlow.
  • sconto temporale
    • L'offset temporale è relativo all'inizio di un video.
  • segmento di tempo
    • Un segmento di tempo è identificato da offset temporali di inizio e fine.
  • metriche delle serie temporali
    • Le metriche delle serie temporali sono valori metriche longitudinali in cui ogni valore rappresenta un passo nella parte della routine di addestramento di una corsa. Le metriche delle serie temporali vengono archiviate in Vertex AI TensorBoard. Vertex AI Experiments archivia un riferimento alla risorsa Vertex TensorBoard.
  • token
    • Un token in un modello linguistico è l'unità atomica su cui il modello sta addestrando e su cui basa le previsioni, ovvero parole, morfemi e caratteri. Nei domini esterni ai modelli linguistici, i token possono rappresentare altri tipi di unità atomiche. Ad esempio, nella visione artificiale, un token potrebbe essere un sottoinsieme di un'immagine.
  • artefatto non gestito
    • Un artefatto esistente al di fuori del contesto di Vertex AI.
  • vettore
    • Un vettore è un elenco di valori in virgola mobile con magnitudo e direzione. Può essere utilizzato per rappresentare qualsiasi tipo di dati, come numeri, punti nello spazio o direzioni.
  • Esperimenti Vertex AI
    • Vertex AI Experiments consente agli utenti di tenere traccia (i) dei passaggi dell'esecuzione di un esperimento, ad esempio pre-elaborazione, addestramento, (ii) input come algoritmo, parametri, set di dati e (iii) output di questi passaggi, ad esempio modelli, punti di controllo e metriche.
  • Esperimento Vertex AI TensorBoard
    • I dati associati a un esperimento possono essere visualizzati nell'applicazione web TensorBoard (scalari, istogrammi, distribuzioni e così via). Gli scalari della serie temporale possono essere visualizzati nella Google Cloud Console. Per saperne di più, consulta Confrontare e analizzare le esecuzioni.
  • SDK Vertex AI per Python
    • L'SDK Vertex AI per Python offre funzionalità simili alla libreria client Python di Vertex AI, ad eccezione del fatto che l'SDK è di livello superiore e meno granulare.
  • Tipo di dati Vertex
    • I tipi di dati di Vertex AI sono "immagine", "testo", "tabulari" e "video".
  • segmento video
    • Un segmento video è identificato dall'offset temporale di inizio e fine di un video.
  • virtual private cloud (VPC)
    • Il virtual cloud privato è un pool on demand configurabile di risorse di computing condivise allocate in un ambiente cloud pubblico e offre un livello di isolamento tra le diverse organizzazioni che utilizzano queste risorse.