Panoramica di Vertex AI

Vertex AI sull'appliance air-gapped di Google Distributed Cloud (GDC) porta la potenza di una piattaforma di machine learning (ML) e intelligenza artificiale (AI) sul tuo dispositivo portatile sicuro. L'appliance air-gap GDC fornisce l'accesso a un insieme selezionato di API Vertex AI preaddestrate, consentendo funzionalità di AI nella tua soluzione cloud privata.

Funzionalità principali

Vertex AI sull'appliance air-gapped GDC offre le seguenti funzionalità:

  • Deployment air-gap: esegui i servizi Vertex AI interamente all'interno del tuo dispositivo portatile, garantendo la sovranità e la conformità dei dati.
  • Esperienza Vertex AI familiare: sfrutta gli stessi strumenti e API di Google Cloud, semplificando lo sviluppo e la gestione.
  • Modelli e algoritmi predefiniti: accedi a una gamma di modelli preaddestrati per attività di machine learning comuni, riducendo il time to value.

Servizi disponibili

Vertex AI sull'appliance GDC air-gapped offre i seguenti servizi preaddestrati:

Pianificazione della capacità e requisiti di calcolo

Ogni servizio Vertex AI richiede risorse di computing diverse. La tabella seguente fornisce i requisiti per ciascun modello preaddestrato:

API preaddestrata Risorse di computing Requisiti per il conteggio delle GPU Requisiti di memoria GPU
Riconoscimento ottico dei caratteri (OCR) GPU Una singola GPU A100 da 80 GB 40 GB
Speech-to-Text CPU Non applicabile (solo CPU) Non applicabile (solo CPU)
Vertex AI Translation GPU Una singola GPU A100 da 80 GB 50 GB

L'appliance GDC air-gapped include una singola GPU NVIDIA A100 da 80 GB. In questo modo, il dispositivo può eseguire solo un'API Vertex AI preaddestrata dipendente dalla GPU alla volta. Se provi ad attivare sia Vertex AI Translation sia l'OCR, l'attivazione della seconda API non andrà a buon fine e verrà visualizzato un messaggio di errore che indica risorse GPU insufficienti. Tuttavia, puoi eseguire Speech-to-Text insieme a Vertex AI Translation o OCR, in quanto Speech-to-Text richiede solo risorse CPU.

Per aiutarti a determinare il numero di unità appliance necessarie per i tuoi carichi di lavoro AI/ML, consulta i seguenti limiti di capacità per ogni API preaddestrata di Vertex AI:

API preaddestrata Capacità per unità appliance
Riconoscimento ottico dei caratteri (OCR) Fino a 30 immagini al minuto (un'immagine ogni due secondi).
Speech-to-Text Fino a sette minuti di audio trascritti al minuto (sette secondi di audio trascritti al secondo).
Vertex AI Translation Fino a 61.000 caratteri al minuto (1024 caratteri al secondo).

Quando pianifichi l'implementazione, tieni presente le seguenti indicazioni:

  • I limiti di capacità sono approssimativi e non garantiti. La capacità effettiva può variare a seconda di fattori quali:

    • Complessità dei dati di input (ad esempio, lingua per la traduzione, qualità dell'immagine per l'OCR e chiarezza dell'audio per Speech-to-Texte).
    • Configurazione specifica dell'appliance.
    • Utilizzo simultaneo di altri servizi sull'appliance.
  • Può essere attiva una sola API che richiede un uso intensivo della GPU (Vertex AI Translation o OCR) alla volta perché l'appliance GDC air-gap è limitata a una sola GPU A100 da 80 GB.

  • Stima l'utilizzo di picco e la potenziale crescita futura.

  • Per i workload impegnativi che richiedono una velocità effettiva maggiore, valuta la possibilità di eseguire il deployment di più unità appliance.

La tabella seguente illustra i requisiti di archiviazione per ciascun servizio Vertex AI sull'appliance GDC air-gapped:

Componente Requisiti di archiviazione
Frontend OCR 0,1 GB
Backend OCR 5 GB
Estrattore OCR 0,1 GB
Frontend Speech-to-Text 0,1 GB
Backend di Speech-to-Text 1,5 GB
Frontend di Vertex AI Translation 0,7 GB
Backend di Vertex AI Translation 61,4 GB

Assicurati che l'appliance disponga di capacità di archiviazione sufficiente per ospitare i servizi Vertex AI che intendi utilizzare.

Vantaggi

Vertex AI sull'appliance GDC con air gap offre i seguenti vantaggi:

  • Esperienza di sviluppo fluida: utilizza gli stessi strumenti, API e flussi di lavoro di Vertex AI su Google Cloud, rendendo lo sviluppo e la gestione intuitivi ed efficienti.
  • Maggiore sicurezza e privacy: mantieni il controllo completo sui tuoi dati e rispetta i requisiti normativi.
  • Tempi di ottenimento del valore più rapidi: utilizza modelli preaddestrati per le attività di machine learning comuni.
  • MLOps semplificate: usufruisci di solide funzionalità di machine learning per integrazioni di AI perfette nel tuo ambiente isolato.

Per iniziare

Per iniziare a utilizzare Vertex AI sull'appliance air-gap GDC, procedi nel seguente modo: