Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Vertex AI sull'appliance air-gapped di Google Distributed Cloud (GDC) porta la potenza di una piattaforma di machine learning (ML) e intelligenza artificiale (AI) sul tuo dispositivo portatile sicuro. L'appliance air-gap GDC fornisce l'accesso a un insieme selezionato di
API Vertex AI preaddestrate, consentendo funzionalità di AI nella tua soluzione
cloud privata.
Funzionalità principali
Vertex AI sull'appliance air-gapped GDC offre le seguenti funzionalità:
Deployment air-gap: esegui i servizi Vertex AI interamente all'interno del tuo dispositivo portatile, garantendo la sovranità e la conformità dei dati.
Esperienza Vertex AI familiare: sfrutta gli stessi strumenti
e API di Google Cloud, semplificando lo sviluppo e la gestione.
Modelli e algoritmi predefiniti: accedi a una gamma di modelli preaddestrati
per attività di machine learning comuni, riducendo il time to value.
Servizi disponibili
Vertex AI sull'appliance GDC air-gapped offre i seguenti servizi preaddestrati:
Pianificazione della capacità e requisiti di calcolo
Ogni servizio Vertex AI richiede risorse di computing diverse. La
tabella seguente fornisce i requisiti per ciascun modello preaddestrato:
API preaddestrata
Risorse di computing
Requisiti per il conteggio delle GPU
Requisiti di memoria GPU
Riconoscimento ottico dei caratteri (OCR)
GPU
Una singola GPU A100 da 80 GB
40 GB
Speech-to-Text
CPU
Non applicabile (solo CPU)
Non applicabile (solo CPU)
Vertex AI Translation
GPU
Una singola GPU A100 da 80 GB
50 GB
L'appliance GDC air-gapped include una singola GPU NVIDIA A100 da 80 GB. In questo modo, il dispositivo può eseguire solo un'API Vertex AI preaddestrata dipendente dalla GPU alla volta. Se provi ad attivare sia Vertex AI Translation
sia l'OCR, l'attivazione della seconda API non andrà a buon fine e verrà visualizzato un messaggio di errore
che indica risorse GPU insufficienti. Tuttavia, puoi eseguire
Speech-to-Text insieme a Vertex AI Translation o OCR,
in quanto Speech-to-Text richiede solo risorse CPU.
Per aiutarti a determinare il numero di unità appliance necessarie per i tuoi carichi di lavoro AI/ML, consulta i seguenti limiti di capacità per ogni API preaddestrata di Vertex AI:
API preaddestrata
Capacità per unità appliance
Riconoscimento ottico dei caratteri (OCR)
Fino a 30 immagini al minuto (un'immagine ogni due secondi).
Speech-to-Text
Fino a sette minuti di audio trascritti al minuto (sette secondi di audio trascritti al secondo).
Vertex AI Translation
Fino a 61.000 caratteri al minuto (1024 caratteri al secondo).
Quando pianifichi l'implementazione, tieni presente le seguenti indicazioni:
I limiti di capacità sono approssimativi e non garantiti. La capacità effettiva può variare a seconda di fattori quali:
Complessità dei dati di input (ad esempio, lingua per la traduzione, qualità
dell'immagine per l'OCR e chiarezza dell'audio per Speech-to-Texte).
Configurazione specifica dell'appliance.
Utilizzo simultaneo di altri servizi sull'appliance.
Può essere attiva una sola API che richiede un uso intensivo della GPU (Vertex AI Translation o OCR) alla volta perché l'appliance GDC air-gap è limitata a una sola GPU A100 da 80 GB.
Stima l'utilizzo di picco e la potenziale crescita futura.
Per i workload impegnativi che richiedono una velocità effettiva maggiore, valuta la possibilità di eseguire il deployment
di più unità appliance.
La tabella seguente illustra i requisiti di archiviazione per ciascun
servizio Vertex AI sull'appliance GDC air-gapped:
Componente
Requisiti di archiviazione
Frontend OCR
0,1 GB
Backend OCR
5 GB
Estrattore OCR
0,1 GB
Frontend Speech-to-Text
0,1 GB
Backend di Speech-to-Text
1,5 GB
Frontend di Vertex AI Translation
0,7 GB
Backend di Vertex AI Translation
61,4 GB
Assicurati che l'appliance disponga di capacità di archiviazione sufficiente per ospitare i servizi Vertex AI che intendi utilizzare.
Vantaggi
Vertex AI sull'appliance GDC con air gap offre i seguenti vantaggi:
Esperienza di sviluppo fluida: utilizza gli stessi strumenti, API e flussi di lavoro
di Vertex AI su Google Cloud, rendendo lo sviluppo e la gestione
intuitivi ed efficienti.
Maggiore sicurezza e privacy: mantieni il controllo completo sui tuoi dati
e rispetta i requisiti normativi.
Tempi di ottenimento del valore più rapidi: utilizza modelli preaddestrati per le attività di machine learning comuni.
MLOps semplificate: usufruisci di solide funzionalità di machine learning
per integrazioni di AI perfette nel tuo ambiente
isolato.
Per iniziare
Per iniziare a utilizzare Vertex AI sull'appliance air-gap GDC, procedi nel seguente modo:
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Difficile da capire","hardToUnderstand","thumb-down"],["Informazioni o codice di esempio errati","incorrectInformationOrSampleCode","thumb-down"],["Mancano le informazioni o gli esempi di cui ho bisogno","missingTheInformationSamplesINeed","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-09-04 UTC."],[],[],null,["# Vertex AI overview\n\nVertex AI on Google Distributed Cloud (GDC) air-gapped appliance brings the power of a\nmachine learning (ML) and artificial intelligence (AI) platform to your secure\nportable device. GDC air-gapped appliance provides access to a select set of\npre-trained Vertex AI APIs, enabling AI capabilities in your private\ncloud solution.\n\nKey features\n------------\n\nVertex AI on GDC air-gapped appliance offers you the following features:\n\n- **Air-gapped deployment**: Run Vertex AI services entirely within your portable device, ensuring data sovereignty and compliance.\n- **Familiar Vertex AI experience**: Take advantage of the same tools and APIs from Google Cloud, simplifying development and management.\n- **Pre-built models and algorithms**: Access a range of pre-trained models for common machine learning tasks, accelerating your time to value.\n\nAvailable services\n------------------\n\nVertex AI on GDC air-gapped appliance offers the following pre-trained\nservices:\n\n- [**Optical Character Recognition (OCR)**](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-ocr): Extract text from images and files.\n- [**Speech-to-Text**](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-stt): Convert spoken language into written text.\n- [**Vertex AI Translation**](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-translation): Translate text between multiple languages.\n\n| **Caution:** GDC air-gapped appliance includes a single NVIDIA A100 80 GB GPU. This limits the device to running only *one* GPU-dependent Vertex AI pre-trained API at a time. For more information, see [Capacity planning and computing requirements](#capacity).\n\nCapacity planning and computing requirements\n--------------------------------------------\n\nEach Vertex AI service requires different computing resources. The\nfollowing table provides the requirements for each pre-trained model:\n\nGDC air-gapped appliance includes a single NVIDIA A100 80 GB GPU. This\nlimits the device to running only *one* GPU-dependent Vertex AI\npre-trained API at a time. If you attempt to enable both Vertex AI Translation\nand OCR, the second API will fail to enable with an error\nmessage indicating insufficient GPU resources. You can, however, run\nSpeech-to-Text alongside either Vertex AI Translation or OCR,\nas Speech-to-Text only requires CPU resources.\n\nTo help you determine the number of appliance units needed for your AI/ML\nworkloads, review the following capacity limits for each Vertex AI\npre-trained API:\n\nWhen you plan your deployment, consider the following guidance:\n\n- The capacity limits are approximate and not guaranteed. Actual capacity might\n vary depending on factors such as the following:\n\n - Complexity of the input data (for example, language for translation, image quality for OCR, and audio clarity for Speech-to-Text).\n - Specific configuration of the appliance.\n - Concurrent usage of other services on the appliance.\n- Only one GPU-intensive API (Vertex AI Translation or OCR) can\n be active at a time because GDC air-gapped appliance is limited to a single\n A100 80 GB GPU.\n\n- Estimate your peak usage and potential future growth.\n\n- For demanding workloads requiring higher throughput, consider deploying\n multiple appliance units.\n\nThe following table outlines the storage requirements for each\nVertex AI service on GDC air-gapped appliance:\n\nEnsure that your appliance has sufficient storage capacity to accommodate the\nVertex AI services you intend to use.\n\nBenefits\n--------\n\nVertex AI on GDC air-gapped appliance offers the following benefits:\n\n- **Seamless development experience**: Use the same tools, APIs, and workflows of Vertex AI on Google Cloud, making development and management intuitive and efficient.\n- **Enhanced security and privacy**: Maintain complete control over your data and comply with regulatory requirements.\n- **Accelerated time to value**: Use pre-trained models for common machine learning tasks.\n- **Streamlined MLOps**: Benefit from robust machine learning operation capabilities for seamless AI integrations within your air-gapped environment.\n\nGetting started\n---------------\n\nTo get started with Vertex AI on GDC air-gapped appliance, do the\nfollowing:\n\n- [Learn about essential roles and permissions for available services](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-ao-permissions).\n- [Set up a project for your AI and machine learning workloads](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-set-up-project).\n- [Provision GPUs and enable the Vertex AI services](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-enable-pre-trained-apis).\n- [Install the Vertex AI client libraries](/distributed-cloud/hosted/docs/latest/appliance/application/ao-user/vertex-ai-install-libraries)."]]