Ogni servizio Vertex AI richiede risorse di calcolo diverse, incluse le unità di elaborazione grafica (GPU), come descritto in Pianificazione della capacità e requisiti di calcolo. Questa pagina descrive come eseguire il provisioning delle risorse GPU per eseguire carichi di lavoro di intelligenza artificiale (AI) e machine learning (ML) in un ambiente GPU. Questa pagina ti guida anche nell'abilitazione delle API preaddestrate Vertex AI sull'appliance isolata Google Distributed Cloud (GDC) in modo da poter iniziare a implementare le funzionalità di Vertex AI.
La maggior parte delle attività per configurare le risorse GPU e attivare o disattivare le API preaddestrate di Vertex AI richiede l'accesso amministrativo. Se non disponi delle autorizzazioni necessarie, chiedi all'amministratore di abilitare le GPU e le API preaddestrate di Vertex AI per tuo conto.
Vertex AI sull'appliance air-gapped GDC include tre API, una per ciascuno dei suoi modelli preaddestrati. Per saperne di più su questi modelli preaddestrati, consulta la seguente documentazione:
- Riconoscimento ottico dei caratteri (OCR): scopri di più sulle funzionalità di riconoscimento dei caratteri.
- Speech-to-Text: scopri di più sulle funzionalità di riconoscimento vocale.
- Vertex AI Translation: scopri di più sulle funzionalità di traduzione.
Utilizza la console GDC per attivare, disattivare e visualizzare gli endpoint delle API preaddestrate di Vertex AI.
Prima di iniziare
Per ottenere le autorizzazioni necessarie per abilitare le API preaddestrate, chiedi all'amministratore IAM dell'organizzazione o all'amministratore IAM del progetto di concederti il ruolo AI Platform Admin (ai-platform-admin
) nello spazio dei nomi del progetto.
Per informazioni su questo ruolo, consulta Preparare le autorizzazioni IAM. Per scoprire come concedere le autorizzazioni a un soggetto, consulta Concedere e revocare l'accesso.
Segui questi passaggi per eseguire il provisioning delle GPU prima di attivare le API pre-addestrate:
- Configura un progetto per utilizzare Vertex AI.
- Assicurati che il tuo progetto abbia configurato la comunicazione in entrata adeguata.
- Gestisci i carichi di lavoro delle GPU.
- Accedi alla console GDC. Se non riesci ad accedere, consulta Recuperare il dispositivo se il provider di identità non è disponibile.
Abilitare le API preaddestrate
Puoi abilitare le API preaddestrate OCR, Speech-to-Text e Vertex AI Translation utilizzando la console GDC.
Dopo aver soddisfatto i prerequisiti, segui questi passaggi per abilitare le API preaddestrate:
- Accedi alla console GDC.
- Nel menu di navigazione, fai clic su Vertex AI > API preaddestrate.
Nella pagina API pre-addestrate, fai clic su Abilita in un servizio specifico per abilitare l'API.
Nella finestra di dialogo di conferma, fai clic su Attiva. Viene visualizzato un messaggio di avanzamento.
La durata dell'attivazione varia. Il completamento dell'operazione potrebbe richiedere dai 15 ai 45 minuti.
Se vuoi visualizzare lo stato delle API preaddestrate, visualizza lo stato e gli endpoint del servizio.
Disattivare le API preaddestrate
Puoi disattivare le API preaddestrate OCR, Speech-to-Text e Vertex AI Translation utilizzando la console GDC.
Dopo aver soddisfatto i prerequisiti, segui questi passaggi per disattivare le API preaddestrate:
- Accedi alla console GDC.
- Nel menu di navigazione, fai clic su Vertex AI > API preaddestrate.
Nella pagina API pre-addestrate, fai clic su Disattiva su un servizio specifico per disattivare l'API.
Nella finestra di dialogo di conferma, inserisci
disable
nel campo di testo per confermare che vuoi eseguire l'azione. Quindi, fai clic su Disattiva. Viene visualizzato un messaggio di avanzamento.
Se vuoi visualizzare lo stato delle API preaddestrate, visualizza lo stato e gli endpoint del servizio.