Vertex AI supporta un elenco selezionato di modelli sviluppati dai partner di Google. I modelli dei partner possono essere utilizzati con Vertex AI come servizio di modelli come servizio (MaaS) e sono offerti come API gestite. Quando utilizzi un modello di un partner, continui a inviare le richieste agli endpoint Vertex AI. I modelli del partner sono serverless, quindi non è necessario eseguire il provisioning o gestire l'infrastruttura.
I modelli dei partner possono essere scoperti utilizzando Model Garden. Puoi anche eseguire il deployment dei modelli utilizzando Model Garden. Per ulteriori informazioni, consulta Esplora i modelli di IA in Model Garden. Sebbene le informazioni su ciascun modello partner disponibile siano disponibili nella relativa scheda in Model Garden, in questa guida sono documentati solo i modelli di terze parti che funzionano come MaaS con Vertex AI.
I modelli Claude e Mistral di Anthropic sono esempi di modelli gestiti di terze parti che possono essere utilizzati su Vertex AI.
Prezzi dei modelli partner di Vertex AI con garanzia della capacità
Google offre il throughput riservato per alcuni modelli di partner che riserva la capacità di throughput per i tuoi modelli a una tariffa fissa. Sei tu a decidere la capacità di throughput e in quali regioni prenotarla. Poiché le richieste di throughput provisionato hanno la priorità sulle richieste con pagamento a consumo standard, il throughput provisionato offre una maggiore disponibilità. Quando il sistema è sovraccaricato, le richieste possono comunque essere completate purché il throughput rimanga al di sotto della capacità di throughput riservata. Per ulteriori informazioni o per abbonarti al servizio, contatta il team di vendita.
Concedere l'accesso degli utenti ai modelli di partner
Per attivare i modelli di partner ed effettuare una richiesta di prompt, un amministratore Google Clouddeve impostare le autorizzazioni richieste e verificare che i criteri dell'organizzazione consentano l'utilizzo delle API richieste.
Impostare le autorizzazioni necessarie per utilizzare i modelli di partner
Per utilizzare i modelli dei partner sono richiesti i seguenti ruoli e autorizzazioni:
Devi disporre del ruolo IAM (Identity and Access Management) Gestore entitlement approvvigionamento consumer. Chiunque abbia ricevuto questo ruolo può attivare i modelli di partner in Model Garden.
Devi disporre dell'autorizzazione
aiplatform.endpoints.predict
. Questa autorizzazione è inclusa nel ruolo IAM Utente Vertex AI. Per ulteriori informazioni, consulta Utente Vertex AI e Controllo accessi.
Console
Per concedere a un utente i ruoli IAM Gestore entitlement approvvigionamento consumer, vai alla pagina IAM.
Nella colonna Principale, individua l'entità utente per cui vuoi attivare l'accesso ai modelli di partner e fai clic su Modifica entità nella riga corrispondente.
Nel riquadro Modifica accesso, fai clic su
Aggiungi un altro ruolo.In Seleziona un ruolo, seleziona Consumer Procurement Entitlement Manager.
Nel riquadro Modifica accesso, fai clic su
Aggiungi un altro ruolo.In Seleziona un ruolo, seleziona Utente Vertex AI.
Fai clic su Salva.
gcloud
-
In the Google Cloud console, activate Cloud Shell.
Concedi il ruolo Gestore entitlement approvvigionamento consumer necessario per attivare i modelli di partner in Model Garden
gcloud projects add-iam-policy-binding PROJECT_ID \ --member=PRINCIPAL --role=roles/consumerprocurement.entitlementManager
Concedi il ruolo Utente Vertex AI che include l'autorizzazione
aiplatform.endpoints.predict
necessaria per effettuare richieste di prompt:gcloud projects add-iam-policy-binding PROJECT_ID \ --member=PRINCIPAL --role=roles/aiplatform.user
Sostituisci
PRINCIPAL
con l'identificatore per l'entità. L'identificatore ha la formauser|group|serviceAccount:email
odomain:domain
, ad esempiouser:cloudysanfrancisco@gmail.com
,group:admins@example.com
,serviceAccount:test123@example.domain.com
odomain:example.domain.com
.L'output è un elenco di associazioni di criteri che include quanto segue:
- members: - user:PRINCIPAL role: roles/roles/consumerprocurement.entitlementManager
Per ulteriori informazioni, consulta Concedere un singolo ruolo e
gcloud projects add-iam-policy-binding
.
Impostare il criterio dell'organizzazione per l'accesso al modello di partner
Per attivare i modelli di partner, le norme dell'organizzazione devono consentire le seguenti API:
- Cloud Commerce Consumer Procurement API -
cloudcommerceconsumerprocurement.googleapis.com
- API Commerce Agreement -
commerceagreement.googleapis.com
Se la tua organizzazione imposta un criterio per limitare l'utilizzo dei servizi, un amministratore dell'organizzazione deve verificare che cloudcommerceconsumerprocurement.googleapis.com
e commerceagreement.googleapis.com
siano consentiti impostando il criterio dell'organizzazione.
Inoltre, se hai un criterio dell'organizzazione che limita l'utilizzo dei modelli in Model Garden, il criterio deve consentire l'accesso ai modelli dei partner. Per ulteriori informazioni, consulta Controllare l'accesso al modello.
Conformità alle normative del modello di partner
Le certificazioni per l'AI generativa su Vertex AI continuano a essere applicate quando i modelli dei partner vengono utilizzati come API gestite utilizzando Vertex AI. Se hai bisogno di dettagli sui modelli stessi, puoi trovare ulteriori informazioni nella rispettiva scheda del modello o contattare il rispettivo editore del modello.
I tuoi dati vengono archiviati in modalità at-rest all'interno della regione o della regione multipla selezionata per i modelli partner su Vertex AI, ma la regionalizzazione dell'elaborazione dei dati può variare. Per un elenco dettagliato degli impegni relativi al trattamento dei dati dei modelli partner, consulta Residenza dei dati per i modelli partner.
I prompt dei clienti e le risposte del modello non vengono condivisi con terze parti quando si utilizza l'API Vertex AI, inclusi i modelli dei partner. Google tratta i Dati del cliente solo in base alle istruzioni del Cliente, come descritto in maggiore dettaglio nel nostro Addendum per il trattamento dei dati Cloud.