Panoramica dei modelli dei partner su Vertex AI

Vertex AI supporta un elenco selezionato di modelli sviluppati dai partner di Google. I modelli partner possono essere utilizzati con Vertex AI as a Service (MaaS) e sono offerti come API gestita. Quando utilizzi un modello partner, continui a per inviare le richieste agli endpoint Vertex AI. I modelli dei partner sono serverless senza dover eseguire il provisioning o gestire l'infrastruttura.

I modelli partner possono essere scoperti utilizzando Model Garden. Puoi anche il deployment dei modelli usando Model Garden. Per ulteriori informazioni, vedi Esplora i modelli di IA in Model Garden. Sebbene le informazioni su ogni modello partner disponibile siano disponibili nel relativo modello di Model Garden, solo i modelli di terze parti che funzionano come MaaS con Vertex AI è documentato in questa guida.

I modelli antropici di Claude e Mistral sono esempi di modelli gestiti da terze parti disponibili su Vertex AI.

Prestazioni prevedibili con garanzia della capacità

Google offre la velocità effettiva sottoposta a provisioning per alcuni modelli dei partner che prenotano per i tuoi modelli a una tariffa fissa. Sei tu a decidere di velocità effettiva elevata e in quali regioni riservarla. Poiché le richieste di velocità effettiva di cui è stato eseguito il provisioning hanno la priorità rispetto alle richieste di velocità effettiva standard con pagamento a consumo la velocità effettiva di cui è stato eseguito il provisioning offre maggiore disponibilità. Quando se il sistema è sovraccarico, le tue richieste potranno comunque essere completate a condizione che rimane al di sotto della capacità di velocità effettiva prenotata. Per ulteriori informazioni o per abbonarti al servizio, contatta il team di vendita.

Abilita modelli partner per gli utenti

Per abilitare i modelli dei partner ed effettuare una richiesta di prompt, un Google Cloud amministratore deve impostare le autorizzazioni richieste e verificare il criterio dell'organizzazione consente l'uso dei di terze parti.

Imposta le autorizzazioni richieste

Per utilizzare i modelli dei partner, sono necessari i ruoli e le autorizzazioni seguenti:

  • Devi avere il Gestore entitlement di approvvigionamento consumer Ruolo IAM (Identity and Access Management). Chiunque abbia ricevuto questo ruolo può abilitare i modelli partner in Model Garden.

  • Devi disporre dell'autorizzazione aiplatform.endpoints.predict. Questo sia inclusa nel ruolo IAM Utente Vertex AI. Per ulteriori informazioni, consulta Vertex AI Utente e Accesso di controllo.

Console

  1. Per concedere IAM al Gestore entitlement di approvvigionamento consumer ruoli a un utente, vai alla pagina IAM.

    Vai a IAM

  2. Nella colonna Entità, individua l'utente. principal per il quale hai abilitare l'accesso ai modelli dei partner, quindi fare clic su Modifica entità nella riga corrispondente.

  3. Nel riquadro Modifica accesso, fai clic su Aggiungi un altro ruolo.

  4. In Seleziona un ruolo, seleziona Gestore diritti approvvigionamento consumer.

  5. Nel riquadro Modifica accesso, fai clic su Aggiungi un altro ruolo.

  6. In Seleziona un ruolo, seleziona Utente Vertex AI.

  7. Fai clic su Salva.

gcloud

  1. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

  2. Concedi il ruolo Gestore entitlement di approvvigionamento consumer necessario per abilitare i modelli dei partner in Model Garden

    gcloud projects add-iam-policy-binding  PROJECT_ID \
    --member=PRINCIPAL --role=roles/consumerprocurement.entitlementManager
    
  3. Concedi il ruolo Vertex AI User che include aiplatform.endpoints.predict autorizzazione necessaria per rendere richieste di prompt:

    gcloud projects add-iam-policy-binding  PROJECT_ID \
    --member=PRINCIPAL --role=roles/aiplatform.user
    

    Sostituisci PRINCIPAL con l'identificatore di l'entità. L'identificatore assume la forma user|group|serviceAccount:email o domain:domain, per ad esempio user:cloudysanfrancisco@gmail.com, group:admins@example.com, serviceAccount:test123@example.domain.com o domain:example.domain.com,

    L'output è un elenco di associazioni di criteri che include quanto segue:

    - members:
      - user:PRINCIPAL
      role: roles/roles/consumerprocurement.entitlementManager
    

    Per ulteriori informazioni, vedi Assegna un singolo ruolo e gcloud projects add-iam-policy-binding

Imposta il criterio dell'organizzazione

Per abilitare i modelli dei partner, i criteri dell'organizzazione devono consentire quanto segue API:

  • Cloud Commerce Consumer Procurement API - cloudcommerceconsumerprocurement.googleapis.com
  • API Commerce Agreement - commerceagreement.googleapis.com

Se la tua organizzazione imposta un criterio dell'organizzazione su limitare l'utilizzo del servizio, un amministratore dell'organizzazione deve verificare cloudcommerceconsumerprocurement.googleapis.com e commerceagreement.googleapis.com consentiti da l'impostazione del criterio dell'organizzazione.