Panoramica dei modelli dei partner su Vertex AI

Vertex AI supporta un elenco selezionato di modelli sviluppati dai partner di Google. I modelli partner possono essere utilizzati con Vertex AI as a Service (MaaS) e sono offerti come API gestita. Quando utilizzi un modello partner, continui a per inviare le richieste agli endpoint Vertex AI. I modelli dei partner sono serverless senza dover eseguire il provisioning o gestire l'infrastruttura.

I modelli partner possono essere scoperti utilizzando Model Garden. Puoi anche il deployment dei modelli usando Model Garden. Per ulteriori informazioni, vedi Esplora i modelli di IA in Model Garden. Sebbene le informazioni su ogni modello partner disponibile siano disponibili nel relativo modello di Model Garden, solo i modelli di terze parti che funzionano come MaaS con Vertex AI è documentato in questa guida.

I modelli antropici di Claude sono un esempio di modelli gestiti da terze parti disponibili per l'uso su Vertex AI. Per scoprire come utilizzare i modelli Claude, vedi Utilizza i modelli di Claude di Anthropic.

Prestazioni prevedibili con garanzia della capacità

Google offre la velocità effettiva sottoposta a provisioning per i modelli partner che prenotano la velocità effettiva per i tuoi modelli a una tariffa fissa. Sei tu a decidere la capacità della velocità effettiva e in quali regioni riservare questa capacità. Poiché la velocità effettiva sottoposta a provisioning hanno la priorità sulle richieste standard con pagamento a consumo, sottoposte a provisioning offre una maggiore disponibilità. Quando il sistema è sovraccarico, richieste possono comunque essere completate purché la velocità effettiva rimanga inferiore al di velocità effettiva prenotata. Per ulteriori informazioni o per abbonarti al servizio, Contatta il team di vendita.