Panoramica dei modelli dei partner su Vertex AI

Vertex AI supporta un elenco selezionato di modelli sviluppati dai partner di Google. I modelli partner possono essere utilizzati con Vertex AI come Model as a Service (MaaS) e vengono offerti come API gestita. Quando usi un modello partner, continui a inviare le richieste agli endpoint Vertex AI. I modelli dei partner sono serverless, quindi non occorre gestire o eseguire il provisioning dell'infrastruttura.

I modelli dei partner possono essere scoperti utilizzando Model Garden. Puoi anche eseguire il deployment dei modelli utilizzando Model Garden. Per maggiori informazioni, consulta Esplorazione di modelli di IA in Model Garden. Sebbene le informazioni su ogni modello partner disponibile siano disponibili nella relativa scheda in Model Garden, in questa guida sono documentati solo i modelli di terze parti che si comportano come MaaS con Vertex AI.

I modelli antropici di Claude sono un esempio di modelli gestiti di terze parti disponibili per l'uso su Vertex AI. Per informazioni su come utilizzare i modelli Claude, consulta Utilizzare i modelli Claude di Anthropic.

Prestazioni prevedibili con la garanzia della capacità

Google offre la velocità effettiva sottoposta a provisioning per i modelli partner che riservano capacità di velocità effettiva per i tuoi modelli a una tariffa fissa. Sei tu a decidere la capacità di velocità effettiva e in quali regioni prenotarla. Poiché le richieste di velocità effettiva sottoposta a provisioning hanno la priorità sulle richieste standard con pagamento a consumo, la velocità effettiva sottoposta a provisioning offre una maggiore disponibilità. Quando il sistema è sovraccarico, le richieste possono comunque essere completate, purché la velocità effettiva rimanga al di sotto della capacità di velocità effettiva prenotata. Per ulteriori informazioni o per abbonarti al servizio, contatta il team di vendita.