Modelli Llama su Vertex AI di Google Cloud

Esegui il deployment dei modelli Llama (della società tecnologica Meta) su Vertex AI per creare agenti e applicazioni di AI pronti per la produzione. Con una gamma di dimensioni e funzionalità dei modelli, puoi scegliere il modello Llama giusto per il tuo caso d'uso specifico, dai modelli leggeri ed efficienti alle versioni multimodali. Accedi a questi modelli come API serverless e sfrutta le loro capacità multimodali e multilingue native per un'intelligenza visiva e testuale altamente efficiente.

Panoramica dei modelli Llama

I modelli linguistici di grandi dimensioni (LLM) open source di Llama offrono agli sviluppatori la trasparenza e la flessibilità necessarie per l'innovazione, consentendo un facile deployment, un'efficienza in termini di costi e prestazioni scalabili. Quando crei con Llama su Vertex AI, combini i vantaggi dei modelli aperti all'avanguardia con la sicurezza, la scalabilità e gli strumenti gestiti di livello enterprise della piattaforma AI completa di Google Cloud.

LLM accessibili pubblicamente, creati per la scalabilità

Llama 4 Maverick, con 17 miliardi di parametri attivi, è un modello multimodale addestrato da 128 esperti che offre un equilibrio ottimale tra intelligenza, costo e velocità. Llama 4 Maverick offre la comprensione di immagini e testi, consentendo la creazione di applicazioni di AI sofisticate che superano le barriere linguistiche. I modelli Llama 4 offrono funzionalità di programmazione, ragionamento e immagini e sono caratterizzati da un'architettura mixture-of-experts (MoE) di reti neurali.

I principali casi d'uso includono la traduzione linguistica, il riassunto di più documenti e la creazione di contenuti. Può anche fornire assistenza personale, supportare l'istruzione e l'apprendimento, aiutare nella ricerca e ragionare su vaste basi di codice.

Llama 4 Maverick

LLM accessibili pubblicamente, creati per la scalabilità

Llama 4 Maverick, con 17 miliardi di parametri attivi, è un modello multimodale addestrato da 128 esperti che offre un equilibrio ottimale tra intelligenza, costo e velocità. Llama 4 Maverick offre la comprensione di immagini e testi, consentendo la creazione di applicazioni di AI sofisticate che superano le barriere linguistiche. I modelli Llama 4 offrono funzionalità di programmazione, ragionamento e immagini e sono caratterizzati da un'architettura mixture-of-experts (MoE) di reti neurali.

I principali casi d'uso includono la traduzione linguistica, il riassunto di più documenti e la creazione di contenuti. Può anche fornire assistenza personale, supportare l'istruzione e l'apprendimento, aiutare nella ricerca e ragionare su vaste basi di codice.

Lama 4 Scout

Llama 4 Scout: un modello multimodale nativo leader nella sua categoria

Llama 4 Scout è un potente modello di AI multimodale che offre prestazioni elevate per attività molto complesse. È in grado di esplorare prompt aperti e scenari non visivi con fluidità.

I casi d'uso principali includono app di assistenza multimodale come la creazione di chatbot con testo e immagini, il debug delle attività di generazione di codice, le applicazioni con contesto lungo, i flussi di lavoro multi-agente e il processo decisionale basato sui dati.

Llama 3.3 70B

Llama 3.3 70B: modello di AI open source

Llama 3.3 70B è un modello solo testo distribuibile tramite la piattaforma Vertex AI, altamente ottimizzato per le prestazioni e l'efficienza nella gestione di un'ampia gamma di attività basate sul linguaggio, che offre agli sviluppatori un'applicazione leggera che riduce i costi.

I casi d'uso principali includono il deployment nell'assistenza clienti, la generazione e il debug del codice e i dati di addestramento.

Llama 3.2 90B

Llama 3.2 90B: un modello multimodale leggero

Llama 3.2 90B, un modello multimodale, efficiente e flessibile in grado di comprendere immagini ad alta risoluzione.

I casi d'uso principali includono la funzionalità di ricerca visiva che consente agli utenti di trovare prodotti utilizzando immagini come e-commerce, scansioni mediche, analisi dei dati per documenti complessi, generazione di contenuti e può essere consapevole del contesto.

Llama e Google Cloud

Vantaggi e funzionalità dei modelli Llama su Vertex AI

Accelera lo sviluppo dell'IA

Vertex AI fornisce un ambiente integrato per la valutazione, il deployment e la gestione di applicazioni basate su Llama in modo rapido e su larga scala.

Ottimizza prestazioni e costi

Semplifica il modo in cui esegui il deployment e la scalabilità dei modelli Llama con un'infrastruttura completamente gestita progettata per i workload di AI e la possibilità di scegliere tra modelli di prezzi flessibili come gli endpoint dedicati o il pagamento a consumo.

Crea agenti di AI sofisticati

Sviluppa agenti con gli strumenti di Vertex AI e le funzionalità avanzate dei modelli Llama.

Sicurezza, conformità e governance dei dati integrate

Sfrutta le funzionalità integrate di Google Cloud per sicurezza, privacy, governance dei dati e conformità personalizzate per aderire agli standard di livello aziendale.

Massimizza la potenza dei tuoi dati

Integra i dati aziendali con le funzionalità avanzate di Claude, sfruttando strumenti come BigQuery per estrarre insight preziosi e favorire un processo decisionale consapevole.

Funzionalità migliorate

I modelli Llama dimostrano capacità avanzate in ragionamento complesso, analisi visiva, generazione di codice ed elaborazione multilingue. Questi modelli possono seguire istruzioni complesse e generare risultati sfumati e completi.

Modelli Llama su Vertex AI di Google Cloud

Inizia a creare

Inizia a creare

Inizia a creare

Inizia a creare

Llama 4 Maverick

Inizia a creare

Lama 4 Scout

Inizia a creare

Llama 3.3 70B

Inizia a creare

Llama 3.2 90B

Inizia a creare

Llama e Google Cloud

Vantaggi e funzionalità dei modelli Llama su Vertex AI

Accelera lo sviluppo dell'IA

Ottimizza prestazioni e costi

Crea agenti di AI sofisticati

Sicurezza, conformità e governance dei dati integrate

Massimizza la potenza dei tuoi dati

Funzionalità migliorate

Crea con Llama su Vertex AI