I modelli Qwen su Vertex AI offrono modelli completamente gestiti e serverless come API. Per utilizzare un modello Qwen su Vertex AI, invia una richiesta direttamente all'endpoint API Vertex AI. Poiché i modelli Qwen utilizzano un'API gestita, non è necessario eseguire il provisioning o gestire l'infrastruttura.
Puoi trasmettere in streaming le risposte per ridurre la percezione della latenza dell'utente finale. Una risposta in streaming utilizza gli eventi inviati dal server (SSE) per trasmettere in streaming in modo incrementale la risposta.
Modelli Qwen disponibili
I seguenti modelli sono disponibili da Qwen per l'utilizzo in Vertex AI. Per accedere a un modello Qwen, vai alla relativa scheda del modello in Model Garden.
Qwen3 Coder (Qwen3 Coder)
Qwen3 Coder (Qwen3 Coder
) è un modello open source di grandi dimensioni
sviluppato per attività avanzate di sviluppo software. La caratteristica principale del modello è
l'ampia finestra contestuale, che gli consente di elaborare e comprendere in modo completo
grandi codebase.
Vai alla scheda del modello Qwen3 Coder
Qwen3 235B (Qwen3 235B)
Qwen3 235B (Qwen3 235B
) è un modello di grandi dimensioni con 235 miliardi di parametri. Il modello
si distingue per la sua capacità di "pensiero ibrido", che consente agli utenti di
passare dinamicamente da una modalità di "pensiero" metodica e passo passo per
attività complesse come il ragionamento matematico e la programmazione a una modalità rapida di "non pensiero"
per conversazioni generiche. La sua ampia finestra contestuale lo rende
adatto a casi d'uso che richiedono ragionamenti approfonditi e comprensione di testi lunghi.
Vai alla scheda del modello Qwen3 235B
Prima di iniziare
Per utilizzare i modelli Qwen con Vertex AI, devi eseguire i
seguenti passaggi. L'API Vertex AI
(aiplatform.googleapis.com
) deve essere abilitata per utilizzare
Vertex AI. Se hai già un progetto esistente con l'API Vertex AI abilitata, puoi utilizzare questo progetto anziché crearne uno nuovo.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. - Vai a una delle seguenti schede del modello Model Garden, poi fai clic su Attiva.