Les modèles Qwen sur Vertex AI offrent des modèles sans serveur et entièrement gérés en tant qu'API. Pour utiliser un modèle Qwen sur Vertex AI, envoyez une requête directement au point de terminaison de l'API Vertex AI. Étant donné que les modèles Qwen utilisent une API gérée, il n'est pas nécessaire de provisionner ni de gérer l'infrastructure.
Vous pouvez diffuser vos réponses en flux continu pour réduire la perception de la latence côté utilisateur. Une réponse en flux continu utilise des événements envoyés par le serveur (SSE) pour diffuser la réponse de manière incrémentielle.
Modèles Qwen disponibles
Les modèles Qwen suivants sont disponibles et peuvent être utilisés dans Vertex AI. Pour accéder à un modèle Qwen, accédez à sa fiche de modèle Model Garden.
Qwen3 Coder (Qwen3 Coder)
Qwen3 Coder (Qwen3 Coder
) est un modèle open source à grande échelle développé pour les tâches de développement logiciel avancées. La principale caractéristique du modèle est sa grande fenêtre de contexte, qui lui permet de traiter et de comprendre de grandes bases de code de manière exhaustive.
Accéder à la fiche de modèle Qwen3 Coder
Qwen3 235B (Qwen3 235B)
Qwen3 235B (Qwen3 235B
) est un grand modèle de 235 milliards de paramètres. Le modèle se distingue par sa capacité de "pensée hybride", qui permet aux utilisateurs de basculer dynamiquement entre un mode de "pensée" méthodique et étape par étape pour les tâches complexes comme le raisonnement mathématique et le codage, et un mode de "non-pensée" rapide pour les conversations à usage général. Sa grande fenêtre de contexte le rend adapté aux cas d'utilisation nécessitant un raisonnement approfondi et une compréhension des contenus longs.
Accéder à la fiche de modèle Qwen3 235B
Avant de commencer
Pour utiliser des modèles Qwen avec Vertex AI, procédez comme suit. Vous devez activer l'API Vertex AI (aiplatform.googleapis.com
) pour pouvoir utiliser Vertex AI. Si vous disposez déjà d'un projet pour lequel l'API Vertex AI est activée, vous pouvez utiliser ce projet au lieu de créer un projet.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. - Accédez à l'une des fiches de modèle Model Garden suivantes, puis cliquez sur Activer.