Model Qwen di Vertex AI menawarkan model terkelola sepenuhnya dan tanpa server sebagai API. Untuk menggunakan model Qwen di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Karena model Qwen menggunakan API terkelola, tidak perlu menyediakan atau mengelola infrastruktur.
Anda dapat melakukan streaming respons untuk mengurangi persepsi latensi pengguna akhir. Respons yang di-streaming menggunakan peristiwa yang dikirim server (SSE) untuk mengalirkan respons secara bertahap.
Model Qwen yang tersedia
Model berikut tersedia dari Qwen untuk digunakan di Vertex AI. Untuk mengakses model Qwen, buka kartu model Model Garden-nya.
Qwen3 Coder (Qwen3 Coder)
Qwen3 Coder (Qwen3 Coder
) adalah model dengan bobot terbuka berskala besar yang dikembangkan untuk tugas pengembangan software tingkat lanjut. Fitur utama model ini adalah jendela konteksnya yang besar, sehingga memungkinkan model memproses dan memahami codebase besar secara komprehensif.
Qwen3 235B (Qwen3 235B)
Qwen3 235B (Qwen3 235B
) adalah model parameter besar 235B. Model ini dibedakan berdasarkan kemampuan "pemikiran hibrida", yang memungkinkan pengguna beralih secara dinamis antara mode "pemikiran" langkah demi langkah yang metodis untuk tugas-tugas kompleks seperti penalaran matematika dan coding, serta mode "non-pemikiran" yang cepat untuk percakapan umum. Jendela konteksnya yang besar membuatnya cocok untuk kasus penggunaan yang memerlukan penalaran mendalam dan pemahaman panjang.
Sebelum memulai
Untuk menggunakan model Qwen dengan Vertex AI, Anda harus melakukan langkah-langkah berikut. Vertex AI API
(aiplatform.googleapis.com
) harus diaktifkan untuk menggunakan
Vertex AI. Jika sudah memiliki project dengan
Vertex AI API yang diaktifkan, Anda dapat menggunakan project tersebut, bukan membuat
project baru.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. - Buka salah satu kartu model Model Garden berikut, lalu klik Aktifkan.