Model Qwen di Vertex AI menawarkan model terkelola sepenuhnya dan tanpa server sebagai API. Untuk menggunakan model Qwen di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Karena model Qwen menggunakan API terkelola, tidak perlu menyediakan atau mengelola infrastruktur.
Anda dapat melakukan streaming respons untuk mengurangi persepsi latensi pengguna akhir. Respons yang di-streaming menggunakan peristiwa yang dikirim server (SSE) untuk mengalirkan respons secara bertahap.
Model Qwen yang tersedia
Model berikut tersedia dari Qwen untuk digunakan di Vertex AI. Untuk mengakses model Qwen, buka kartu model Model Garden-nya.
Qwen3-Next-80B Instruct
Qwen3-Next-80B Instruct adalah model bahasa dari keluarga model Qwen3-Next. Model ini dirancang untuk mengikuti perintah tertentu dan menangani teks yang sangat panjang. Model ini menggunakan desain cerdas yang disebut Mixture-of-Experts (MoE), yang mengaktifkan subset parameter yang tersedia untuk memproses informasi, sehingga model ini berjalan lebih cepat dan lebih hemat biaya daripada model lain dengan ukuran yang sama.
Versi Instruct disetel untuk memberikan jawaban langsung yang andal dalam aplikasi chat dan agen, serta jendela konteksnya yang besar memungkinkannya mempertahankan seluruh percakapan atau dokumen besar dalam memori.
Buka kartu model Qwen3-Next-80B Instruct
Pemikiran Qwen3-Next-80B
Qwen3-Next-80B Thinking adalah model bahasa dari keluarga model Qwen3-Next. Model ini dikhususkan untuk pemecahan masalah yang kompleks dan penalaran yang mendalam. Mode "berpikir"-nya menghasilkan proses penalaran langkah demi langkah yang terlihat bersama dengan jawaban akhir, sehingga ideal untuk tugas yang memerlukan logika transparan, seperti bukti matematika, pen-debug-an kode yang rumit, atau perencanaan agen multi-langkah.
Buka kartu model Qwen3-Next-80B Thinking
Qwen3 Coder (Qwen3 Coder)
Qwen3 Coder (Qwen3 Coder) adalah model dengan bobot terbuka berskala besar yang dikembangkan untuk tugas pengembangan software tingkat lanjut. Fitur utama model ini adalah jendela konteksnya yang besar, sehingga memungkinkan model memproses dan memahami codebase besar secara komprehensif.
Qwen3 235B (Qwen3 235B)
Qwen3 235B (Qwen3 235B) adalah model parameter besar 235B. Model ini dibedakan oleh kemampuan "pemikiran hibrida", yang memungkinkan pengguna beralih secara dinamis antara mode "pemikiran" langkah demi langkah yang metodis untuk tugas-tugas kompleks seperti penalaran matematika dan coding, serta mode "non-pemikiran" yang cepat untuk percakapan umum. Jendela konteksnya yang besar membuatnya cocok untuk kasus penggunaan yang memerlukan penalaran mendalam dan pemahaman panjang.
Sebelum memulai
Untuk menggunakan model Qwen dengan Vertex AI, Anda harus melakukan langkah-langkah berikut. Vertex AI API
(aiplatform.googleapis.com) harus diaktifkan untuk menggunakan
Vertex AI. Jika sudah memiliki project dengan
Vertex AI API yang diaktifkan, Anda dapat menggunakan project tersebut, bukan membuat
project baru.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. - Buka salah satu kartu model Model Garden berikut, lalu klik Aktifkan.