Model Qwen

Model Qwen di Vertex AI menawarkan model terkelola sepenuhnya dan tanpa server sebagai API. Untuk menggunakan model Qwen di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Karena model Qwen menggunakan API terkelola, tidak perlu menyediakan atau mengelola infrastruktur.

Anda dapat melakukan streaming respons untuk mengurangi persepsi latensi pengguna akhir. Respons yang di-streaming menggunakan peristiwa yang dikirim server (SSE) untuk mengalirkan respons secara bertahap.

Model Qwen yang tersedia

Model berikut tersedia dari Qwen untuk digunakan di Vertex AI. Untuk mengakses model Qwen, buka kartu model Model Garden-nya.

Qwen3-Next-80B Instruct

Qwen3-Next-80B Instruct adalah model bahasa dari keluarga model Qwen3-Next. Model ini dirancang untuk mengikuti perintah tertentu dan menangani teks yang sangat panjang. Model ini menggunakan desain cerdas yang disebut Mixture-of-Experts (MoE), yang mengaktifkan subset parameter yang tersedia untuk memproses informasi, sehingga model ini berjalan lebih cepat dan lebih hemat biaya daripada model lain dengan ukuran yang sama.

Versi Instruct disetel untuk memberikan jawaban langsung yang andal dalam aplikasi chat dan agen, serta jendela konteksnya yang besar memungkinkannya mempertahankan seluruh percakapan atau dokumen besar dalam memori.

Buka kartu model Qwen3-Next-80B Instruct

Pemikiran Qwen3-Next-80B

Qwen3-Next-80B Thinking adalah model bahasa dari keluarga model Qwen3-Next. Model ini dikhususkan untuk pemecahan masalah yang kompleks dan penalaran yang mendalam. Mode "berpikir"-nya menghasilkan proses penalaran langkah demi langkah yang terlihat bersama dengan jawaban akhir, sehingga ideal untuk tugas yang memerlukan logika transparan, seperti bukti matematika, pen-debug-an kode yang rumit, atau perencanaan agen multi-langkah.

Buka kartu model Qwen3-Next-80B Thinking

Qwen3 Coder (Qwen3 Coder)

Qwen3 Coder (Qwen3 Coder) adalah model dengan bobot terbuka berskala besar yang dikembangkan untuk tugas pengembangan software tingkat lanjut. Fitur utama model ini adalah jendela konteksnya yang besar, sehingga memungkinkan model memproses dan memahami codebase besar secara komprehensif.

Buka kartu model Qwen3 Coder

Qwen3 235B (Qwen3 235B)

Qwen3 235B (Qwen3 235B) adalah model parameter besar 235B. Model ini dibedakan oleh kemampuan "pemikiran hibrida", yang memungkinkan pengguna beralih secara dinamis antara mode "pemikiran" langkah demi langkah yang metodis untuk tugas-tugas kompleks seperti penalaran matematika dan coding, serta mode "non-pemikiran" yang cepat untuk percakapan umum. Jendela konteksnya yang besar membuatnya cocok untuk kasus penggunaan yang memerlukan penalaran mendalam dan pemahaman panjang.

Buka kartu model Qwen3 235B

Sebelum memulai

Untuk menggunakan model Qwen dengan Vertex AI, Anda harus melakukan langkah-langkah berikut. Vertex AI API (aiplatform.googleapis.com) harus diaktifkan untuk menggunakan Vertex AI. Jika sudah memiliki project dengan Vertex AI API yang diaktifkan, Anda dapat menggunakan project tersebut, bukan membuat project baru.

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  2. Verify that billing is enabled for your Google Cloud project.

  3. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  4. Buka salah satu kartu model Model Garden berikut, lalu klik Aktifkan.