Model Qwen

Model Qwen di Vertex AI menawarkan model terkelola sepenuhnya dan tanpa server sebagai API. Untuk menggunakan model Qwen di Vertex AI, kirim permintaan langsung ke endpoint Vertex AI API. Karena model Qwen menggunakan API terkelola, tidak perlu menyediakan atau mengelola infrastruktur.

Anda dapat melakukan streaming respons untuk mengurangi persepsi latensi pengguna akhir. Respons yang di-streaming menggunakan peristiwa yang dikirim server (SSE) untuk mengalirkan respons secara bertahap.

Model Qwen yang tersedia

Model berikut tersedia dari Qwen untuk digunakan di Vertex AI. Untuk mengakses model Qwen, buka kartu model Model Garden-nya.

Qwen3 Coder (Qwen3 Coder)

Qwen3 Coder (Qwen3 Coder) adalah model dengan bobot terbuka berskala besar yang dikembangkan untuk tugas pengembangan software tingkat lanjut. Fitur utama model ini adalah jendela konteksnya yang besar, sehingga memungkinkan model memproses dan memahami codebase besar secara komprehensif.

Buka kartu model Qwen3 Coder

Qwen3 235B (Qwen3 235B)

Qwen3 235B (Qwen3 235B) adalah model parameter besar 235B. Model ini dibedakan berdasarkan kemampuan "pemikiran hibrida", yang memungkinkan pengguna beralih secara dinamis antara mode "pemikiran" langkah demi langkah yang metodis untuk tugas-tugas kompleks seperti penalaran matematika dan coding, serta mode "non-pemikiran" yang cepat untuk percakapan umum. Jendela konteksnya yang besar membuatnya cocok untuk kasus penggunaan yang memerlukan penalaran mendalam dan pemahaman panjang.

Buka kartu model Qwen3 235B

Sebelum memulai

Untuk menggunakan model Qwen dengan Vertex AI, Anda harus melakukan langkah-langkah berikut. Vertex AI API (aiplatform.googleapis.com) harus diaktifkan untuk menggunakan Vertex AI. Jika sudah memiliki project dengan Vertex AI API yang diaktifkan, Anda dapat menggunakan project tersebut, bukan membuat project baru.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  8. Buka salah satu kartu model Model Garden berikut, lalu klik Aktifkan.