Model terkelola Vertex AI untuk MaaS

Vertex AI mendukung daftar model partner dan model terbuka yang telah dikurasi sebagai model terkelola. Model ini dapat digunakan dengan Vertex AI sebagai model sebagai layanan (MaaS) dan ditawarkan sebagai API terkelola. Saat menggunakan model terkelola, Anda tetap mengirim permintaan ke endpoint Vertex AI. Model terkelola bersifat serverless sehingga Anda tidak perlu menyediakan atau mengelola infrastruktur.

Model terkelola dapat ditemukan menggunakan Model Garden. Anda juga dapat men-deploy model menggunakan Model Garden. Untuk mengetahui informasi selengkapnya, lihat Menjelajahi model AI di Model Garden.

Model partner

Model partner berikut ditawarkan sebagai API terkelola di Model Garden Vertex AI (MaaS):

Nama model Pengandaian Deskripsi Panduan memulai
Claude Sonnet 4.5 Bahasa, Visi Model berukuran sedang Anthropic untuk mendukung agen di dunia nyata, dengan kemampuan dalam pengodean, penggunaan komputer, keamanan siber, dan bekerja dengan file Office seperti spreadsheet. Kartu model
Claude Opus 4.1 Bahasa, Visi Pemimpin industri untuk coding. Agen ini memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga memperluas secara signifikan apa yang dapat diselesaikan oleh agen AI. Ideal untuk mendukung produk dan fitur agen terdepan. Kartu model
Claude Haiku 4.5 Bahasa, Visi Claude Haiku 4.5 memberikan performa mendekati batas kemampuan untuk berbagai kasus penggunaan, dan menonjol sebagai salah satu model coding terbaik di dunia–dengan kecepatan dan biaya yang tepat untuk mendukung produk gratis dan pengalaman pengguna bervolume tinggi. Kartu model
Claude Opus 4 Bahasa, Visi Claude Opus 4 memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga secara signifikan memperluas kemampuan agen AI dalam menyelesaikan masalah. Kartu model
Claude Sonnet 4 Bahasa, Visi Model berukuran sedang dari Anthropic dengan kecerdasan yang lebih unggul untuk penggunaan bervolume tinggi, seperti coding, riset mendalam, dan agen. Kartu model
Claude 3.7 Sonnet dari Anthropic Bahasa, Visi Model terdepan di industri untuk coding dan mendukung agen AI—serta model Claude pertama yang menawarkan kemampuan berpikir yang lebih luas. Kartu model
Claude 3.5 Sonnet v2 dari Anthropic Bahasa, Visi Claude 3.5 Sonnet yang telah diupgrade adalah model canggih untuk tugas-tugas software engineering di dunia nyata dan kemampuan agentic. Claude 3.5 Sonnet menghadirkan peningkatan ini dengan harga dan kecepatan yang sama seperti pendahulunya. Kartu model
Claude 3.5 Haiku dari Anthropic Bahasa, Visi Claude 3.5 Haiku, model Anthropic generasi berikutnya yang paling cepat dan hemat biaya, optimal untuk kasus penggunaan yang membutuhkan kecepatan dan keterjangkauan. Kartu model
Claude 3 Haiku dari Anthropic Bahasa Model teks dan visi tercepat dari Anthropic untuk merespons kueri dasar secara instan, yang ditujukan untuk pengalaman AI yang lancar yang meniru interaksi manusia. Kartu model
Claude 3.5 Sonnet dari Anthropic Bahasa Claude 3.5 Sonnet mengungguli Claude 3 Opus dari Anthropic di berbagai evaluasi Anthropic dengan kecepatan dan biaya layaknya model tingkat menengah Anthropic, Claude 3 Sonnet. Kartu model
Jamba 1.5 Large (Pratinjau) Bahasa Jamba 1.5 Large dari AI21 Labs dirancang untuk memberikan respons berkualitas tinggi, throughput tinggi, dan harga yang kompetitif dibandingkan dengan model lain dalam kelas ukurannya. Kartu model
Jamba 1.5 Mini (Pratinjau) Bahasa Jamba 1.5 Mini dari AI21 Labs memiliki keseimbangan yang baik antara kualitas, throughput, dan biaya rendah. Kartu model
Mistral Medium 3 Bahasa Mistral Medium 3 adalah model serbaguna yang dirancang untuk berbagai tugas, termasuk pemrograman, penalaran matematika, pemahaman dokumen panjang, perangkuman, dan dialog. Kartu model
Mistral OCR (25.05) Bahasa, Visi Mistral OCR (25.05) adalah API Pengenalan Karakter Optik untuk pemahaman dokumen. Model ini memahami setiap elemen dokumen seperti media, teks, tabel, dan persamaan. Kartu model
Mistral Small 3.1 (25.03) Bahasa Mistral Small 3.1 (25.03) adalah versi terbaru model Small dari Mistral, yang menampilkan kemampuan multimodal dan panjang konteks yang lebih luas. Kartu model
Mistral Large (24.11) Bahasa Mistral Large (24.11) adalah versi berikutnya dari model Mistral Large (24.07) yang kini memiliki kemampuan penalaran dan pemanggilan fungsi yang ditingkatkan. Kartu model
Codestral 2 Bahasa, Kode Codestral 2 adalah model khusus pembuatan kode Mistral yang dibuat khusus untuk penyelesaian isi di tengah (FIM) presisi tinggi yang membantu developer menulis dan berinteraksi dengan kode melalui endpoint API penyelesaian dan petunjuk bersama. Kartu model
Codestral (25.01) Kode Model canggih yang dirancang untuk pembuatan kode, termasuk pengisian di tengah dan penyelesaian kode. Kartu model

Model open source

Model terbuka berikut ditawarkan sebagai API terkelola di Vertex AI Model Garden (MaaS):

Nama model Pengandaian Deskripsi Panduan memulai
gpt-oss 120B Bahasa Model 120B yang menawarkan performa tinggi pada tugas penalaran. Kartu model
gpt-oss 20B Bahasa Model 20B yang dioptimalkan untuk efisiensi dan deployment di hardware konsumen dan edge. Kartu model
Pemikiran Qwen3-Next-80B Bahasa, Kode Model dari keluarga model Qwen3-Next, yang dikhususkan untuk pemecahan masalah yang kompleks dan penalaran yang mendalam. Kartu model
Qwen3-Next-80B Instruct Bahasa, Kode Model dari kelompok model Qwen3-Next, yang dikhususkan untuk mengikuti perintah tertentu. Kartu model
Qwen3 Coder Bahasa, Kode Model dengan bobot terbuka yang dikembangkan untuk tugas pengembangan software tingkat lanjut. Kartu model
Qwen3 235B Bahasa Model berat terbuka dengan kemampuan "pemikiran hibrida" untuk beralih antara penalaran metodis dan percakapan cepat. Kartu model
DeepSeek-V3.1 Bahasa Model hibrida DeepSeek yang mendukung mode berpikir dan mode non-berpikir. Kartu model
DeepSeek R1 (0528) Bahasa Versi terbaru model DeepSeek R1 dari DeepSeek. Kartu model
Llama 4 Maverick 17B-128E Bahasa, Visi Model Llama 4 terbesar dan paling mumpuni yang memiliki kemampuan pengkodean, penalaran, dan gambar. Llama 4 Maverick 17B-128E adalah model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE) dan fusi awal. Kartu model
Llama 4 Scout 17B-16E Bahasa, Visi Llama 4 Scout 17B-16E memberikan hasil terbaik untuk kelas ukurannya, mengungguli generasi Llama sebelumnya dan model terbuka serta eksklusif lainnya pada beberapa tolok ukur. Llama 4 Scout 17B-16E adalah model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE) dan penggabungan awal. Kartu model
Llama 3.3 Bahasa Llama 3.3 adalah model yang disesuaikan untuk perintah 70B khusus teks yang memberikan peningkatan performa dibandingkan Llama 3.1 70B dan Llama 3.2 90B saat digunakan untuk aplikasi khusus teks. Selain itu, untuk beberapa aplikasi, Llama 3.3 70B mendekati performa Llama 3.1 405B. Kartu model
Llama 3.2 (Pratinjau) Bahasa, Visi Model multimodal berukuran sedang 90B yang dapat mendukung penalaran gambar, seperti analisis diagram dan grafik serta pemberian teks gambar. Kartu model
Llama 3.1 Bahasa

Kumpulan LLM multibahasa yang dioptimalkan untuk kasus penggunaan dialog multibahasa dan mengungguli banyak model chat open source dan tertutup yang tersedia pada tolok ukur industri umum.

Llama 3.1 405B tersedia secara umum (GA).

Llama 3.1 8B dan Llama 3.1 70B tersedia dalam Pratinjau.

Kartu model

Langkah berikutnya