Vertex AI mendukung daftar model partner dan model terbuka yang telah dikurasi sebagai model terkelola. Model ini dapat digunakan dengan Vertex AI sebagai model sebagai layanan (MaaS) dan ditawarkan sebagai API terkelola. Saat menggunakan model terkelola, Anda tetap mengirim permintaan ke endpoint Vertex AI. Model terkelola bersifat serverless sehingga Anda tidak perlu menyediakan atau mengelola infrastruktur.
Model terkelola dapat ditemukan menggunakan Model Garden. Anda juga dapat men-deploy model menggunakan Model Garden. Untuk mengetahui informasi selengkapnya, lihat Menjelajahi model AI di Model Garden.
Model partner
Model partner berikut ditawarkan sebagai API terkelola di Model Garden Vertex AI (MaaS):
Nama model | Pengandaian | Deskripsi | Panduan memulai |
---|---|---|---|
Claude Sonnet 4.5 | Bahasa, Visi | Model berukuran sedang Anthropic untuk mendukung agen di dunia nyata, dengan kemampuan dalam pengodean, penggunaan komputer, keamanan siber, dan bekerja dengan file Office seperti spreadsheet. | Kartu model |
Claude Opus 4.1 | Bahasa, Visi | Pemimpin industri untuk coding. Agen ini memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga memperluas secara signifikan apa yang dapat diselesaikan oleh agen AI. Ideal untuk mendukung produk dan fitur agen terdepan. | Kartu model |
Claude Haiku 4.5 | Bahasa, Visi | Claude Haiku 4.5 memberikan performa mendekati batas kemampuan untuk berbagai kasus penggunaan, dan menonjol sebagai salah satu model coding terbaik di dunia–dengan kecepatan dan biaya yang tepat untuk mendukung produk gratis dan pengalaman pengguna bervolume tinggi. | Kartu model |
Claude Opus 4 | Bahasa, Visi | Claude Opus 4 memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga secara signifikan memperluas kemampuan agen AI dalam menyelesaikan masalah. | Kartu model |
Claude Sonnet 4 | Bahasa, Visi | Model berukuran sedang dari Anthropic dengan kecerdasan yang lebih unggul untuk penggunaan bervolume tinggi, seperti coding, riset mendalam, dan agen. | Kartu model |
Claude 3.7 Sonnet dari Anthropic | Bahasa, Visi | Model terdepan di industri untuk coding dan mendukung agen AI—serta model Claude pertama yang menawarkan kemampuan berpikir yang lebih luas. | Kartu model |
Claude 3.5 Sonnet v2 dari Anthropic | Bahasa, Visi | Claude 3.5 Sonnet yang telah diupgrade adalah model canggih untuk tugas-tugas software engineering di dunia nyata dan kemampuan agentic. Claude 3.5 Sonnet menghadirkan peningkatan ini dengan harga dan kecepatan yang sama seperti pendahulunya. | Kartu model |
Claude 3.5 Haiku dari Anthropic | Bahasa, Visi | Claude 3.5 Haiku, model Anthropic generasi berikutnya yang paling cepat dan hemat biaya, optimal untuk kasus penggunaan yang membutuhkan kecepatan dan keterjangkauan. | Kartu model |
Claude 3 Haiku dari Anthropic | Bahasa | Model teks dan visi tercepat dari Anthropic untuk merespons kueri dasar secara instan, yang ditujukan untuk pengalaman AI yang lancar yang meniru interaksi manusia. | Kartu model |
Claude 3.5 Sonnet dari Anthropic | Bahasa | Claude 3.5 Sonnet mengungguli Claude 3 Opus dari Anthropic di berbagai evaluasi Anthropic dengan kecepatan dan biaya layaknya model tingkat menengah Anthropic, Claude 3 Sonnet. | Kartu model |
Jamba 1.5 Large (Pratinjau) | Bahasa | Jamba 1.5 Large dari AI21 Labs dirancang untuk memberikan respons berkualitas tinggi, throughput tinggi, dan harga yang kompetitif dibandingkan dengan model lain dalam kelas ukurannya. | Kartu model |
Jamba 1.5 Mini (Pratinjau) | Bahasa | Jamba 1.5 Mini dari AI21 Labs memiliki keseimbangan yang baik antara kualitas, throughput, dan biaya rendah. | Kartu model |
Mistral Medium 3 | Bahasa | Mistral Medium 3 adalah model serbaguna yang dirancang untuk berbagai tugas, termasuk pemrograman, penalaran matematika, pemahaman dokumen panjang, perangkuman, dan dialog. | Kartu model |
Mistral OCR (25.05) | Bahasa, Visi | Mistral OCR (25.05) adalah API Pengenalan Karakter Optik untuk pemahaman dokumen. Model ini memahami setiap elemen dokumen seperti media, teks, tabel, dan persamaan. | Kartu model |
Mistral Small 3.1 (25.03) | Bahasa | Mistral Small 3.1 (25.03) adalah versi terbaru model Small dari Mistral, yang menampilkan kemampuan multimodal dan panjang konteks yang lebih luas. | Kartu model |
Mistral Large (24.11) | Bahasa | Mistral Large (24.11) adalah versi berikutnya dari model Mistral Large (24.07) yang kini memiliki kemampuan penalaran dan pemanggilan fungsi yang ditingkatkan. | Kartu model |
Codestral 2 | Bahasa, Kode | Codestral 2 adalah model khusus pembuatan kode Mistral yang dibuat khusus untuk penyelesaian isi di tengah (FIM) presisi tinggi yang membantu developer menulis dan berinteraksi dengan kode melalui endpoint API penyelesaian dan petunjuk bersama. | Kartu model |
Codestral (25.01) | Kode | Model canggih yang dirancang untuk pembuatan kode, termasuk pengisian di tengah dan penyelesaian kode. | Kartu model |
Model open source
Model terbuka berikut ditawarkan sebagai API terkelola di Vertex AI Model Garden (MaaS):
Nama model | Pengandaian | Deskripsi | Panduan memulai |
---|---|---|---|
gpt-oss 120B | Bahasa | Model 120B yang menawarkan performa tinggi pada tugas penalaran. | Kartu model |
gpt-oss 20B | Bahasa | Model 20B yang dioptimalkan untuk efisiensi dan deployment di hardware konsumen dan edge. | Kartu model |
Pemikiran Qwen3-Next-80B | Bahasa, Kode | Model dari keluarga model Qwen3-Next, yang dikhususkan untuk pemecahan masalah yang kompleks dan penalaran yang mendalam. | Kartu model |
Qwen3-Next-80B Instruct | Bahasa, Kode | Model dari kelompok model Qwen3-Next, yang dikhususkan untuk mengikuti perintah tertentu. | Kartu model |
Qwen3 Coder | Bahasa, Kode | Model dengan bobot terbuka yang dikembangkan untuk tugas pengembangan software tingkat lanjut. | Kartu model |
Qwen3 235B | Bahasa | Model berat terbuka dengan kemampuan "pemikiran hibrida" untuk beralih antara penalaran metodis dan percakapan cepat. | Kartu model |
DeepSeek-V3.1 | Bahasa | Model hibrida DeepSeek yang mendukung mode berpikir dan mode non-berpikir. | Kartu model |
DeepSeek R1 (0528) | Bahasa | Versi terbaru model DeepSeek R1 dari DeepSeek. | Kartu model |
Llama 4 Maverick 17B-128E | Bahasa, Visi | Model Llama 4 terbesar dan paling mumpuni yang memiliki kemampuan pengkodean, penalaran, dan gambar. Llama 4 Maverick 17B-128E adalah model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE) dan fusi awal. | Kartu model |
Llama 4 Scout 17B-16E | Bahasa, Visi | Llama 4 Scout 17B-16E memberikan hasil terbaik untuk kelas ukurannya, mengungguli generasi Llama sebelumnya dan model terbuka serta eksklusif lainnya pada beberapa tolok ukur. Llama 4 Scout 17B-16E adalah model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE) dan penggabungan awal. | Kartu model |
Llama 3.3 | Bahasa | Llama 3.3 adalah model yang disesuaikan untuk perintah 70B khusus teks yang memberikan peningkatan performa dibandingkan Llama 3.1 70B dan Llama 3.2 90B saat digunakan untuk aplikasi khusus teks. Selain itu, untuk beberapa aplikasi, Llama 3.3 70B mendekati performa Llama 3.1 405B. | Kartu model |
Llama 3.2 (Pratinjau) | Bahasa, Visi | Model multimodal berukuran sedang 90B yang dapat mendukung penalaran gambar, seperti analisis diagram dan grafik serta pemberian teks gambar. | Kartu model |
Llama 3.1 | Bahasa |
Kumpulan LLM multibahasa yang dioptimalkan untuk kasus penggunaan dialog multibahasa dan mengungguli banyak model chat open source dan tertutup yang tersedia pada tolok ukur industri umum. Llama 3.1 405B tersedia secara umum (GA). Llama 3.1 8B dan Llama 3.1 70B tersedia dalam Pratinjau. |
Kartu model |
Langkah berikutnya
- Pelajari lebih lanjut model terbuka Vertex AI untuk MaaS.
- Pelajari cara Memanggil API model terbuka.