Halaman ini diterjemahkan oleh Cloud Translation API.

Model yang didukung oleh Model Garden

Daftar model pihak pertama Google

Tabel berikut mencantumkan model pihak pertama Google yang tersedia di Model Garden:

Nama model	Pengandaian	Deskripsi	Panduan Memulai
Gemini 2.5 Flash (Pratinjau)	Bahasa, audio, visi	Model pemikiran yang dirancang untuk menyeimbangkan harga dan performa.	Kartu model
Gemini 2.5 Pro (Pratinjau)	Bahasa, audio, visi	Model pemikiran dengan fitur generasi berikutnya dan kemampuan yang ditingkatkan.	Kartu model
Gemini 2.0 Flash	Bahasa, audio, visi	Model andalan untuk semua tugas harian dan fitur yang ditingkatkan performa dan mendukung Live API real-time.	Kartu model
Gemini 2.0 Flash-Lite	Bahasa, audio, visi	Model Flash tercepat dan paling hemat biaya. Model ini memberikan kualitas yang lebih baik daripada 1.5 dengan harga dan kecepatan yang sama.	Kartu model
Imagen for Image Generation	Vision	Buat gambar berkualitas studio dalam skala besar menggunakan perintah teks. Anda juga dapat menggunakan model ini untuk meningkatkan kualitas gambar.	Kartu model
Imagen untuk Pengeditan dan Penyesuaian	Vision	Edit atau gunakan pembelajaran sedikit contoh untuk membuat gambar berkualitas studio dalam skala besar menggunakan gambar dasar dan perintah teks, atau menggunakan gambar referensi dan perintah teks.	Kartu model
Segmentasi Gambar Vertex (Pratinjau)	Vision	Gunakan perintah teks atau gambar coretan untuk menyegmentasikan gambar. Segmentasi gambar memungkinkan Anda, misalnya, mendeteksi objek, menghapus latar belakang gambar, atau menyegmentasikan latar depan gambar.	Kartu model
Imagen for Captioning & VQA	Bahasa	Membuat deskripsi yang relevan untuk gambar tertentu.	Kartu model
Embeddings for Text	Bahasa	Membuat vektor berdasarkan teks, yang dapat digunakan untuk tugas hilir seperti penelusuran semantik, klasifikasi teks, dan analisis sentimen.	Kartu model
Embedding untuk Multimodal	Vision	Membuat vektor berdasarkan gambar, yang dapat digunakan untuk tugas hilir seperti klasifikasi gambar dan penelusuran gambar.	Kartu model
Chirp 2	Ucapan	Chirp 2 adalah model pengenalan ucapan otomatis (ASR) multibahasa yang dikembangkan oleh Google yang mentranskripsikan ucapan (speech-to-text). Dibandingkan dengan model Chirp generasi pertama, Chirp 2 memberikan akurasi dan kecepatan yang lebih baik, serta menawarkan kemampuan baru seperti stempel waktu tingkat kata, adaptasi model, dan terjemahan ucapan.	Kartu model

Daftar model terkelola yang tersedia di Model Garden

Model ditawarkan sebagai API terkelola di Vertex AI Model Garden (juga dikenal sebagai model sebagai layanan).

Model partner yang tersedia di Model Garden

Tabel berikut mencantumkan model partner yang tersedia di Model Garden:

Nama model	Pengandaian	Deskripsi	Panduan memulai
Claude Sonnet 4.5	Bahasa, Visi	Model berukuran sedang Anthropic untuk mendukung agen di dunia nyata, dengan kemampuan dalam pengodean, penggunaan komputer, keamanan siber, dan bekerja dengan file Office seperti spreadsheet.	Kartu model
Claude Opus 4.1	Bahasa, Visi	Pemimpin industri untuk coding. Agen ini memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga memperluas secara signifikan apa yang dapat diselesaikan oleh agen AI. Ideal untuk mendukung produk dan fitur agen terdepan.	Kartu model
Claude Haiku 4.5	Bahasa, Visi	Claude Haiku 4.5 memberikan performa mendekati batas kemampuan untuk berbagai kasus penggunaan, dan menonjol sebagai salah satu model coding terbaik di dunia–dengan kecepatan dan biaya yang tepat untuk mendukung produk gratis dan pengalaman pengguna bervolume tinggi.	Kartu model
Claude Opus 4	Bahasa, Visi	Claude Opus 4 memberikan performa berkelanjutan pada tugas yang berjalan lama yang memerlukan upaya terfokus dan ribuan langkah, sehingga secara signifikan memperluas kemampuan agen AI dalam menyelesaikan masalah.	Kartu model
Claude Sonnet 4	Bahasa, Visi	Model berukuran sedang dari Anthropic dengan kecerdasan yang lebih unggul untuk penggunaan bervolume tinggi, seperti coding, riset mendalam, dan agen.	Kartu model
Claude 3.7 Sonnet dari Anthropic	Bahasa, Visi	Model terdepan di industri untuk coding dan mendukung agen AI—serta model Claude pertama yang menawarkan kemampuan berpikir yang lebih luas.	Kartu model
Claude 3.5 Sonnet v2 dari Anthropic	Bahasa, Visi	Claude 3.5 Sonnet yang telah diupgrade adalah model canggih untuk tugas-tugas software engineering di dunia nyata dan kemampuan agentic. Claude 3.5 Sonnet menghadirkan peningkatan ini dengan harga dan kecepatan yang sama seperti pendahulunya.	Kartu model
Claude 3.5 Haiku dari Anthropic	Bahasa, Visi	Claude 3.5 Haiku, model Anthropic generasi berikutnya yang paling cepat dan hemat biaya, optimal untuk kasus penggunaan yang membutuhkan kecepatan dan keterjangkauan.	Kartu model
Claude 3 Haiku dari Anthropic	Bahasa	Model teks dan visi tercepat dari Anthropic untuk merespons kueri dasar secara instan, yang ditujukan untuk pengalaman AI yang lancar yang meniru interaksi manusia.	Kartu model
Claude 3.5 Sonnet dari Anthropic	Bahasa	Claude 3.5 Sonnet mengungguli Claude 3 Opus dari Anthropic di berbagai evaluasi Anthropic dengan kecepatan dan biaya layaknya model tingkat menengah Anthropic, Claude 3 Sonnet.	Kartu model
Jamba 1.5 Large (Pratinjau)	Bahasa	Jamba 1.5 Large dari AI21 Labs dirancang untuk memberikan respons berkualitas tinggi, throughput tinggi, dan harga yang kompetitif dibandingkan dengan model lain dalam kelas ukurannya.	Kartu model
Jamba 1.5 Mini (Pratinjau)	Bahasa	Jamba 1.5 Mini dari AI21 Labs memiliki keseimbangan yang baik antara kualitas, throughput, dan biaya rendah.	Kartu model
Mistral Medium 3	Bahasa	Mistral Medium 3 adalah model serbaguna yang dirancang untuk berbagai tugas, termasuk pemrograman, penalaran matematika, pemahaman dokumen panjang, perangkuman, dan dialog.	Kartu model
Mistral OCR (25.05)	Bahasa, Visi	Mistral OCR (25.05) adalah API Pengenalan Karakter Optik untuk pemahaman dokumen. Model ini memahami setiap elemen dokumen seperti media, teks, tabel, dan persamaan.	Kartu model
Mistral Small 3.1 (25.03)	Bahasa	Mistral Small 3.1 (25.03) adalah versi terbaru model Small dari Mistral, yang menampilkan kemampuan multimodal dan panjang konteks yang lebih luas.	Kartu model
Mistral Large (24.11)	Bahasa	Mistral Large (24.11) adalah versi berikutnya dari model Mistral Large (24.07) yang kini memiliki kemampuan penalaran dan pemanggilan fungsi yang ditingkatkan.	Kartu model
Codestral 2	Bahasa, Kode	Codestral 2 adalah model khusus pembuatan kode Mistral yang dibuat khusus untuk penyelesaian isi di tengah (FIM) presisi tinggi yang membantu developer menulis dan berinteraksi dengan kode melalui endpoint API penyelesaian dan petunjuk bersama.	Kartu model
Codestral (25.01)	Kode	Model canggih yang dirancang untuk pembuatan kode, termasuk pengisian di tengah dan penyelesaian kode.	Kartu model

Model open source yang tersedia di Model Garden

Tabel berikut mencantumkan model terbuka yang tersedia di Model Garden:

Nama model	Pengandaian	Deskripsi	Panduan memulai
gpt-oss 120B	Bahasa	Model 120B yang menawarkan performa tinggi pada tugas penalaran.	Kartu model
gpt-oss 20B	Bahasa	Model 20B yang dioptimalkan untuk efisiensi dan deployment di hardware konsumen dan edge.	Kartu model
Pemikiran Qwen3-Next-80B	Bahasa, Kode	Model dari keluarga model Qwen3-Next, yang dikhususkan untuk pemecahan masalah yang kompleks dan penalaran yang mendalam.	Kartu model
Qwen3-Next-80B Instruct	Bahasa, Kode	Model dari kelompok model Qwen3-Next, yang dikhususkan untuk mengikuti perintah tertentu.	Kartu model
Qwen3 Coder	Bahasa, Kode	Model dengan bobot terbuka yang dikembangkan untuk tugas pengembangan software tingkat lanjut.	Kartu model
Qwen3 235B	Bahasa	Model berat terbuka dengan kemampuan "pemikiran hibrida" untuk beralih antara penalaran metodis dan percakapan cepat.	Kartu model
DeepSeek-V3.1	Bahasa	Model hibrida DeepSeek yang mendukung mode berpikir dan mode non-berpikir.	Kartu model
DeepSeek R1 (0528)	Bahasa	Versi terbaru model DeepSeek R1 dari DeepSeek.	Kartu model
Llama 4 Maverick 17B-128E	Bahasa, Visi	Model Llama 4 terbesar dan paling mumpuni yang memiliki kemampuan pengkodean, penalaran, dan gambar. Llama 4 Maverick 17B-128E adalah model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE) dan fusi awal.	Kartu model
Llama 4 Scout 17B-16E	Bahasa, Visi	Llama 4 Scout 17B-16E memberikan hasil terbaik untuk kelas ukurannya, mengungguli generasi Llama sebelumnya dan model terbuka serta eksklusif lainnya pada beberapa tolok ukur. Llama 4 Scout 17B-16E adalah model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE) dan penggabungan awal.	Kartu model
Llama 3.3	Bahasa	Llama 3.3 adalah model yang disesuaikan untuk perintah 70B khusus teks yang memberikan peningkatan performa dibandingkan Llama 3.1 70B dan Llama 3.2 90B saat digunakan untuk aplikasi khusus teks. Selain itu, untuk beberapa aplikasi, Llama 3.3 70B mendekati performa Llama 3.1 405B.	Kartu model
Llama 3.2 (Pratinjau)	Bahasa, Visi	Model multimodal berukuran sedang 90B yang dapat mendukung penalaran gambar, seperti analisis diagram dan grafik serta pemberian teks gambar.	Kartu model
Llama 3.1	Bahasa	Kumpulan LLM multibahasa yang dioptimalkan untuk kasus penggunaan dialog multibahasa dan mengungguli banyak model chat open source dan tertutup yang tersedia pada tolok ukur industri umum. Llama 3.1 405B tersedia secara umum (GA). Llama 3.1 8B dan Llama 3.1 70B tersedia dalam Pratinjau.	Kartu model

Daftar model dengan resep penyesuaian atau penayangan open source di Model Garden

Tabel berikut mencantumkan model OSS yang mendukung resep penyesuaian atau penayangan open source di Model Garden:

Nama model	Pengandaian	Deskripsi	Panduan memulai
Llama 4	Bahasa, Visi	Serangkaian model multimodal yang menggunakan arsitektur Mixture-of-Experts (MoE) dan fusi awal.	Colab Kartu model
Llama 3.3	Bahasa	Model bahasa besar (LLM) multilingu Meta Llama 3.3 adalah model generatif yang telah dilatih sebelumnya dan dioptimalkan untuk mengikuti perintah dalam 70B (teks masuk/teks keluar).	Kartu model
Flux	Vision	Model transformer aliran yang diperbaiki dengan 12 miliar parameter yang menghasilkan gambar berkualitas tinggi dari deskripsi teks.	Kartu model
Perlindungan Perintah	Bahasa	Melindungi input LLM dari teknik jailbreak dan injeksi tidak langsung.	Kartu model
Llama 3.2	Bahasa	Kumpulan model bahasa besar multibahasa yang merupakan model generatif yang telah dilatih awal dan dioptimalkan untuk mengikuti perintah dalam ukuran 1B dan 3B.	Kartu model
Llama 3.2-Vision	Bahasa, Visi	Kumpulan model bahasa besar multimodal yang merupakan model generatif penalaran gambar yang telah dilatih awal dan disesuaikan dengan instruksi dalam ukuran 11B dan 90B. Model ini dioptimalkan untuk pengenalan visual, penalaran gambar, pemberian teks, dan menjawab pertanyaan umum tentang gambar.	Kartu model
Llama Guard 3	Bahasa	Model pra-latih Llama-3.1-8B yang telah di-fine-tune untuk klasifikasi keamanan konten.	Kartu model
Qwen2	Bahasa	Deploy Qwen2, seri model bahasa besar dasar.	Colab Kartu model
Phi-3	Bahasa	Deploy Phi-3, seri model bahasa besar dasar.	Colab Kartu model
E5	Bahasa	Men-deploy E5, seri model embedding teks.	Colab Kartu model
ID Instan	Bahasa, Visi	Men-deploy Instant ID, model pembuatan teks ke gambar yang mempertahankan identitas.	Colab Kartu model
Llama 3	Bahasa	Jelajahi dan bangun dengan model Llama 3 Meta (8B, 70B, 405B) di Vertex AI.	Kartu model
Gemma 3n	Bahasa, Visi, Audio	Model berat terbuka (E2B, E4B) yang dibangun dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google.	Kartu model
Gemma 3	Bahasa, Visi	Model bobot terbuka (1B khusus teks, 4B, 12B, 27B) yang dibuat dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google.	Kartu model
Gemma 2	Bahasa	Model bobot terbuka (9B, 27B) yang dibuat dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google.	Kartu model
Gemma	Bahasa	Model bobot terbuka (2B, 7B) yang dibuat dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google.	Kartu model
CodeGemma	Bahasa	Model bobot terbuka (2B, 7B) yang dirancang untuk pembuatan dan penyelesaian kode yang dibangun dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google.	Kartu model
PaliGemma 2	Bahasa, Visi	Model terbuka 3B, 10B, dan 28B yang dirancang untuk tugas pemberian teks pada gambar serta tugas pertanyaan dan jawaban visual yang dibangun dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google.	Kartu model
PaliGemma	Bahasa, Visi	Model 3B dengan bobot terbuka yang didesain untuk tugas pemberian teks pada gambar dan tugas tanya jawab visual yang dibangun dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google.	Kartu model
ShieldGemma 2	Bahasa, Visi	Model 4B dengan bobot terbuka yang dilatih pada checkpoint IT 4B Gemma 3 untuk klasifikasi keamanan gambar di seluruh kategori utama yang menerima gambar dan menghasilkan label keamanan per kebijakan.	Kartu model
TxGemma	Bahasa	Model bobot terbuka (2B, 9B, 27B) yang dirancang untuk pengembangan terapeutik yang dibangun di atas Gemma 2.	Kartu model
MedGemma	Bahasa, Visi	Model bobot terbuka (4B, 27B) yang didesain untuk performa dalam pemahaman gambar dan teks medis.	Kartu model
MedSigLIP	Bahasa, Visi	Model bobot terbuka (encoder visi berparameter 400M dan encoder teks berparameter 400M) yang dirancang untuk mengenkode gambar dan teks medis ke dalam ruang penyematan umum.	Kartu model
T5Gemma	Bahasa	Model encoder-decoder dengan bobot terbuka (2B-2B, 9B-9B, 9B-2B, S-S, B-B, L-L, M-L, XL-XL) yang dibangun dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google.	Kartu model
Vicuna v1.5	Bahasa	Men-deploy model seri Vicuna v1.5, yang merupakan model dasar yang di-fine-tune dari LLama2 untuk pembuatan teks.	Kartu model
NLLB	Bahasa	Men-deploy model seri nllb untuk terjemahan multi-bahasa.	Kartu model Colab
Mistral-7B	Bahasa	Men-deploy Mistral-7B, model dasar untuk pembuatan teks.	Kartu model
BioGPT	Bahasa	Men-deploy BioGPT, model generatif teks untuk domain biomedis.	Kartu model Colab
BiomedCLIP	Bahasa, Visi	Men-deploy BiomedCLIP, model dasar multimodal untuk domain biomedis.	Kartu model Colab
ImageBind	Bahasa, Visi, Audio	Men-deploy ImageBind, model dasar untuk embedding multimodal.	Kartu model Colab
DITO	Bahasa, Visi	Menyempurnakan dan men-deploy DITO, model dasar multimodal untuk tugas deteksi objek kosakata terbuka.	Kartu model Colab
OWL-ViT v2	Bahasa, Visi	Men-deploy OWL-ViT v2, model dasar multimodal untuk tugas deteksi objek kosakata terbuka.	Kartu model Colab
FaceStylizer (Mediapipe)	Vision	Pipeline generatif untuk mengubah gambar wajah manusia ke gaya baru.	Kartu model Colab
Llama 2	Bahasa	Menyesuaikan dan men-deploy model dasar Llama 2 Meta (7B, 13B, 70B) di Vertex AI.	Kartu model
Code Llama	Bahasa	Men-deploy model dasar Code Llama Meta (7B, 13B, 34B) di Vertex AI.	Kartu model
Falcon-instruct	Bahasa	Menyempurnakan dan men-deploy model Falcon-instruct (7B, 40B) menggunakan PEFT.	Colab Kartu model
OpenLLaMA	Bahasa	Sempurnakan dan deploy model OpenLLaMA (3B, 7B, 13B) dengan menggunakan PEFT.	Colab Kartu model
T5-FLAN	Bahasa	Menyesuaikan dan men-deploy T5-FLAN (dasar, kecil, besar).	Kartu model (termasuk pipeline penyesuaian)
BERT	Bahasa	Menyesuaikan dan men-deploy BERT menggunakan PEFT.	Colab Kartu model
BART-large-cnn	Bahasa	Men-deploy BART, model encoder-encoder transformer (seq2seq) dengan encoder dua arah (mirip BERT) dan dekoder autoregresif (mirip GPT).	Colab Kartu model
RoBERTa-large	Bahasa	Menyempurnakan dan men-deploy RoBERTa-large menggunakan PEFT.	Colab Kartu model
XLM-RoBERTa-large	Bahasa	Menyempurnakan dan men-deploy XLM-RoBERTa-large (versi multibahasa RoBERTa) menggunakan PEFT.	Colab Kartu model
Stable Diffusion XL v1.0	Bahasa, Visi	Men-deploy Stable Diffusion XL v1.0, yang mendukung pembuatan teks ke gambar.	Colab Kartu model
Stable Diffusion XL Lightning	Bahasa, Visi	Men-deploy Stable Diffusion XL Lightning, model pembuatan teks ke gambar.	Colab Kartu model
Stable Diffusion v2.1	Bahasa, Visi	Menyempurnakan dan men-deploy Stable Diffusion v2.1 (mendukung pembuatan teks ke gambar) menggunakan Dreambooth.	Colab Kartu model
Peningkatan Stable Diffusion 4x	Bahasa, Visi	Men-deploy peningkatan Stable Diffusion 4x, yang mendukung superresolusi gambar dengan kondisi teks.	Colab Kartu model
InstructPix2Pix	Bahasa, Visi	Men-deploy InstructPix2Pix, yang mendukung pengeditan gambar menggunakan perintah teks.	Colab Kartu model
Stable Diffusion Inpainting	Bahasa, Visi	Menyempurnakan dan men-deploy Stable Diffusion Inpainting, yang mendukung pewarnaan gambar yang disamarkan menggunakan perintah teks.	Colab Kartu model
SAM	Bahasa, Visi	Men-deploy Segmen Apa Pun, yang mendukung segmentasi gambar zero-shot.	Colab Kartu model
Pengambilan Gambar yang Ditulis Pic2Word	Bahasa, Visi	Men-deploy Pic2Word, yang mendukung pengambilan gambar multi-modal.	Colab Kartu model
BLIP2	Bahasa, Visi	Men-deploy BLIP2, yang mendukung keterangan gambar dan jawaban pertanyaan visual.	Colab Kartu model
Open-CLIP	Bahasa, Visi	Menyempurnakan dan men-deploy Open-CLIP, yang mendukung klasifikasi zero-shot.	Colab Kartu model
F-VLM	Bahasa, Visi	Men-deploy F-VLM, yang mendukung deteksi objek gambar kosakata terbuka.	Colab Kartu model
tfhub/EfficientNetV2	Vision	Menyempurnakan dan men-deploy implementasi TensorFlow Vision dari model klasifikasi gambar EfficientNetV2.	Colab Kartu model
EfisienNetV2 (TIMM)	Vision	Menyempurnakan dan men-deploy implementasi PyTorch dari model klasifikasi image barang efisienNetV2.	Colab Kartu model
Eksklusif/EfficientNetV2	Vision	Menyempurnakan dan men-deploy checkpoint eksklusif Google dari model klasifikasi gambar EefisienNetV2.	Colab Kartu model
EfficientNetLite (MediaPipe)	Vision	Menyempurnakan model klasifikasi gambar EffectiveNetLite melalui pembuat model MediaPipe.	Colab Kartu model
tfvision/vit	Vision	Menyempurnakan dan men-deploy implementasi TensorFlow Vision dari model klasifikasi gambar ViT.	Colab Kartu model
ViT (TIMM)	Vision	Menyempurnakan dan men-deploy implementasi PyTorch dari model klasifikasi image ViT.	Colab Kartu model
Eksklusif/ViT	Vision	Menyempurnakan dan men-deploy checkpoint eksklusif Google dari model klasifikasi image ViT.	Colab Kartu model
Eksklusif/MaxViT	Vision	Menyempurnakan dan men-deploy checkpoint eksklusif Google untuk model klasifikasi gambar MaxViT hybrid (CNN + ViT).	Colab Kartu model
ViT (JAX)	Vision	Menyempurnakan dan men-deploy implementasi JAX dari model klasifikasi gambar ViT.	Colab Kartu model
tfvision/SpineNet	Vision	Menyempurnakan dan men-deploy implementasi TensorFlow Vision untuk model deteksi objek SpineNet.	Colab Kartu model
Eksklusif/Spinenet	Vision	Menyempurnakan dan men-deploy checkpoint eksklusif Google untuk model deteksi objek SpineNet.	Colab Kartu model
tfvision/YOLO	Vision	Menyempurnakan dan men-deploy implementasi TensorFlow Vision untuk model deteksi objek satu tahap YOLO.	Colab Kartu model
Eksklusif/YOLO	Vision	Menyempurnakan dan men-deploy checkpoint eksklusif Google untuk model deteksi objek satu tahap YOLO.	Colab Kartu model
YOLOv8 (Keras)	Vision	Menyempurnakan dan men-deploy implementasi Keras model YOLOv8 untuk deteksi objek.	Colab Kartu model
tfvision/YOLOv7	Vision	Menyempurnakan dan menddeploy model YOLOv7 untuk deteksi objek.	Colab Kartu model
Pelacakan Objek Video ByteTrack	Vision	Menjalankan prediksi batch untuk pelacakan objek video menggunakan pelacak ByteTrack.	Colab Kartu model
ResNeSt (TIMM)	Vision	Menyempurnakan dan men-deploy implementasi PyTorch dari model klasifikasi image ResNeSt.	Colab Kartu model
ConvNeXt (TIMM)	Vision	Menyempurnakan dan men-deploy ConvNeXt, model konvolusional murni untuk klasifikasi gambar yang terinspirasi dari desain Vision Transformers.	Colab Kartu model
CspNet (TIMM)	Vision	Menyempurnakan dan men-deploy model klasifikasi image CSPNet (Cross Stage Partial Network).	Colab Kartu model
Inception (TIMM)	Vision	Menyempurnakan dan men-deploy model klasifikasi image Inception.	Colab Kartu model
DeepLabv3+ (dengan checkpoint)	Vision	Menyempurnakan dan men-deploy model DeepLab-v3 Plus untuk segmentasi gambar semantik.	Colab Kartu model
R-CNN yang lebih cepat (Detectron2)	Vision	Menyempurnakan dan men-deploy implementasi Detectron2 dari model Faster R-CNN untuk deteksi objek gambar.	Colab Kartu model
RetinaNet (Detectron2)	Vision	Menyempurnakan dan men-deploy implementasi Detectron2 dari model RetinaNet untuk deteksi objek gambar.	Colab Kartu model
Mask R-CNN (Detectron2)	Vision	Menyempurnakan dan men-deploy implementasi Detectron2 dari model Mask R-CNN untuk deteksi dan segmentasi objek gambar.	Colab Kartu model
ControlNet	Vision	Menyempurnakan dan men-deploy model pembuatan teks ke gambar ControlNet.	Colab Kartu model
MobileNet (TIMM)	Vision	Menyempurnakan dan men-deploy implementasi PyTorch dari model klasifikasi image MobileNet.	Colab Kartu model
Klasifikasi Gambar MobileNetV2 (MediaPipe)	Vision	Menyempurnakan model klasifikasi gambar MobileNetV2 dengan menggunakan pembuat model MediaPipe.	Colab Kartu model
Deteksi Objek MobileNetV2 (MediaPipe)	Vision	Menyempurnakan model deteksi objek MobileNetV2 dengan menggunakan pembuat model MediaPipe.	Colab Kartu model
MobileNet-MultiHW-AVG (MediaPipe)	Vision	Menyempurnakan model deteksi objek MobileNet-MultiHW-AVG dengan menggunakan pembuat model MediaPipe.	Colab Kartu model
DeiT	Vision	Menyempurnakan dan men-deploy model DeiT (Transformer Gambar Hemat data) untuk klasifikasi gambar.	Colab Kartu model
BEiT	Vision	Menyempurnakan dan men-deploy model BEiT (representasi Encoder Dua Arah dari Transformer Gambar) untuk klasifikasi gambar.	Colab Kartu model
Pengenalan Gestur Tangan (MediaPipe)	Vision	Menyempurnakan dan men-deploy model Pengenalan Gestur Tangan di perangkat menggunakan MediaPipe.	Colab Kartu model
Pengklasifikasi Penyematan Kata Rata-Rata (MediaPipe)	Vision	Menyempurnakan dan men-deploy model Pengklasifikasi Kata Penyematan di perangkat dengan menggunakan MediaPipe.	Colab Kartu model
Pengklasifikasi MobileBERT (MediaPipe)	Vision	Menyempurnakan dan men-deploy model MobileBERT Classifier di perangkat dengan menggunakan MediaPipe.	Colab Kartu model
Klasifikasi Klip Video MoViNet	Video	Menyempurnakan dan men-deploy model klasifikasi klip video MoViNet.	Colab Kartu model
Pengenalan Tindakan Video MoViNet	Video	Menyempurnakan dan men-deploy model MoViNet untuk inferensi pengenalan tindakan.	Colab Kartu model
Stable Diffusion XL LCM	Vision	Deploy model ini yang menggunakan Latent Consistency Model (LCM) untuk meningkatkan pembuatan gambar ke teks dalam Latent Diffusion Model dengan memungkinkan pembuatan gambar yang lebih cepat dan berkualitas tinggi dengan lebih sedikit langkah.	Colab Kartu model
LLaVA 1.5	Vision, Language	Men-deploy model LLaVA 1.5.	Colab Kartu model
Pytorch-ZipNeRF	Vision, Video	Latih model Pytorch-ZipNeRF yang merupakan implementasi algoritma ZipNeRF mutakhir dalam framework Pytorch, yang dirancang untuk rekonstruksi 3D yang efisien dan akurat dari gambar 2D.	Colab Kartu model
Mixtral	Bahasa	Deploy model Mixtral yang merupakan model bahasa besar (LLM) Mixture of Experts (MoE) yang dikembangkan oleh Mistral AI.	Kartu model
Llama 2 (Terkuantisasi)	Bahasa	Menyesuaikan dan men-deploy model Llama 2 Meta yang dikuantisasi.	Colab Kartu model
LaMa (Large Mask Inpainting)	Vision	Deploy LaMa yang menggunakan konvolusi Fourier cepat (FFC), kerugian perseptual bidang reseptif tinggi dan mask pelatihan besar memungkinkan inpainting gambar yang kuat terhadap resolusi.	Colab Kartu model
AutoGluon	Berbentuk tabel	Dengan AutoGluon, Anda dapat melatih dan men-deploy model machine learning dan deep learning dengan akurasi tinggi untuk data tabuler.	Colab Kartu model
MaMMUT	Bahasa, Visi	Arsitektur vision-encoder dan text-decoder untuk tugas multimodal seperti visual question answering, pengambilan gambar-teks, pengambilan teks-gambar, dan pembuatan embedding multimodal.	Colab Kartu model
Whisper Besar	Ucapan	Deploy Whisper Large, model canggih OpenAI untuk pengenalan ucapan otomatis (ASR).	Colab Kartu model