Ringkasan Model Garden

Model Garden di konsol Google Cloud adalah library model ML yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model dan aset OSS tertentu serta eksklusif Google.

Topik berikut memperkenalkan model AI yang tersedia di Model Garden dan cara menggunakannya.

Mempelajari model

Untuk melihat daftar Vertex AI dan model open source, yang dapat disesuaikan, dan khusus tugas, buka halaman Model Garden di konsolGoogle Cloud .

Buka Model Garden

Kategori model yang tersedia di Model Garden adalah:

Kategori Deskripsi
Model dasar Model besar multitugas terlatih yang dapat dimodifikasi atau disesuaikan untuk tugas tertentu menggunakan Vertex AI Studio, Vertex AI API, dan Vertex AI SDK untuk Python.
Model yang dapat disesuaikan Model yang dapat Anda sesuaikan menggunakan notebook atau pipeline kustom.
Solusi khusus tugas Sebagian besar model bawaan ini siap digunakan. Banyak di antaranya yang dapat disesuaikan menggunakan data Anda sendiri.

Untuk memfilter model di panel filter, tentukan hal berikut:

  • Modalitas: Klik modalitas (jenis data) yang Anda inginkan dalam model.
  • Tasks: Klik tugas yang Anda inginkan untuk dijalankan model.
  • Fitur: Klik fitur yang Anda inginkan dalam model.

Untuk mempelajari lebih lanjut setiap model, klik kartu modelnya.

Model yang tersedia di Model Garden

Anda dapat menemukan model pihak pertama Google dan memilih model open source di Model Garden.

Daftar model pihak pertama Google

Tabel berikut mencantumkan model pihak pertama Google yang tersedia di Model Garden:

Nama model Modalitas Deskripsi Panduan Memulai
Gemini 1.5 Flash Bahasa, audio, visi Model multimodal Gemini yang paling cepat dan hemat biaya. API ini dibuat untuk tugas bervolume tinggi dan aplikasi terjangkau yang sensitif terhadap latensi. Karena responsifnya Gemini 1.5 Flash, ini adalah opsi yang baik untuk membuat asisten chat dan aplikasi pembuatan konten on demand. Kartu model
Gemini 1.5 Pro Bahasa, audio, visi Model multimodal yang mendukung penambahan file gambar, audio, video, dan PDF dalam perintah teks atau chat untuk menghasilkan respons teks atau kode. Kartu model
Gemini 1.0 Pro Bahasa Dirancang untuk menangani tugas bahasa alami, teks multiturn dan chat kode, serta pembuatan kode. Kartu model
Gemini 1.0 Pro Vision Bahasa, visi Model multimodal yang mendukung penambahan file gambar, video, dan PDF dalam perintah teks atau chat untuk menghasilkan respons teks atau kode. Kartu model
PaLM 2 untuk Teks Bahasa Disesuaikan untuk mengikuti petunjuk natural language dan cocok untuk berbagai tugas bahasa. Kartu model
PaLM 2 untuk Chat Bahasa Disempurnakan untuk melakukan percakapan yang alami. Gunakan model ini untuk membuat dan menyesuaikan aplikasi chatbot Anda sendiri. Kartu model
Codey untuk Penyelesaian Kode Bahasa Membuat kode berdasarkan perintah kode. Cocok untuk saran kode dan meminimalkan bug dalam kode. Kartu model
Codey untuk Pembuatan Kode Bahasa Menghasilkan kode berdasarkan input natural language. Cocok untuk menulis fungsi, class, pengujian unit, dan lainnya. Kartu model
Codey untuk Chat Kode Bahasa Dapatkan bantuan terkait kode melalui percakapan alami. Cocok untuk pertanyaan tentang API, sintaksis dalam bahasa yang didukung, dan lainnya. Kartu model
Embedding untuk Teks Bahasa Mengonversi data tekstual menjadi vektor numerik yang dapat diproses oleh algoritma machine learning, terutama model besar. Kartu model
Imagen untuk Pembuatan Gambar Vision Buat gambar kualitas studio dalam skala besar menggunakan perintah teks. Anda juga dapat menggunakan model ini untuk meningkatkan resolusi gambar. Kartu model
Imagen untuk Pengeditan dan Penyesuaian Vision Edit atau gunakan few-shot learning untuk membuat gambar kelas studio dalam skala besar menggunakan gambar dasar dan perintah teks, atau menggunakan gambar referensi dan perintah teks. Kartu model
Segmentasi Gambar Vertex (Pratinjau) Vision Gunakan perintah teks atau gambar coretan untuk menyegmentasikan gambar. Segmentasi gambar memungkinkan Anda, misalnya, mendeteksi objek, menghapus latar belakang gambar, atau menyegmentasikan latar depan gambar. Kartu model
Imagen untuk Pemberian Teks & VQA Bahasa Menghasilkan deskripsi yang relevan untuk gambar tertentu. Kartu model
Embedding untuk Multimodal Vision Menghasilkan vektor berdasarkan gambar, yang dapat digunakan untuk tugas downstream seperti klasifikasi gambar dan penelusuran gambar. Kartu model
Chirp Ucapan Versi Model Ucapan Universal yang memiliki lebih dari 2 miliar parameter dan dapat mentranskripsikan dalam lebih dari 100 bahasa dalam satu model. Kartu model

Daftar model dengan penyesuaian open source atau menyajikan resep di Model Garden

Tabel berikut mencantumkan model OSS yang mendukung penyesuaian open source atau resep penayangan di Model Garden:

Nama model Modalitas Deskripsi Panduan memulai
Llama 3.3 Bahasa Model bahasa besar (LLM) multibahasa Meta Llama 3.3 adalah model generatif yang telah dilatih sebelumnya dan disesuaikan dengan petunjuk dalam 70B (teks masuk/teks keluar). Kartu model
Flux Vision Model transformer flow yang diperbaiki dengan 12 miliar parameter yang menghasilkan gambar berkualitas tinggi dari deskripsi teks. Kartu model
Pelindung Perintah Bahasa Melindungi input LLM pembatasan terhadap teknik jailbreaking dan injeksi tidak langsung. Kartu model
Llama 3.2 Bahasa Kumpulan model bahasa besar multibahasa yang merupakan model generatif terlatih dan disesuaikan dengan petunjuk dalam ukuran 1 miliar dan 3 miliar. Kartu model
Llama 3.2-Vision Bahasa, Visi Kumpulan model bahasa besar multimodal yang merupakan model generatif penalaran gambar terlatih dan disesuaikan dengan petunjuk dalam ukuran 11B dan 90B. Model ini dioptimalkan untuk pengenalan visual, penalaran gambar, pemberian teks, dan menjawab pertanyaan umum tentang gambar. Kartu model
Llama Guard 3 Bahasa Model terlatih Llama-3.1-8B yang telah disesuaikan untuk klasifikasi keamanan konten. Kartu model
Qwen2 Bahasa Men-deploy Qwen2, seri model bahasa besar dasar. Colab
Kartu model
Phi-3 Bahasa Men-deploy Phi-3, seri model bahasa besar dasar. Colab
Kartu model
E5 Bahasa Men-deploy E5, seri model embedding teks. Colab
Kartu model
ID Instan Bahasa, Visi Men-deploy ID Instan, model pembuatan teks ke gambar yang mempertahankan identitas. Colab
Kartu model
Llama 3 Bahasa Jelajahi dan buat dengan model Llama 3 Meta (8B, 70B, 405B) di Vertex AI. Kartu model
Gemma 2 Bahasa Model bobot terbuka (9B, 27B) yang dibuat dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google. Kartu model
Gemma Bahasa Model bobot terbuka (2B, 7B) yang dibuat dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google. Kartu model
CodeGemma Bahasa Model bobot terbuka (2B, 7B) yang dirancang untuk pembuatan kode dan penyelesaian kode yang dibuat dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google. Kartu model
PaliGemma Bahasa Model 3B bobot terbuka yang dirancang untuk tugas pemberian teks pada gambar serta tugas pertanyaan dan jawaban visual yang dibuat dari riset dan teknologi yang sama dengan yang digunakan untuk membuat model Gemini Google. Kartu model
Vicuna v1.5 Bahasa Men-deploy model seri Vicuna v1.5, yang merupakan model dasar yang disesuaikan dari LLama2 untuk pembuatan teks. Kartu model
NLLB Bahasa Men-deploy model seri nllb untuk terjemahan multibahasa. Kartu model
Colab
Mistral-7B Bahasa Men-deploy Mistral-7B, model dasar untuk pembuatan teks. Kartu model
BioGPT Bahasa Men-deploy BioGPT, model generatif teks untuk domain biomedis. Kartu model
Colab
BiomedCLIP Bahasa, Visi Men-deploy BiomedCLIP, model dasar multi-modal untuk domain biomedis. Kartu model
Colab
ImageBind Bahasa, Visi,
Audio
Men-deploy ImageBind, model dasar untuk penyematan multimodal. Kartu model
Colab
DITO Bahasa, Visi Menyempurnakan dan men-deploy DITO, model dasar multimodal untuk tugas deteksi objek kosakata terbuka. Kartu model
Colab
OWL-ViT v2 Bahasa, Visi Men-deploy OWL-ViT v2, model dasar multimodal untuk tugas deteksi objek kosakata terbuka. Kartu model
Colab
FaceStylizer (Mediapipe) Vision Pipeline generatif untuk mengubah gambar wajah manusia menjadi gaya baru. Kartu model
Colab
Llama 2 Bahasa Menyesuaikan dan men-deploy model dasar Llama 2 Meta (7B, 13B, 70B) di Vertex AI. Kartu model
Code Llama Bahasa Men-deploy model dasar Code Llama Meta (7B, 13B, 34B) di Vertex AI. Kartu model
Falcon-instruct Bahasa Menyempurnakan dan men-deploy model Falcon-instruct (7B, 40B) menggunakan PEFT. Colab
Kartu model
OpenLLaMA Bahasa Sempurnakan dan deploy model OpenLLaMA (3B, 7B, 13B) dengan menggunakan PEFT. Colab
Kartu model
T5-FLAN Bahasa Menyesuaikan dan men-deploy T5-FLAN (dasar, kecil, besar). Kartu model (termasuk pipeline penyesuaian)
BERT Bahasa Menyesuaikan dan men-deploy BERT menggunakan PEFT. Colab
Kartu model
BART-large-cnn Bahasa Men-deploy BART, model encoder-encoder transformer (seq2seq) dengan encoder dua arah (mirip BERT) dan dekoder autoregresif (mirip GPT). Colab
Kartu model
RoBERTa-large Bahasa Menyempurnakan dan men-deploy RoBERTa-large menggunakan PEFT. Colab
Kartu model
XLM-RoBERTa-large Bahasa Menyempurnakan dan men-deploy XLM-RoBERTa-large (versi multibahasa RoBERTa) menggunakan PEFT. Colab
Kartu model
Dolly-v2-7b Bahasa Mendeploy Dolly-v2-7b, model bahasa besar yang mengikuti instruksi dengan 6,9 miliar parameter. Colab
Kartu model
Stable Diffusion XL v1.0 Bahasa, Visi Men-deploy Stable Diffusion XL v1.0, yang mendukung pembuatan teks ke gambar. Colab
Kartu model
Stable Diffusion XL Lightning Bahasa, Visi Men-deploy Stable Diffusion XL Lightning, model pembuatan teks ke gambar. Colab
Kartu model
Stable Diffusion v2.1 Bahasa, Visi Menyempurnakan dan men-deploy Stable Diffusion v2.1 (mendukung pembuatan teks ke gambar) menggunakan Dreambooth. Colab
Kartu model
Peningkatan Stable Diffusion 4x Bahasa, Visi Men-deploy peningkatan Stable Diffusion 4x, yang mendukung superresolusi gambar dengan kondisi teks. Colab
Kartu model
InstructPix2Pix Bahasa, Visi Men-deploy InstructPix2Pix, yang mendukung pengeditan gambar menggunakan perintah teks. Colab
Kartu model
Stable Diffusion Inpainting Bahasa, Visi Menyempurnakan dan men-deploy Stable Diffusion Inpainting, yang mendukung pewarnaan gambar yang disamarkan menggunakan perintah teks. Colab
Kartu model
SAM Bahasa, Visi Men-deploy Segmen Apa Pun, yang mendukung segmentasi gambar zero-shot. Colab
Kartu model
Teks ke video (ModelScope) Bahasa, Visi Men-deploy ModelScope teks ke video, yang mendukung pembuatan teks ke video. Colab
Kartu model
Pengambilan Gambar yang Ditulis Pic2Word Bahasa, Visi Men-deploy Pic2Word, yang mendukung pengambilan gambar multi-modal. Colab
Kartu model
BLIP2 Bahasa, Visi Men-deploy BLIP2, yang mendukung keterangan gambar dan jawaban pertanyaan visual. Colab
Kartu model
Open-CLIP Bahasa, Visi Menyempurnakan dan men-deploy Open-CLIP, yang mendukung klasifikasi zero-shot. Colab
Kartu model
F-VLM Bahasa, Visi Men-deploy F-VLM, yang mendukung deteksi objek gambar kosakata terbuka. Colab
Kartu model
tfhub/EfficientNetV2 Vision Menyempurnakan dan men-deploy implementasi Tensorflow Vision dari model klasifikasi gambar EefisienNetV2. Colab
Kartu model
EfisienNetV2 (TIMM) Vision Menyempurnakan dan men-deploy implementasi PyTorch dari model klasifikasi image barang efisienNetV2. Colab
Kartu model
Eksklusif/EfficientNetV2 Vision Menyempurnakan dan men-deploy checkpoint eksklusif Google dari model klasifikasi gambar EefisienNetV2. Colab
Kartu model
EfficientNetLite (MediaPipe) Vision Menyempurnakan model klasifikasi gambar EffectiveNetLite melalui pembuat model MediaPipe. Colab
Kartu model
tfvision/vit Vision Menyempurnakan dan men-deploy implementasi TensorFlow Vision dari model klasifikasi gambar ViT. Colab
Kartu model
ViT (TIMM) Vision Menyempurnakan dan men-deploy implementasi PyTorch dari model klasifikasi image ViT. Colab
Kartu model
Eksklusif/ViT Vision Menyempurnakan dan men-deploy checkpoint eksklusif Google dari model klasifikasi image ViT. Colab
Kartu model
Eksklusif/MaxViT Vision Menyempurnakan dan men-deploy checkpoint eksklusif Google untuk model klasifikasi gambar MaxViT hybrid (CNN + ViT). Colab
Kartu model
ViT (JAX) Vision Menyempurnakan dan men-deploy implementasi JAX dari model klasifikasi gambar ViT. Colab
Kartu model
tfvision/SpineNet Vision Menyempurnakan dan men-deploy implementasi Tensorflow Vision untuk model deteksi objek SpineNet. Colab
Kartu model
Eksklusif/Spinenet Vision Menyempurnakan dan men-deploy checkpoint eksklusif Google untuk model deteksi objek SpineNet. Colab
Kartu model
tfvision/YOLO Vision Menyempurnakan dan men-deploy implementasi TensorFlow Vision untuk model deteksi objek satu tahap YOLO. Colab
Kartu model
Eksklusif/YOLO Vision Menyempurnakan dan men-deploy checkpoint eksklusif Google untuk model deteksi objek satu tahap YOLO. Colab
Kartu model
YOLOv8 (Keras) Vision Menyempurnakan dan men-deploy implementasi Keras model YOLOv8 untuk deteksi objek. Colab
Kartu model
tfvision/YOLOv7 Vision Menyempurnakan dan menddeploy model YOLOv7 untuk deteksi objek. Colab
Kartu model
Pelacakan Objek Video ByteTrack Vision Menjalankan prediksi batch untuk pelacakan objek video menggunakan pelacak ByteTrack. Colab
Kartu model
ResNeSt (TIMM) Vision Menyempurnakan dan men-deploy implementasi PyTorch dari model klasifikasi image ResNeSt. Colab
Kartu model
ConvNeXt (TIMM) Vision Menyempurnakan dan men-deploy ConvNeXt, model konvolusional murni untuk klasifikasi gambar yang terinspirasi dari desain Vision Transformers. Colab
Kartu model
CspNet (TIMM) Vision Menyempurnakan dan men-deploy model klasifikasi image CSPNet (Cross Stage Partial Network). Colab
Kartu model
Inception (TIMM) Vision Menyempurnakan dan men-deploy model klasifikasi image Inception. Colab
Kartu model
DeepLabv3+ (dengan checkpoint) Vision Menyempurnakan dan men-deploy model DeepLab-v3 Plus untuk segmentasi gambar semantik. Colab
Kartu model
R-CNN yang lebih cepat (Detectron2) Vision Menyempurnakan dan men-deploy implementasi Detectron2 dari model Faster R-CNN untuk deteksi objek gambar. Colab
Kartu model
RetinaNet (Detectron2) Vision Menyempurnakan dan men-deploy implementasi Detectron2 dari model RetinaNet untuk deteksi objek gambar. Colab
Kartu model
Mask R-CNN (Detectron2) Vision Menyempurnakan dan men-deploy implementasi Detectron2 dari model Mask R-CNN untuk deteksi dan segmentasi objek gambar. Colab
Kartu model
ControlNet Vision Menyempurnakan dan men-deploy model pembuatan teks ke gambar ControlNet. Colab
Kartu model
MobileNet (TIMM) Vision Menyempurnakan dan men-deploy implementasi PyTorch dari model klasifikasi image MobileNet. Colab
Kartu model
Klasifikasi Gambar MobileNetV2 (MediaPipe) Vision Menyempurnakan model klasifikasi gambar MobileNetV2 dengan menggunakan pembuat model MediaPipe. Colab
Kartu model
Deteksi Objek MobileNetV2 (MediaPipe) Vision Menyempurnakan model deteksi objek MobileNetV2 dengan menggunakan pembuat model MediaPipe. Colab
Kartu model
MobileNet-MultiHW-AVG (MediaPipe) Vision Menyempurnakan model deteksi objek MobileNet-MultiHW-AVG dengan menggunakan pembuat model MediaPipe. Colab
Kartu model
DeiT Vision Menyempurnakan dan men-deploy model DeiT (Transformer Gambar Hemat data) untuk klasifikasi gambar. Colab
Kartu model
BEiT Vision Menyempurnakan dan men-deploy model BEiT (representasi Encoder Dua Arah dari Transformer Gambar) untuk klasifikasi gambar. Colab
Kartu model
Pengenalan Gestur Tangan (MediaPipe) Vision Menyempurnakan dan men-deploy model Pengenalan Gestur Tangan di perangkat menggunakan MediaPipe. Colab
Kartu model
Pengklasifikasi Penyematan Kata Rata-Rata (MediaPipe) Vision Menyempurnakan dan men-deploy model Pengklasifikasi Kata Penyematan di perangkat dengan menggunakan MediaPipe. Colab
Kartu model
Pengklasifikasi MobileBERT (MediaPipe) Vision Menyempurnakan dan men-deploy model MobileBERT Classifier di perangkat dengan menggunakan MediaPipe. Colab
Kartu model
Klasifikasi Klip Video MoViNet Video Menyempurnakan dan men-deploy model klasifikasi klip video MoViNet. Colab
Kartu model
Pengenalan Tindakan Video MoViNet Video Menyempurnakan dan men-deploy model MoViNet untuk inferensi pengenalan tindakan. Colab
Kartu model
LCM Stable Diffusion XL Vision Deploy model ini yang menggunakan Latent Consistency Model (LCM) untuk meningkatkan pembuatan teks ke gambar dalam Latent Diffusion Model dengan memungkinkan pembuatan gambar yang lebih cepat dan berkualitas tinggi dengan lebih sedikit langkah. Colab
Kartu model
LLaVA 1.5 Visi, Bahasa Men-deploy model LLaVA 1.5. Colab
Kartu model
Pytorch-ZipNeRF Visi, Video Latih model Pytorch-ZipNeRF yang merupakan implementasi algoritma ZipNeRF terbaru dalam framework Pytorch, yang dirancang untuk rekonstruksi 3D yang efisien dan akurat dari gambar 2D. Colab
Kartu model
Mixtral Bahasa Men-deploy model Mixtral yang merupakan model bahasa besar (LLM) Mixture of Experts (MoE) yang dikembangkan oleh Mistral AI. Kartu model
Llama 2 (Dikuantisasi) Bahasa Menyesuaikan & men-deploy versi kuantisasi model Llama 2 Meta. Colab
Kartu model
LaMa (Large Mask Inpainting) Vision Men-deploy LaMa yang menggunakan konvolusi Fourier cepat (FFC), kerugian persepsi bidang reseptif yang tinggi, dan mask pelatihan yang besar memungkinkan inpainting gambar yang andal dalam resolusi. Colab
Kartu model
AutoGluon Berbentuk tabel Dengan AutoGluon, Anda dapat melatih dan men-deploy model machine learning dan deep learning dengan akurasi tinggi untuk data tabel. Colab
Kartu model
MaMMUT Bahasa, Visi Arsitektur encoder visi dan decoder teks untuk tugas multimodal seperti visual question answering, pengambilan teks gambar, pengambilan gambar teks, dan pembuatan penyematan multimodal. Colab
Kartu model

Daftar model partner yang tersedia di Model Garden

Beberapa model partner ditawarkan sebagai API terkelola di Vertex AI Model Garden (juga dikenal sebagai model as a service). Tabel berikut mencantumkan model yang tersedia dari partner Google di Model Garden:

Nama model Modalitas Deskripsi Panduan memulai
Claude 3.5 Sonnet v2 dari Anthropic Bahasa Claude 3.5 Sonnet yang telah diupgrade adalah model canggih untuk tugas software engineering di dunia nyata dan kemampuan agen. Claude 3.5 Sonnet menghadirkan peningkatan ini dengan harga dan kecepatan yang sama seperti pendahulunya. Kartu model
Claude 3.5 Haiku dari Anthropic Bahasa Claude 3.5 Haiku, model Anthropic generasi berikutnya yang paling cepat dan hemat biaya, optimal untuk kasus penggunaan yang membutuhkan kecepatan dan keterjangkauan. Kartu model
Claude 3 Opus dari Anthropic Bahasa Model AI canggih, dengan performa terbaik untuk menyelesaikan tugas yang sangat kompleks. Model ini dapat menavigasi perintah terbuka dan skenario yang tidak terlihat dengan kemahiran yang luar biasa dan pemahaman layaknya manusia. Kartu model
Claude 3 Haiku dari Anthropic Bahasa Model teks dan visi tercepat dari Anthropic untuk merespons kueri sederhana secara instan, yang ditujukan untuk pengalaman AI yang lancar yang meniru interaksi manusia. Kartu model
Claude 3.5 Sonnet dari Anthropic Bahasa Claude 3.5 Sonnet mengungguli Claude 3 Opus Anthropic di berbagai evaluasi Anthropic dengan kecepatan dan biaya layaknya model tingkat menengah Anthropic, Claude 3 Sonnet. Kartu model
Claude 3 Sonnet dari Anthropic Bahasa Model visi dan teks yang menyeimbangkan performa dan kecepatan untuk memproses beban kerja perusahaan. Layanan ini dirancang untuk deployment AI berskala rendah dan hemat biaya. Kartu model
Jamba 1.5 Large (Pratinjau) Bahasa Jamba 1.5 Large dari AI21 Labs dirancang untuk respons berkualitas unggul, throughput tinggi, dan harga kompetitif dibandingkan dengan model lain dalam kelas ukurannya. Kartu model
Jamba 1.5 Mini (Pratinjau) Bahasa Jamba 1.5 Mini dari AI21 Labs sangat seimbang dalam kualitas, throughput, dan biaya rendah. Kartu model
Llama 3.2 (Pratinjau) Bahasa, Visi Model multimodal berukuran sedang 90B yang dapat mendukung penalaran gambar, seperti analisis diagram dan grafik serta pemberian teks gambar. Kartu model
Llama 3.1 (Pratinjau) Bahasa Kumpulan LLM multibahasa yang dioptimalkan untuk kasus penggunaan dialog multibahasa dan mengungguli banyak model chat open source dan tertutup yang tersedia pada tolok ukur industri umum. Kartu model
Mistral Besar (24,11) Bahasa Mistral Large (24.11) adalah versi berikutnya dari model Mistral Large (2407) yang kini memiliki kemampuan penalaran dan panggilan fungsi yang lebih baik. Kartu model
Mistral Large (2407) Bahasa Mistral Large (2407) adalah model utama Mistral AI untuk pembuatan teks. Model ini mencapai kemampuan penalaran tingkat atas dan dapat digunakan untuk tugas multibahasa yang kompleks, termasuk pemahaman teks, transformasi, dan pembuatan kode. Kartu model
Mistral Nemo Bahasa Model eksklusif Mistral AI yang paling hemat biaya. Gunakan workload latensi rendah Mistral Nemo dan tugas sederhana yang dapat dilakukan secara massal, seperti klasifikasi, dukungan pelanggan, dan pembuatan teks. Kartu model
Codestral Kode Model generatif yang dirancang khusus dan dioptimalkan untuk pembuatan kode. Anda dapat menggunakan Codestral untuk mendesain aplikasi AI lanjutan. Kartu model

Pemindaian keamanan model

Google melakukan pengujian dan benchmark menyeluruh pada penayangan dan penyesuaian container yang kami sediakan. Pemindaian kerentanan aktif juga diterapkan ke artefak penampung.

Model pihak ketiga dari partner unggulan menjalani pemindaian checkpoint model untuk memastikan keasliannya. Model pihak ketiga dari HuggingFace Hub dipindai langsung oleh HuggingFace dan pemindai pihak ketiga mereka untuk mendeteksi malware, file pickle, lapisan Keras Lambda, dan secret. Model yang dianggap tidak aman dari pemindaian ini akan ditandai oleh HuggingFace dan diblokir dari deployment di Model Garden. Model yang dianggap mencurigakan atau yang memiliki kemampuan untuk berpotensi mengeksekusi kode jarak jauh ditunjukkan di Model Garden, tetapi masih dapat di-deploy. Sebaiknya Anda melakukan peninjauan menyeluruh terhadap model yang mencurigakan sebelum men-deploy-nya dalam Model Garden.

Cara menggunakan kartu model

Klik kartu model untuk menggunakan model yang terkait dengannya. Misalnya, Anda dapat mengklik kartu model untuk menguji perintah, menyesuaikan model, membuat aplikasi, dan melihat contoh kode.

Untuk mempelajari cara menggunakan model yang terkait dengan kartu model, klik salah satu tab berikut:

Perintah pengujian

Gunakan kartu model Vertex AI PaLM API untuk menguji perintah.

  1. Di konsol Google Cloud , buka halaman Model Garden.

    Buka Model Garden

  2. Temukan model yang didukung yang ingin Anda uji, lalu klik Lihat detail.

  3. Klik Open perintah design.

    Anda akan diarahkan ke halaman Prompt design.

  4. Di Prompt, masukkan perintah yang ingin diuji.

  5. Opsional: Konfigurasikan parameter model.

  6. Klik Submit.

Menyesuaikan model

Untuk menyesuaikan model yang didukung, gunakan pipeline Vertex AI atau notebook.

Menyesuaikan menggunakan pipeline

Model BERT dan T5-FLAN mendukung penyesuaian model menggunakan pipeline.

  1. Di konsol Google Cloud , buka halaman Model Garden.

    Buka Model Garden

  2. Di Search models, masukkan BERT atau T5-FLAN, lalu klik kaca pembesar untuk melakukan penelusuran.

  3. Klik Lihat detail pada kartu model T5-FLAN atau BERT.

  4. Klik Open fine-tuning pipeline.

    Anda akan diarahkan ke halaman pipeline Vertex AI.

  5. Untuk memulai penyesuaian, klik Create run.

Menyesuaikan di notebook

Kartu model untuk sebagian besar model dasar open source dan model yang dapat disesuaikan mendukung penyesuaian di notebook.

  1. Di konsol Google Cloud , buka halaman Model Garden.

    Buka Model Garden

  2. Temukan model yang didukung yang ingin Anda sesuaikan, lalu klik View details.

  3. Klik Open notebook.

Men-deploy model

Anda dapat men-deploy model dari kartu modelnya, seperti Stable Diffusion. Saat men-deploy model, Anda dapat memilih untuk menggunakan reservasi Compute Engine. Untuk mengetahui informasi selengkapnya, lihat Menggunakan reservasi dengan prediksi.

  1. Di konsol Google Cloud , buka halaman Model Garden.

    Buka Model Garden

  2. Temukan model yang didukung yang ingin Anda deploy, lalu klik kartu modelnya.

  3. Klik Deploy untuk membuka panel Deploy model.

  4. Di panel Deploy model, tentukan detail untuk deployment Anda.

    1. Gunakan atau ubah nama model dan endpoint yang dihasilkan.
    2. Pilih lokasi untuk membuat endpoint model Anda.
    3. Pilih jenis mesin yang akan digunakan untuk setiap node deployment Anda.
    4. Untuk menggunakan reservasi Compute Engine, di bagian Setelan deployment, pilih Lanjutan.

      Untuk kolom Reservation type, pilih jenis reservasi. Reservasi harus cocok dengan spesifikasi mesin yang Anda tentukan.

      • Automatically use created reservation: Vertex AI otomatis memilih reservasi yang diizinkan dengan properti yang cocok. Jika tidak ada kapasitas dalam reservasi yang dipilih secara otomatis, Vertex AI akan menggunakan kumpulan resource umum Google Cloud.
      • Select specific reservations: Vertex AI menggunakan pemesanan tertentu. Jika tidak ada kapasitas untuk reservasi yang Anda pilih, error akan ditampilkan.
      • Jangan gunakan (default): Vertex AI menggunakan kumpulan resource Google Cloud umum. Nilai ini memiliki efek yang sama dengan tidak menentukan reservasi.
  5. Klik Deploy.

Lihat contoh kode

Sebagian besar kartu model untuk model solusi khusus tugas berisi contoh kode yang dapat Anda salin dan uji.

  1. Di konsol Google Cloud , buka halaman Model Garden.

    Buka Model Garden

  2. Temukan model yang didukung yang ingin Anda lihat contoh kodenya, lalu klik tab Documentation.

  3. Halaman akan men-scroll ke bagian dokumentasi dengan kode contoh yang disematkan.

Membuat aplikasi vision

Kartu model untuk model computer vision yang berlaku mendukung pembuatan aplikasi vision.

  1. Di konsol Google Cloud , buka halaman Model Garden.

    Buka Model Garden

  2. Temukan model vision di bagian solusi khusus Tugas yang ingin Anda gunakan untuk membuat aplikasi vision, lalu klik View details.

  3. Klik Build app.

    Anda akan diarahkan ke Vertex AI Vision.

  4. Di Application name, masukkan nama untuk aplikasi Anda, lalu klik Continue.

  5. Pilih paket penagihan, lalu klik Create.

    Anda akan diarahkan ke Vertex AI Vision Studio tempat Anda dapat melanjutkan pembuatan aplikasi computer vision.

Harga

Untuk model open source di Model Garden, Anda akan ditagih untuk penggunaan hal berikut di Vertex AI:

  • Penyesuaian model: Anda akan ditagih untuk resource komputasi yang digunakan dengan tarif yang sama seperti pelatihan kustom. Lihat harga pelatihan kustom.
  • Deployment model: Anda akan ditagih untuk resource komputasi yang digunakan untuk men-deploy model ke endpoint. Lihat harga prediksi.
  • Colab Enterprise: Lihat Harga Colab Enterprise.

Mengontrol akses ke model tertentu

Anda dapat menetapkan kebijakan organisasi Model Garden di tingkat organisasi, folder, atau project untuk mengontrol akses ke model tertentu di Model Garden. Misalnya, Anda dapat mengizinkan akses ke model tertentu yang telah Anda periksa dan menolak akses ke semua model lainnya.

Langkah selanjutnya