Menggunakan Model Hugging Face

HuggingFace menyediakan model terlatih, skrip penyesuaian, dan API pengembangan yang mempermudah proses pembuatan dan penemuan LLM. Model Garden dapat menayangkan model yang didukung Text Embedding Inference, Regular Pytorch Inference, dan Text Generation Inference di HuggingFace.

Opsi deployment untuk model Hugging Face

Anda dapat men-deploy model Hugging Face yang didukung di Vertex AI atau Google Kubernetes Engine (GKE). Opsi deployment yang Anda pilih dapat bergantung pada model yang Anda gunakan dan seberapa besar kontrol yang Anda inginkan atas workload Anda.

Men-deploy di Vertex AI

Vertex AI menawarkan platform terkelola untuk membuat dan menskalakan project machine learning tanpa keahlian MLOps internal. Anda dapat menggunakan Vertex AI sebagai aplikasi downstream yang menayangkan model Hugging Face. Sebaiknya gunakan Vertex AI jika Anda menginginkan kemampuan MLOps menyeluruh, fitur ML nilai tambah, dan pengalaman tanpa server untuk pengembangan yang disederhanakan.

  1. Untuk men-deploy model Hugging Face yang didukung di Vertex AI, buka Model Garden.

    Buka Model Garden

  2. Buka bagian Model open source di Hugging Face, lalu klik Tampilkan selengkapnya.

  3. Temukan dan pilih model yang akan di-deploy.

  4. Opsional: Untuk Lingkungan deployment, pilih Vertex AI.

  5. Opsional: Tentukan detail deployment.

  6. Klik Deploy.

Untuk memulai, lihat contoh berikut:

Men-deploy di GKE

Google Kubernetes Engine (GKE) adalah solusi Google Cloud untuk Kubernetes terkelola yang memberikan skalabilitas, keamanan, ketahanan, dan efektivitas biaya. Sebaiknya gunakan opsi ini jika Anda sudah memiliki investasi Kubernetes, organisasi Anda memiliki keahlian MLOps internal, atau jika Anda memerlukan kontrol terperinci atas beban kerja AI/ML yang kompleks dengan persyaratan keamanan, pipeline data, dan pengelolaan resource yang unik.

  1. Untuk men-deploy model Hugging Face yang didukung di GKE, buka Model Garden.

    Buka Model Garden

  2. Buka bagian Model open source di Hugging Face, lalu klik Tampilkan selengkapnya.

  3. Temukan dan pilih model yang akan di-deploy.

  4. Untuk Deployment environment, pilih GKE.

  5. Ikuti petunjuk deployment.

Untuk memulai, lihat contoh berikut: