Menjalankan inferensi LLM di GPU Cloud Run dengan Hugging Face Transformers.js (layanan)

Codelab berikut menunjukkan cara menjalankan layanan backend yang menjalankan paket Transformers.js. Paket Transformers.js secara fungsional setara dengan library python transformers Hugging Face bersama dengan model Gemma 2 Google.

Lihat seluruh codelab di Cara Menjalankan Transformers.js di GPU Cloud Run.