使用 Hugging Face Transformers.js 在 Cloud Run GPU 上執行大型語言模型推論

下列程式碼研究室說明如何執行執行 Transformers.js 套件的後端服務。Transformers.js 套件功能與 Hugging Face 轉換器 Python 程式庫,以及 Google 的 Gemma 2 模型相同。

如需查看完整的程式碼研究室,請參閱「如何在 Cloud Run GPU 上執行 Transformers.js」。