使用 Hugging Face Transformers.js 在 Cloud Run GPU 上執行大型語言模型推論

下列程式碼研究室說明如何執行執行 Transformers.js 套件的後端服務。Transformers.js 套件功能與 Hugging Face 轉換器 Python 程式庫，以及 Google 的 Gemma 2 模型相同。

如需查看完整的程式碼研究室，請參閱「如何在 Cloud Run GPU 上執行 Transformers.js」。

除非另有註明，否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權，程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。

上次更新時間：2025-09-04 (世界標準時間)。

使用 Hugging Face Transformers.js 在 Cloud Run GPU 上執行大型語言模型推論 透過集合功能整理內容 你可以依據偏好儲存及分類內容。