LLM-Inferenzen auf Cloud Run-GPUs mit Hugging Face Transformers.js ausführen

Im folgenden Codelab wird gezeigt, wie Sie einen Backend-Dienst ausführen, in dem das Transformers.js-Paket ausgeführt wird. Das Transformers.js-Paket ist funktional mit der Hugging Face Transformers Python-Bibliothek und dem Gemma 2-Modell von Google identisch.

Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.

Zuletzt aktualisiert: 2025-10-19 (UTC).