Esegui l'inferenza LLM sulle GPU Cloud Run con Hugging Face Transformers.js

Il seguente codelab mostra come eseguire un servizio di backend che esegue il pacchetto Transformers.js. Il pacchetto Transformers.js è funzionalmente equivalente alla libreria Python Hugging Face Transformers insieme al modello Gemma 2 di Google.

Consulta l'intero codelab all'indirizzo Come eseguire Transformers.js sulle GPU di Cloud Run.