Esegui l'inferenza LLM su GPU Cloud Run con Hugging Face Transformers.js (servizi)

Il seguente codelab mostra come eseguire un servizio di backend che esegue il pacchetto Transformers.js. Il pacchetto Transformers.js è funzionalmente equivalente alla libreria Python di Hugging Face Transformers insieme al modello Gemma 2 di Google.

Consulta l'intero codelab su come eseguire Transformers.js sulle GPU Cloud Run.