Ejecutar la inferencia de LLM en GPUs de Cloud Run con Hugging Face Transformers.js

En el siguiente laboratorio se muestra cómo ejecutar un servicio backend que ejecuta el paquete Transformers.js. El paquete Transformers.js es funcionalmente equivalente a la biblioteca de Python Transformers de Hugging Face junto con el modelo Gemma 2 de Google.

A menos que se indique lo contrario, el contenido de esta página está sujeto a la licencia Reconocimiento 4.0 de Creative Commons y las muestras de código están sujetas a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio web de Google Developers. Java es una marca registrada de Oracle o sus afiliados.

Última actualización: 2025-10-19 (UTC).