Ejecuta la inferencia de LLM en GPUs de Cloud Run con Hugging Face Transformers.js

En el siguiente codelab, se muestra cómo ejecutar un servicio de backend que ejecuta el paquete Transformers.js. El paquete Transformers.js es funcionalmente equivalente a la biblioteca de Python de Hugging Face Transformers junto con el modelo Gemma 2 de Google.

Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.

Última actualización: 2025-10-19 (UTC)