En este tutorial se muestra cómo desplegar una aplicación de IA generativa en Cloud Run y protegerla con Identity-Aware Proxy (IAP). IAP proporciona una capa de autorización central para las aplicaciones HTTPS implementadas en Cloud Run. Puedes usar IAP para adoptar políticas de control de acceso a nivel de aplicación o de organización en lugar de usar firewalls a nivel de red.
Ten en cuenta que, aunque también es posible usar la autenticación manual o de terceros para proteger una aplicación implementada en Cloud Run, te recomendamos que uses IAP si tienes un gran volumen de tráfico o tráfico multirregión para evitar interrupciones en el servicio de la aplicación.
En este tutorial, desplegarás una aplicación que hace llamadas a la API de Gemini. La aplicación se basa en el framework Streamlit.
Requisitos previos
En este tutorial se da por hecho que puedes usar las siguientes herramientas y frameworks:
Streamlit Streamlit es un framework de aplicaciones de código abierto que te permite crear e implementar aplicaciones de datos. Transforma secuencias de comandos de datos en aplicaciones web mediante Python.
Git: en este tutorial, usarás un repositorio de Git para gestionar el código fuente de tu aplicación. Para obtener más información sobre el uso de Git, consulta la documentación de Git.
Google Cloud servicios
Debes tener conocimientos básicos sobre los siguientes servicios de Google Cloud :
IA generativa en Vertex AI: proporciona acceso a los LLMs de Google para que puedas probarlos, ajustarlos y desplegarlos antes de usarlos en tus aplicaciones. Consulta más información sobre la IA generativa en Vertex AI.
Cloud Run: una plataforma de computación gestionada que te permite desplegar y ejecutar imágenes de contenedor. Crea un servicio de Cloud Run para desplegar tu aplicación. Consulta más información sobre Cloud Run.
Cloud Build: ejecuta tus compilaciones en Google Cloud. En este tutorial, configurarás un activador de Cloud Build automático para compilar y desplegar tu aplicación en Cloud Run cada vez que envíes tus confirmaciones al repositorio de Git. Consulta más información sobre Cloud Build.
Balanceo de carga de Cloud: ayuda a distribuir el tráfico entre varias instancias de tu aplicación para conseguir escalabilidad. Creas un balanceador de carga de aplicaciones para distribuir el tráfico a las instancias de backend de la aplicación alojadas en Cloud Run. Cloud Load Balancing también es un requisito previo para IAP. Más información sobre Cloud Load Balancing
Identity-Aware Proxy (IAP): utiliza IAP para crear una capa de autorización central que proteja la aplicación. IAP realiza comprobaciones de autenticación y autorización que se extienden a los servicios vinculados. Google CloudIAP también es compatible con Cloud Load Balancing y se integra a la perfección con él, por lo que es la opción de gestión de seguridad más eficiente para este tutorial.
Para obtener más información sobre IAP, consulta el artículo sobre Identity-Aware Proxy.
Para saber cómo funciona IAP con Cloud Run, consulta la sección de Cloud Run de Cómo funciona IAP.
Nombre de dominio válido
Además, debes tener un nombre de dominio válido para aprovisionar un certificado, que es necesario para configurar el balanceador de carga.
Páginas de tutoriales
Este tutorial tiene las siguientes páginas:
En cada página se da por hecho que ya has completado las instrucciones de las páginas anteriores del tutorial.