Proteja uma app de IA generativa através da IAP

Este tutorial mostra como implementar uma app de IA generativa no Cloud Run e protegê-la com o Identity-Aware Proxy (IAP). O IAP fornece uma camada de autorização central para aplicações HTTPS implementadas no Cloud Run. Pode usar o IAP para adotar políticas de controlo de acesso ao nível da aplicação ou da organização em vez de usar firewalls ao nível da rede.

Tenha em atenção que, embora também seja possível usar a autenticação manual ou de terceiros para proteger uma app implementada no Cloud Run, recomendamos que use o IAP para grandes volumes ou tráfego em várias regiões, para evitar interrupções na publicação da app.

Neste tutorial, implementa uma app que faz chamadas para a API Gemini. A app baseia-se na framework Streamlit.

Pré-requisitos

Este tutorial pressupõe que consegue usar as seguintes ferramentas e frameworks:

  • Streamlit: o Streamlit é uma framework de apps de código aberto que lhe permite criar e implementar aplicações de dados. Transforma scripts de dados em apps Web através do Python.

  • Git: para este tutorial, usa um repositório Git para gerir o código fonte da sua app. Para mais informações sobre a utilização do Git, consulte a documentação do Git.

Google Cloud serviços

Tem de ter uma compreensão básica dos seguintes Google Cloud serviços:

  • IA generativa no Vertex AI: oferece acesso aos MDIs/CE da Google para que os possa testar, otimizar e implementar para utilização nas suas aplicações. Saiba mais sobre a IA generativa na Vertex AI.

  • Cloud Run: uma plataforma de computação gerida que lhe permite implementar e executar imagens de contentores. Cria um serviço do Cloud Run para implementar a sua app. Saiba mais sobre o Cloud Run.

  • Cloud Build: executa as suas compilações no Google Cloud. Para este tutorial, configura um acionador do Cloud Build automático para compilar e implementar a sua app no Cloud Run sempre que envia as suas confirmações para o repositório Git. Saiba mais sobre o Cloud Build.

  • Cloud Load Balancing: ajuda a distribuir o tráfego por várias instâncias da sua app para alcançar a escalabilidade. Cria um balanceador de carga de aplicações para distribuir o tráfego para as instâncias de back-end da app alojadas no Cloud Run. O Cloud Load Balancing também é um pré-requisito para o IAP. Saiba mais sobre o Cloud Load Balancing.

  • Identity-Aware Proxy (IAP): usa o IAP para criar uma camada de autorização central para proteger a app. O IAP faz verificações de autenticação e autorização que se estendem aos serviços Google Cloud associados. O IAP também suporta e integra-se perfeitamente com o Cloud Load Balancing, o que o torna a opção de gestão de segurança mais eficiente para este tutorial.

    Para saber mais sobre o IAP, consulte a vista geral do Identity-Aware Proxy.

    Para compreender como o IAP funciona com o Cloud Run, consulte a secção do Cloud Run de Como funciona o IAP.

Nome de domínio válido

Além disso, tem de ter um nome de domínio válido para o aprovisionamento de um certificado, que é necessário para configurar o equilibrador de carga.

Páginas de tutoriais

Este tutorial tem as seguintes páginas:

  1. Configure o seu projeto e repositório de origem.

  2. Crie um serviço do Cloud Run.

  3. Crie um balanceador de carga.

  4. Configure o Identity-Aware Proxy (IAP).

  5. Teste a app protegida por CAsI.

  6. Limpe o projeto.

Cada página pressupõe que já concluiu as instruções das páginas anteriores do tutorial.