Configurar serviços do Cloud Run

Nesta página, você encontra uma visão geral das opções de configuração para serviços do Cloud Run.

Evitar inicializações a frio e reduzir a latência

É possível evitar a inicialização a frio do aplicativo e reduzir a latência dele definindo um número mínimo de instâncias. Observe que definir um número mínimo de instâncias gera custos. Saiba mais em Definir instâncias mínimas para serviços.

Capacidade

É possível controlar a quantidade de memória, CPU e concorrência máxima que um serviço pode usar.

Use as configurações de faturamento para controlar como você recebe cobranças, seja por solicitação e somente quando a instância processa uma solicitação, ou durante todo o ciclo de vida da instância.

Variáveis de ambiente

É possível criar pares de chave-valor para usar com seu serviço do Cloud Run. Consulte Configurar variáveis de ambiente para serviços para saber mais.

Ambiente de execução

O Cloud Run tem dois ambientes de execução. Saiba mais sobre as diferenças entre os dois ambientes de execução.

GPU

Se você precisar hospedar cargas de trabalho de IA, como modelos de inferência e treinamento de modelo, configure serviços do Cloud Run com ou sem GPU.

Proteger contra altos níveis de solicitação

É possível controlar quantas instâncias o serviço do Cloud Run cria para atender a solicitações definindo instâncias máximas e instâncias mínimas. Isso pode ajudar a restringir custos e proteger contra níveis de solicitação anormalmente altos.

Verificações de integridade

O Cloud Run permite configurar dois tipos de sondagens de verificação de integridade. Uma das sondagens determina quando os contêineres estão prontos para aceitar o tráfego, e a outra determina se é necessário reiniciar o contêiner. Saiba mais sobre as verificações de integridade do contêiner.

Rótulos

Os rótulos do Cloud Run são pares de chave-valor que podem ser aplicados a serviços, revisões e funções do Cloud Run. Os rótulos ajudam a organizar os recursos do Cloud Run e gerenciar custos em escala com a granularidade necessária.

Os rótulos definidos anteriormente para as funções do Cloud Run usando comandos gcloud functions ou a API Cloud Functions v2 são propagados para o Cloud Run quando você implanta as funções no Cloud Run.

Escalonamento

Por padrão, o Cloud Run faz o escalonamento horizontal automático para um número máximo especificado ou padrão de instâncias, dependendo do tráfego e da utilização da CPU. No entanto, em alguns casos de uso, talvez seja necessário definir um número específico de instâncias usando o escalonamento manual.

Secrets

Use o Secret Manager com o Cloud Run para armazenar chaves de API, senhas e outras informações sensíveis com segurança. Consulte Configurar secrets para saber mais.

Identidade do serviço

A identidade do serviço do Cloud Run é a conta de serviço usada como a conta autenticada para acessar APIsGoogle Cloud do contêiner da instância do Cloud Run. Recomendamos que você crie uma conta de serviço e determine o conjunto mínimo de permissões que ela precisa para acessar recursos específicos do Google Cloud.

Tempo limite

É possível definir um tempo limite de solicitação do Cloud Run que especifica o tempo em que uma resposta precisa ser retornada.

Recomendações

Consulte Otimizar com o Recommender para saber mais sobre as otimizações fornecidas pelo Recommender no Cloud Run.

Divisão de tráfego

Toda vez que você implanta ou reimplanta um serviço, uma nova revisão do serviço subjacente do Cloud Run é criada automaticamente. Consulte Afinidade da sessão e divisão de tráfego para mais detalhes.

Serviços de tag

Tags são pares de chave-valor que podem ser aplicados aos recursos para controle de acesso detalhado usando o console do Cloud Run.

Os administradores de tags criam tags para recursos no Google Cloud no nível da organização ou do projeto. As tags fornecem uma maneira de permitir ou negar políticas condicionalmente se um recurso tiver uma tag específica. Para saber mais, consulte Serviços de tag.

Montagens de volumes

Com as montagens de volume do Cloud Run, é possível acessar dados compartilhados armazenados em um sistema de arquivos local, como um bucket de armazenamento ou conteúdo de um servidor de arquivos, do seu contêiner. É possível ativar um bucket do Cloud Storage, um compartilhamento NFS, como uma instância do Filestore, ou um sistema de arquivos na memória fornecido pelo Cloud Run.