Saiba como especificar o número de CPUs a serem alocadas para cada instância de contêiner do Knative serving. Por padrão, O Knative serving não especifica um número mínimo ou máximo de e CPUs. Em vez disso, seus serviços são limitados pela quantidade de recursos disponíveis. Saiba mais sobre os recursos da CPU no contrato de ambiente de execução do contêiner.
Como configurar e atualizar a alocação de CPU
Qualquer mudança na configuração leva à criação de uma nova revisão. As próximas revisões também recebem automaticamente essa configuração, a menos que você faça atualizações explícitas para alterá-la.
É possível definir a alocação de CPU usando o console do Google Cloud, a Google Cloud CLI ou um arquivo YAML ao implantar um novo serviço ou atualizar um que já existe e implantar uma revisão:
Console
Acesse o Knative serving no console do Google Cloud:
Clique em Criar serviço se estiver configurando um novo serviço em que fará uma implantação. Se você estiver configurando um serviço atual, clique nele e em Editar e implantar uma nova revisão.
Em Configurações avançadas, clique em Contêiner.
Selecione a alocação de CPU que você quer na lista suspensa. É possível selecionar números em Unidades de CPU do Kubernetes. Por exemplo, especifique
1
para uma CPU,400m
para 0,4 CPU e assim por diante.Clique em Avançar para acessar a próxima seção.
Na seção Configurar como este serviço é acionado, selecione qual conectividade você quer usar para invocar o serviço.
Clique em Criar para implantar a imagem no Knative serving e aguarde até que a implantação seja concluída.
Linha de comando
Para serviços existentes, defina o número de CPUs a serem alocadas executando o comando
gcloud run services update
com o parâmetro--cpu
:gcloud run services update SERVICE --cpu CPU
Substitua:
- SERVICE pelo nome do serviço;
- CPU pela alocação de CPU que você quer. Especifique
um valor em
Unidades de CPU do Kubernetes.
Por exemplo, especifique
1
para uma CPU,400m
para 0,4 CPU e assim por diante.
Para novos serviços, defina o número de CPUs a serem alocadas executando o comando
gcloud run deploy
com o parâmetro--cpu
:gcloud run deploy SERVICE --image=IMAGE_URL --cpu CPU
Substitua:
- SERVICE pelo nome do serviço;
- IMAGE_URL por uma referência à imagem de contêiner. Por
exemplo,
gcr.io/cloudrun/hello
; - CPU pela alocação de CPU que você quer. Especifique
um valor em
Unidades de CPU do Kubernetes.
Por exemplo, especifique
1
para uma CPU,400m
para 0,4 CPU e assim por diante.
YAML
Faça o download da configuração de um serviço existente para um
arquivo YAML com o comando gcloud run services describe
usando a
sinalização --format=export
.
Em seguida, modifique o arquivo YAML e implante
essas alterações com o comando gcloud run services replace
.
Modifique apenas os atributos especificados.
Faça o download da configuração do serviço em um arquivo chamado
service.yaml
no espaço de trabalho local:gcloud run services describe SERVICE --format export > service.yaml
Substitua SERVICE pelo nome do seu serviço Knative serving.
No seu arquivo local, atualize o atributo
cpu
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: spec: containers: - image: IMAGE resources: limits: cpu: CPU
Substituir
- SERVICE pelo nome do serviço do Knative serving
- IMAGE pelo URL da imagem de contêiner.
- CPU pelo valor de CPU que você usará.
Especifique um valor em
Unidades de CPU do Kubernetes.
Por exemplo, especifique
1
para uma CPU,400m
para 0,4 CPU e assim por diante.
Substitua o serviço pela nova configuração usando o seguinte comando:
gcloud run services replace service.yaml