Nesta página, mostramos como melhorar a latência de inicialização da carga de trabalho usando discos de inicialização secundários no Google Kubernetes Engine (GKE) para pré-carregar dados ou imagens de contêiner em novos nós. Isso permite que as cargas de trabalho realizem uma inicialização a frio rápida e melhorem a utilização geral dos recursos provisionados.
Antes de ler esta página, confira se você conhece o Google Cloud, o Kubernetes, os contêineres, o YAML, o ambiente de execução do containerd e a Google Cloud CLI.
Visão geral
A partir da versão 1.28.3-gke.1067000 do GKE nos clusters padrão e na versão 1.30.1-gke.1329000 do GKE, em clusters do Autopilot do GKE, será possível configurar o pool de nós com uma inicialização secundária. Peça ao GKE para provisionar os nós e pré-carregá-los com dados, como um modelo de machine learning (ML) ou uma imagem de contêiner. Como usar imagens de contêiner ou dados pré-carregados em um disco secundário que tem os seguintes benefícios para as cargas de trabalho:
- Latência reduzida ao extrair imagens de contêiner grandes ou fazer o download de dados
- Escalonamento automático mais rápido
- Recuperação mais rápida de interrupções, como eventos de manutenção e erros do sistema
As seções a seguir descrevem como configurar o disco de inicialização secundário nos clusters do GKE Autopilot e Standard.
Como funcionam os discos de inicialização secundários
Sua carga de trabalho pode começar mais rapidamente usando dados ou imagem de contêiner pré-carregadas em discos de inicialização secundários. Os discos de inicialização secundários têm as seguintes características:
- Os discos de inicialização secundários são Discos permanentes que têm o suporte do armazenamento em blocos distribuído.
- O disco permanente é instanciado a partir de imagens de disco que você cria com antecedência.
- Por motivos de escalonabilidade, cada nó recebe a própria instância Persistent Disk criada a partir da imagem do disco. Essas instâncias de disco persistente são excluídas quando o nó é excluído.
- Se a imagem de disco já estiver em uso na zona, o tempo de criação de todos os discos subsequentes criados com a mesma imagem de disco será menor.
- O tipo de disco de inicialização secundário é igual ao disco de inicialização de nós.
- O tamanho do disco de inicialização secundário é decidido pelo tamanho da imagem do disco.
Adicionar discos de inicialização secundários aos pools de nós normalmente não aumenta o tempo de provisionamento do nó. O GKE provisiona discos de inicialização secundários da imagem do disco em paralelo com o processo de provisionamento de nós.
Para oferecer suporte a imagens de contêiner pré-carregadas, o GKE amplia o ambiente de execução do containerd com plug-ins que leem as imagens de contêiner dos discos de inicialização secundários. As imagens de contêiner são reutilizadas pelas camadas de base.
Pré-carregue grandes camadas de base no disco de inicialização secundário, enquanto as pequenas camadas superiores podem ser extraídas do registro do contêiner.
Antes de começar
Antes de começar, veja se você realizou as seguintes tarefas:
- Ative a API Google Kubernetes Engine. Ativar a API Google Kubernetes Engine
- Se você quiser usar a CLI do Google Cloud para essa tarefa,
instale e, em seguida,
inicialize a
CLI gcloud. Se você instalou a gcloud CLI anteriormente, instale a versão
mais recente executando
gcloud components update
.
Ative a API Container File System.
Requisitos
Os requisitos a seguir se aplicam ao uso do disco de inicialização secundário:
- Seus clusters estão executando a versão do GKE 1.28.3-gke.1067000 no GKE Standard ou a versão 1.30.1-gke.1329000 no Autopilot do GKE.
- Ao modificar a imagem do disco, é preciso criar um novo pool de nós. Não é possível atualizar a imagem do disco em nós atuais.
- Configure o streaming de imagens para usar o recurso de disco de inicialização secundário.
- Usar o Container-Optimized OS com uma imagem de nó do containerd. Os nós do Autopilot usam essa imagem por padrão.
Preparar a imagem de disco com dados prontos durante o tempo de build ou com imagens de contêiner pré-carregadas. Verifique se o cluster tem acesso à imagem do disco para carregar nos nós.
Prática recomendada: Automatize a imagem do disco em um pipeline de CI/CD.
Limitações
Os discos de inicialização secundários têm as seguintes limitações:
- Não é possível atualizar discos de inicialização secundários para nós atuais. Para anexar uma nova imagem de disco, crie um novo pool de nós.
- Não é possível usar discos de inicialização secundários para pré-carregar dados em clusters do GKE Autopilot.
Preços
Ao criar pools de nós com discos de inicialização secundários, o GKE anexa um Persistent Disk a cada nó dentro do pool de nós. Os discos persistentes são cobrados com base nos preços de disco do Compute Engine.
Preparar a imagem do disco de inicialização secundário
Para preparar a imagem do disco de inicialização secundário, escolha a guia Imagens para pré-carregar imagens de contêiner ou a guia Dados para pré-carregar dados e siga estas instruções:
Imagens
O GKE tem uma ferramenta chamada
gke-disk-image-builder
para criar uma máquina virtual (VM), extrair as imagens de contêiner em um disco e criar uma imagem
desse disco.
Para criar uma imagem de disco com várias imagens de contêiner pré-carregadas, siga as seguintes etapas:
- Crie um bucket do Cloud Storage
para armazenar os registros de execução de
gke-disk-image-builder
. - Crie uma imagem de disco com
gke-disk-image-builder
.
go run ./cli \
--project-name=PROJECT_ID \
--image-name=DISK_IMAGE_NAME \
--zone=LOCATION \
--gcs-path=gs://LOG_BUCKET_NAME \
--disk-size-gb=10 \
--container-image=docker.io/library/python:latest \
--container-image=docker.io/library/nginx:latest
Substitua:
- PROJECT_ID: o nome do seu Google Cloud projeto.
- DISK_IMAGE_NAME: o nome da imagem do disco. Por exemplo,
nginx-python-image
. - LOCATION: o local do cluster.
- LOG_BUCKET_NAME: o nome do bucket do Cloud Storage
para armazenar os registros de execução. Por exemplo,
gke-secondary-disk-image-logs/
.
Quando você cria uma imagem de disco com
gke-disk-image-builder
,
o Google Cloud cria vários recursos para concluir o processo (por
exemplo, uma instância de VM, um disco temporário e um disco permanente). Após a execução, o
criador de imagens limpa todos os recursos, exceto a imagem do disco que você
criou.
Dados
Crie uma imagem de disco personalizada como a fonte de dados ao realizar as seguintes etapas:
Configurar o disco de inicialização secundário
É possível configurar o disco de inicialização secundário em um cluster do GKE Autopilot ou Standard.
Use um cluster do Autopilot para ter uma experiência totalmente gerenciada do Kubernetes. Para escolher o modo de operação do GKE mais adequado para suas cargas de trabalho, consulte Escolher um modo de operação do GKE.
Usar o Autopilot do GKE
Nesta seção, você vai criar uma lista de permissões de imagens de disco para permitir a imagem de disco em um cluster do GKE Autopilot. Em seguida, você vai modificar o seletor de nós do pod para usar um disco de inicialização secundário.
Permitir as imagens de disco no projeto
Nesta seção, você vai criar um GCPResourceAllowlist
para permitir que o GKE
crie nós com discos de inicialização secundários usando imagens de disco no seu
Google Cloud projeto.
Salve o seguinte manifesto como
allowlist-disk.yaml
:apiVersion: "node.gke.io/v1" kind: GCPResourceAllowlist metadata: name: gke-secondary-boot-disk-allowlist spec: allowedResourcePatterns: - "projects/PROJECT_ID/global/images/.*"
Substitua o PROJECT_ID pelo ID do projeto para hospedar a imagem do disco.
Aplique o manifesto:
kubectl apply -f allowlist-disk.yaml
O GKE cria nós com discos de inicialização secundários de todas as imagens de disco do projeto.
Atualizar o seletor de nós do pod para usar um disco de inicialização secundário
Nesta seção, você modifica a especificação do pod para que o GKE crie os nós com o disco de inicialização secundário.
Adicione um
nodeSelector
ao seu modelo de pod:nodeSelector: cloud.google.com.node-restriction.kubernetes.io/gke-secondary-boot-disk-DISK_IMAGE_NAME:CONTAINER_IMAGE_CACHE.PROJECT_ID
Substitua:
- DISK_IMAGE_NAME: o nome da imagem do disco.
- PROJECT_ID: o ID do projeto para hospedar a imagem do disco.
Use o comando
kubectl apply
para aplicar a especificação do Kubernetes com o modelo do pod.Confirme se o cache do disco de inicialização secundário está em uso:
kubectl get events --all-namespaces
O resultado será assim:
75s Normal SecondaryDiskCachin node/gke-pd-cache-demo-default-pool-75e78709-zjfm Image gcr.io/k8s-staging-jobsejt/pytorch-mnist:latest is backed by secondary disk cache
Verifique a latência de extração da imagem:
kubectl describe pod POD_NAME
Substitua POD_NAME pelo nome do pod.
A saída será assim:
… Normal Pulled 15m kubelet Successfully pulled image "docker.io/library/nginx:latest" in 0.879149587s …
A latência esperada de extração da imagem do contêiner em cache deve ser significativamente reduzida, independentemente do tamanho da imagem.
Usar o GKE Standard
Para criar um cluster do GKE Standard e um pool de nós, siga as instruções a seguir, escolhendo a guia Imagens ou Dados caso você queira pré-carregar imagens de contêiner ou pré-carregar dados no disco de inicialização secundário:
Imagens
Para configurar um disco de inicialização secundário, use a Google Cloud CLI ou o Terraform:
gcloud
Crie um cluster do GKE Standard com o streaming de imagens ativado:
gcloud container clusters create CLUSTER_NAME \ --location=LOCATION \ --cluster-version=VERSION \ --enable-image-streaming
Substitua:
- CLUSTER_NAME: o nome do cluster.
- LOCATION: o local do cluster.
- VERSION: a versão do GKE a ser usada. A versão precisa ser
1.28.3-gke.1067000
ou posterior.
Crie um pool de nós com um disco de inicialização secundário no mesmo projeto:
gcloud container node-pools create NODE_POOL_NAME \ --cluster=CLUSTER_NAME \ --location LOCATION \ --enable-image-streaming \ --secondary-boot-disk=disk-image=global/images/DISK_IMAGE_NAME,mode=CONTAINER_IMAGE_CACHE
Substitua:
- NODE_POOL_NAME: o nome do pool de nós.
- CLUSTER_NAME: o nome do cluster existente.
- LOCATION: as zonas do Compute separadas por vírgula do cluster.
- DISK_IMAGE_NAME: o nome da imagem do disco.
Para criar um pool de nós com um disco de inicialização secundário usando a imagem do disco em um projeto diferente, siga as etapas em Usar um disco de inicialização secundário em um projeto diferente.
Adicione um
nodeSelector
ao seu modelo de pod:nodeSelector: cloud.google.com/gke-nodepool: NODE_POOL_NAME
Confirme se o cache do disco de inicialização secundário está em uso:
kubectl get events --all-namespaces
O resultado será assim:
75s Normal SecondaryDiskCachin node/gke-pd-cache-demo-default-pool-75e78709-zjfm Image gcr.io/k8s-staging-jobsejt/pytorch-mnist:latest is backed by secondary disk cache
Verifique a latência de extração de imagem executando o seguinte comando:
kubectl describe pod POD_NAME
Substitua
POD_NAME
pelo nome do pod.A saída será assim:
… Normal Pulled 15m kubelet Successfully pulled image "docker.io/library/nginx:latest" in 0.879149587s …
A latência de extração esperada da imagem do contêiner em cache não deve ser maior do que alguns segundos, independentemente do tamanho da imagem.
Terraform
Para criar um cluster com o pool de nós padrão usando o Terraform, consulte o exemplo a seguir:
Crie um pool de nós com um disco de inicialização secundário no mesmo projeto:
Para saber mais como usar o Terraform, consulte o Suporte do Terraform para GKE.
Adicione um
nodeSelector
ao seu modelo de pod:nodeSelector: cloud.google.com/gke-nodepool: NODE_POOL_NAME
Confirme se o cache do disco de inicialização secundário está em uso:
kubectl get events --all-namespaces
O resultado será assim:
75s Normal SecondaryDiskCachin node/gke-pd-cache-demo-default-pool-75e78709-zjfm Image gcr.io/k8s-staging-jobsejt/pytorch-mnist:latest is backed by secondary disk cache
Verifique a latência de extração de imagem executando o seguinte comando:
kubectl describe pod POD_NAME
Substitua POD_NAME pelo nome do pod.
A saída será assim:
… Normal Pulled 15m kubelet Successfully pulled image "docker.io/library/nginx:latest" in 0.879149587s …
A latência de extração esperada da imagem do contêiner em cache não deve ser maior do que alguns segundos, independentemente do tamanho da imagem.
Para saber mais como usar o Terraform, consulte o Suporte do Terraform para GKE.
Dados
É possível configurar um disco de inicialização secundário e pré-carregar dados usando a CLI do Google Cloud ou o Terraform:
gcloud
Crie um cluster do GKE Standard com o streaming de imagens ativado:
gcloud container clusters create CLUSTER_NAME \ --location=LOCATION \ --cluster-version=VERSION \ --enable-image-streaming
Substitua:
- CLUSTER_NAME: o nome do cluster.
- LOCATION: o local do cluster.
- VERSION: a versão do GKE a ser usada. A versão do GKE precisa ser a 1.28.3-gke.1067000 ou posterior.
Crie um pool de nós com um disco de inicialização secundário usando a sinalização
--secondary-boot-disk
:gcloud container node-pools create NODE_POOL_NAME \ --cluster=CLUSTER_NAME \ --location LOCATION \ --enable-image-streaming \ --secondary-boot-disk=disk-image=global/images/DISK_IMAGE_NAME
Substitua:
- NODE_POOL_NAME: o nome do pool de nós.
- CLUSTER_NAME: o nome do cluster existente.
- LOCATION: as zonas do Compute separadas por vírgula do cluster.
- DISK_IMAGE_NAME: o nome da imagem do disco.
Para criar um pool de nós com um disco de inicialização secundário usando a imagem do disco em um projeto diferente, siga as etapas em Usar um disco de inicialização secundário em um projeto diferente.
O GKE cria um pool de nós em que cada nó tem um disco secundário com dados pré-carregados. O GKE anexa e monta o disco de inicialização secundário no nó.
Para acessar os dados, monte a imagem do disco de inicialização secundário nos contêineres do pod usando uma montagem de volume hostPath. Defina
/usr/local/data_path_sbd
como o caminho no contêiner em que você quer que os dados fiquem:apiVersion: v1 kind: Pod metadata: name: pod-name spec: containers: ... volumeMounts: - mountPath: /usr/local/data_path_sbd name: data-path-sbd ... volumes: - name: data-path-sbd hostPath: path: /mnt/disks/gke-secondary-disks/gke-DISK_IMAGE_NAME-disk
Substitua DISK_IMAGE_NAME pelo nome da imagem do disco.
Terraform
Para criar um cluster com o pool de nós padrão usando o Terraform, consulte o exemplo a seguir:
Crie um pool de nós com um disco de inicialização secundário no mesmo projeto:
Para saber mais como usar o Terraform, consulte o Suporte do Terraform para GKE.
Para acessar os dados, monte a imagem do disco de inicialização secundário nos contêineres do pod usando uma montagem de volume hostPath. Defina
/usr/local/data_path_sbd
como o caminho no contêiner em que você quer que os dados fiquem:apiVersion: v1 kind: Pod metadata: name: pod-name spec: containers: ... volumeMounts: - mountPath: /usr/local/data_path_sbd name: data-path-sbd ... volumes: - name: data-path-sbd hostPath: path: /mnt/disks/gke-secondary-disks/gke-DISK_IMAGE_NAME-disk
Substitua DISK_IMAGE_NAME pelo nome da imagem do disco.
Escalonamento automático de clusters com discos secundários de inicialização
Para criar um pool de nós e configurar o escalonamento automático de clusters em um disco de inicialização secundário, use a Google Cloud CLI:
gcloud container node-pools create NODE_POOL_NAME \
--cluster=CLUSTER_NAME \
--location LOCATION \
--enable-image-streaming \
--secondary-boot-disk=disk-image=global/images/DISK_IMAGE_NAME,mode=CONTAINER_IMAGE_CACHE \
--enable-autoscaling \
--num-nodes NUM_NODES \
--min-nodes MIN_NODES \
--max-nodes MAX_NODES
Substitua:
- NODE_POOL_NAME: o nome do pool de nós.
- CLUSTER_NAME: o nome do cluster existente.
- LOCATION: as zonas do Compute separadas por vírgula do cluster.
- DISK_IMAGE_NAME: o nome da imagem do disco.
- MIN_NODES: o número mínimo de nós a
ser escalonado automaticamente para o pool de nós especificado por zona. Para especificar o
número mínimo de nós para todo o pool de nós no GKE
versões 1.24 e posteriores, use
--total-min-nodes
. As sinalizações--total-min-nodes
e--total-max-nodes
são mutuamente exclusivas com as sinalizações--min-nodes
e--max-nodes
. - MAX_NODES: o número máximo de nós a
ser escalonado automaticamente para o pool de nós especificado por zona. Para especificar o
número máximo de nós para todo o pool de nós no GKE
versões 1.24 e posteriores, use
--total-max-nodes
. As sinalizações--total-min-nodes
e--total-max-nodes
são mutuamente exclusivas com as sinalizações--min-nodes
e--max-nodes
.
Provisionamento automático de nós com discos de inicialização secundários
No GKE 1.30.1-gke.1329000 e versões posteriores, configure o provisionamento automático de nós para criar e excluir automaticamente pools de nós para atender às demandas de recursos das suas cargas de trabalho.
Criar um recurso personalizado da lista de permissões de imagens de disco para o disco de inicialização secundário para provisionamento automático de nós do GKE semelhante ao mostrado a seguir:
apiVersion: "node.gke.io/v1" kind: GCPResourceAllowlist metadata: name: gke-secondary-boot-disk-allowlist spec: allowedResourcePatterns: - "projects/<PROJECT_ID>/global/images/.*"
Substitua o PROJECT_ID pelo ID do projeto para hospedar a imagem do disco.
Implante o recurso personalizado da lista de permissões no cluster e execute o seguinte comando:
kubectl apply -f ALLOWLIST_FILE
Substitua ALLOWLIST_FILE pelo nome do arquivo do manifesto.
Atualizar o seletor de nós do pod para usar um disco de inicialização secundário
nodeSelector: cloud.google.com.node-restriction.kubernetes.io/gke-secondary-boot-disk-DISK_IMAGE_NAME:CONTAINER_IMAGE_CACHE.PROJECT_ID
Substitua:
- DISK_IMAGE_NAME: o nome da imagem do disco.
- PROJECT_ID: o ID do projeto para hospedar a imagem do disco.
Usar um disco de inicialização secundário em um projeto diferente
Ao criar um pool de nós com um disco de inicialização secundário, é possível dizer ao GKE para usar a imagem do disco em um
um projeto diferente usando a flag --secondary-boot-disk
.
Criar um pool de nós com um disco de inicialização secundário a partir da imagem do disco em um projeto diferente usando a flag
--secondary-boot-disk
. Exemplo:gcloud beta container node-pools create NODE_POOL_NAME \ --cluster=CLUSTER_NAME \ --location LOCATION \ --enable-image-streaming \ --secondary-boot-disk=disk-image=projects/IMAGE_PROJECT_ID/global/images/DISK_IMAGE_NAME,mode=CONTAINER_IMAGE_CACHE
Substitua:
- DISK_IMAGE_NAME: o nome da imagem do disco.
- IMAGE_PROJECT_ID: o nome do projeto ao qual a imagem de disco pertence.
O GKE cria um pool de nós em que cada nó tem um disco secundário com dados pré-carregados. O GKE anexa e monta o disco de inicialização secundário no nó.
Conceda acesso a imagens de disco pertencentes a um projeto diferente adicionando "Usuário de imagens do Compute" para as contas de serviço do cluster:
- Conta de serviço padrão do Compute: CLUSTER_PROJECT_NUMBER@cloudservices.gserviceaccount.com
- Conta de serviço do GKE: service-CLUSTER_PROJECT_NUMBER@container-engine-robot.iam.gserviceaccount.com
gcloud projects add-iam-policy-binding IMAGE_PROJECT_ID \ --member serviceAccount:CLUSTER_PROJECT_NUMBER@cloudservices.gserviceaccount.com \ --role roles/compute.imageUser gcloud projects add-iam-policy-binding IMAGE_PROJECT_ID \ --member serviceAccount:service-CLUSTER_PROJECT_NUMBER@container-engine-robot.iam.gserviceaccount.com \ --role roles/compute.imageUser
A seguir
- Use Usar streaming de imagens para extrair imagens de contêiner para extrair imagens de contêiner transmitindo os dados da imagem conforme suas cargas de trabalho precisarem.
- Consulte Melhorar a eficiência da carga de trabalho usando o NCCL Fast Socket para saber como usar o plug-in Fast Socket da Biblioteca NVIDIA Collective Communication (NCCL).