Plano de controle gerenciado para clientes contínuos

Este documento é para você se você é um cliente contínuo do Anthos Service Mesh que usa o plano de controle gerenciado ou no cluster. Neste documento, discutimos a implementação do plano de controle e a possível migração dele.

Se você for um cliente contínuo do Traffic Director ou um novo cliente, não precisará ler este documento.

Visão geral do plano de controle

Nas malhas de serviço, o plano de controle fornece gerenciamento de tráfego, gerenciamento de proxy quando o proxy Envoy está em uso e outros recursos de rede.

O Anthos Service Mesh oferecia dois planos de controle: um gerenciado e um no cluster. Somente proxies Envoy são usados como o plano de dados.

Novo plano de controle gerenciado

O novo plano de controle gerenciado é chamado de implementação do Traffic Director (TD). O que o novo plano de controle significa para você?

Uma das mudanças mais significativas do produto Anthos Service Mesh para o Cloud Service Mesh é a mudança para um plano de controle global e multilocatário.

O plano de controle gerenciado usado no Anthos Service Mesh é dedicado a um único cluster. Embora as APIs (CRDs do Istio) usadas para o GKE sejam as mesmas e a configuração do xDS enviada para os arquivos secundários seja compatível sem diferenças comportamentais, as diferenças do plano de controle resultam em algumas características visíveis para você, usuário final.

  • Tempo de resposta da mudança de configuração. Novas implantações de serviço ou alterações nas políticas de serviço demoram um pouco mais com o novo plano de controle.
    • O pipeline de configuração executa uma confirmação de configuração de duas etapas para fins de confiabilidade. A primeira aprovação executa validações para verificar se a configuração está correta. A fase subsequente propaga a configuração globalmente para as implantações de serviço. Para permitir o uso dos serviços do Google Cloud, como balanceamento de carga global entre zonas ou entre regiões, verificação de integridade centralizada, escalonamento automático orientado por tráfego e limitação de taxa gerenciada, a configuração é propagada para esses sistemas e validada de maneira independente para precisão. A configuração também é armazenada internamente de modo a permitir que a engenharia de confiabilidade do site do Google execute operações de produtos de maneira confiável e eficiente durante qualquer emergência de produção.
    • Essas operações oferecem melhor confiabilidade, mas resultam em um push de configuração mais lento que a latência observada pelos usuários atuais do Anthos Service Mesh.
    • A latência de qualquer novo pod para buscar configurações atuais é medida como um pouco melhor com o novo plano de controle. O push de configuração lenta serve para a primeira propagação de qualquer novo serviço criado ou de novas políticas enviadas para o serviço. As latências de propagação de endpoint são funcionalmente semelhantes.
  • Velocidade de escalonamento de eventos e outras alterações nos endpoints. Eles são processados pelo menos tão rapidamente com o novo plano de controle. Esses eventos incluem novos pods iniciados ou interrompidos devido ao escalonamento automático horizontal de pods e pods reiniciados com novos endereços IP porque eles foram movidos para um nó diferente no cluster.
  • Escalonar o número de endpoints. Com o novo plano de controle global, os endpoints da malha são enviados diretamente de cada cluster para o plano de controle de todos os clusters na malha. Essa é uma abordagem mais simples, rápida e escalonável do que o plano de controle gerenciado anterior. No modelo de plano de controle gerenciado (plano de controle dedicado) mais antigo, cada Istiod precisa se comunicar com todos os outros clusters na malha para determinar os endpoints disponíveis em todos os outros clusters. Com o plano de controle global, os endpoints são propagados diretamente para o plano de controle global. Isso resulta em melhor confiabilidade e desempenho em malhas com um grande número de endpoints e permite que as malhas sejam escalonadas para um número maior de endpoints.

Como o novo plano de controle afeta você?

A forma como o novo plano de controle afeta você depende das APIs e do plano de controle usados.

  • Se você for um usuário do Traffic Director, o plano de controle vai continuar o mesmo. Você não precisa ler o restante deste guia. A documentação da implementação do Cloud Service Mesh está em Configurar com APIs do Google Cloud.
  • Se você for um usuário do Anthos Service Mesh, as próximas etapas do plano de controle na implantação atual dependerão do plano de controle gerenciado ou no cluster.
    • Se você usar o plano de controle gerenciado, com algumas exceções, as frotas atuais serão migradas para o novo plano de controle, mencionado no Cloud Service Mesh como plano de controle gerenciado (implementação do Traffic Director, ou TD). Leia a seção a seguir, Migração do plano de controle para malhas e frotas atuais. Se você estiver usando um recurso que não é compatível com a implementação do plano de controle do Traffic Director, você permanecerá temporariamente no plano de controle anterior. Continue lendo este guia.
    • Se você usar o plano de controle no cluster, o plano vai permanecer o mesmo. Você não precisa ler o restante deste guia.
    • Se você não tiver uma organização do Google Cloud e usar o plano de controle gerenciado em um projeto sem organização, receberá o plano de controle do TD.
  • Se você for um cliente do Anthos Service Mesh e estiver criando novas frotas, vai receber a implementação do plano de controle do Traffic Director. Continue lendo este guia.
    • Você vai receber uma notificação sobre a data em que novas frotas receberem o plano de controle do TD.

Migração do plano de controle para malhas e frotas atuais

A partir de 22 de julho de 2024, o Google vai atualizar gradualmente os clusters atuais para usar o plano de controle gerenciado com a implementação do TD. Você vai receber uma notificação antes de atualizarmos suas malhas.

Veja os recursos dos planos de controle do Istiod e do Traffic Director na página que descreve os Recursos compatíveis com as APIs do Istio (plano de controle gerenciado).

Você receberá a notificação de que um cluster está programado para ser atualizado pelo menos duas semanas antes da atualização. As notificações estão disponíveis nas condições de estado do recurso no nível do cluster.

Use o seguinte comando da Google Cloud CLI para verificar a notificação:

gcloud container hub mesh describe --project=[PROJECT_ID]

Você verá resultados parecidos com o seguinte:

membershipStates:
  projects/656460026795/locations/us-central1/memberships/cluster:
    servicemesh:
      conditions:
      - code: MODERNIZATION_SCHEDULED
        details: This cluster has been scheduled for modernization on or after (date ~ at least 2 weeks).
        documentationLink: 
        severity: INFO

Todos os clusters legados do plano de controle gerenciado que foram integrados usando a API meshconfig.googleapis.com serão registrados automaticamente na frota no projeto do cluster com a API Membership gkehub.googleapis.com. Se você tiver alguma automação que cancele o registro de um cluster, será necessário removê-lo antes da migração, caso contrário, a migração terá problemas. Para que o produto gerenciado funcione com êxito, ele precisa ser registrado em uma frota com o recurso de malha ativado.

Entre em contato com o suporte se precisar personalizar a migração ou se tiver dúvidas sobre o uso de recursos sem suporte.

Durante a migração, de maneira segura e controlada, ocorrem as seguintes mudanças:

  • Para ativar a verificação de integridade, o daemonset snk é criado no namespace kube-system do cluster e uma regra de firewall por cluster é criada.
  • Para ativar a ingestão do grupo de endpoints de rede (NEG, na sigla em inglês), a anotação cloud.google.com/neg é adicionada a todos os serviços do Kubernetes.
  • Novos recursos do Google Cloud, como Mesh, Routes, serviços de back-end e verificações de integridade, são criados no cluster.
  • Os pods gerenciados por implantações do Kubernetes são reiniciados para se reconectar ao plano de controle do Traffic Director.

Alguns dos novos recursos têm cotas limitadas. É possível ver cotas e solicitar mais, se necessário.

Plano de controle para novas malhas

A partir de 22 de junho de 2024, todas as frotas em que você provisiona uma nova malha vão receber o plano de controle gerenciado atualizado com a implementação globalmente disponível do Google: o plano de controle do Traffic Director (TD).

Se você integrar uma nova frota ao Cloud Service Mesh gerenciado e ela não estiver em uma organização do Google Cloud ou em uma nova organização do Google Cloud, você receberá o novo plano de controle gerenciado com a implementação do TD a partir da data de lançamento do Cloud Service Mesh.

A seguir

  • Se você for um cliente do Anthos Service Mesh, a documentação estará no índice à esquerda em Configurar malha de serviço com as APIs do Istio.
  • Se você for um cliente contínuo do Traffic Director, a documentação estará em Configurar a malha de serviço com as APIs do Google Cloud.