Cloud Composer 1 | Cloud Composer 2 | Cloud Composer 3
Esta página descreve como configurar ambientes do Cloud Composer altamente resilientes.
Sobre a resiliência para falhas zonais no Cloud Composer
Ambientes do Cloud Composer altamente resilientes usam redundância integrada e mecanismos de failover que reduzem a suscetibilidade do ambiente a falhas de zona e interrupções de ponto único de falha.
Por exemplo, uma interrupção de zona interrompe tarefas do Airflow que são executadas em um zona. Depois, um ambiente altamente resiliente se recupera, reinicia os componentes afetados em uma zona diferente e muda o banco de dados para uma zona secundária. Assim, as tarefas com falhas do Airflow podem ser reprogramadas e reiniciados pelo Airflow, preservando ao mesmo tempo o histórico de execuções de DAG e outras configurações.
Um ambiente altamente resiliente é executado em pelo menos duas zonas de uma região selecionada. Cloud Composer distribui automaticamente os componentes da sua entre as zonas.
É possível usar ambientes do Cloud Composer altamente resilientes para e processos empresariais críticos.
Sobre o banco de dados altamente disponível do seu ambiente
Em ambientes altamente disponíveis do Cloud Composer, o que armazena o banco de dados do ambiente é executado no modo de alta disponibilidade. Uma instância do Cloud SQL configurada para alta disponibilidade também é chamada de instância regional e está localizado em uma zona primária e secundária dentro da região configurada. Em uma instância regional, a configuração é composta por uma instância principal e uma instância em espera.
Em caso de falha temporária, a instância do Cloud SQL do seu ambiente realiza o failover automático do banco de dados para a instância do Cloud SQL em espera. Não é necessário realizar outras ações no seu ambiente do Cloud Composer. Depois que a zona principal estiver em funcionamento o ambiente volta a ter duas zonas (principal e secundário). As zonas primária e secundária podem ser trocadas em alguns casos. A instância do Cloud SQL no modo de alta disponibilidade usa o mesmo endereço IP após um failover.
Sobre os componentes altamente disponíveis do Airflow
Ambientes altamente disponíveis do Cloud Composer executam o Airflow componentes distribuídos entre zonas.
Seu ambiente sempre executa exatamente dois programadores do Airflow, dois servidores da Web e pelo menos dois (mas não mais de dez) acionadores, se eles estiverem ativados. Esses pares de componentes são executados em zonas separadas. O número mínimo de workers é definido como dois, e o cluster do ambiente distribui instâncias de workers entre as zonas. Em caso de interrupção de serviço zonal, as instâncias dos workers afetadas serão reprogramadas em uma zona diferente.
Para mais informações sobre a arquitetura de ambientes altamente resilientes, consulte Arquitetura de ambiente altamente resiliente.
Antes de começar
Há ambientes altamente resilientes disponíveis apenas em ambientes de IP privado.
Ambientes altamente resilientes são oferecidos por uma cobrança incremental quando comparado a em ambientes regulares.
Ambientes altamente resilientes estão disponíveis no Cloud Composer versão 2.2.0 e mais recentes.
Se você quiser atualizar um ambiente padrão para um altamente resiliente, verifique se ele atende aos requisitos de configuração a seguir. Se o ambiente não atender a esses requisitos, você poderá atualizar os parâmetros de escala e desempenho.
- O número mínimo de workers do Airflow é dois ou mais.
- O número de programadores do Airflow é exatamente 2.
- Se você usar operadores adiáveis nos DAGs, e, em seguida, pelo menos dois acionadores.
Criar um ambiente altamente resiliente
Para criar um ambiente altamente resiliente, ative o modo de alta resiliência ao criar um ambiente.
Atualizar um ambiente padrão para o modo de alta resiliência
Console
No console do Google Cloud, acesse a página Ambientes.
Na lista de ambientes, clique no nome do seu ambiente. A página Detalhes do ambiente é aberta.
Selecione a guia Configuração do ambiente.
Na seção Resilience mode, clique em Edit.
Selecione Alta resiliência e clique em Salvar.
gcloud
gcloud composer environments update ENVIRONMENT_NAME \
--location LOCATION \
--enable-high-resilience
Substitua:
ENVIRONMENT_NAME
: o nome do ambiente;LOCATION
: a região em que o ambiente está localizado.
API
Crie uma solicitação de API
environments.patch
.Nesta solicitação:
No parâmetro
updateMask
, especifique a máscaraconfig.resilienceMode
.No corpo da solicitação, especifique
HIGH_RESILIENCE
para alternar para a modo de resiliência.
Exemplo:
// PATCH https://composer.googleapis.com/v1/projects/example-project/
// locations/us-central1/environments/example-environment?updateMask=
// config.resilienceMode
{
"config": {
"resilience_mode": { "HIGH_RESILIENCE" }
}
}
Terraform
O campo resilience_mode
no bloco config
especifica o modo de resiliência. Para usar o modo de alta resiliência, defina esse valor como HIGH_RESILIENCE
.
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
resilience_mode = "HIGH_RESILIENCE"
}
}
Substitua:
ENVIRONMENT_NAME
: o nome do ambiente;LOCATION
: a região em que o ambiente está localizado.
Exemplo:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
resilience_mode = "HIGH_RESILIENCE"
}
Mudar um ambiente altamente resiliente para o modo de resiliência padrão
É possível mudar o ambiente para o modo de resiliência padrão a qualquer momento. Essa operação:
- Reduz o número de servidores da Web no seu ambiente para 1.
- Desativa o modo de alta disponibilidade do no banco de dados do Airflow do ambiente.
Não muda as configurações do número mínimo de workers, programadores ou acionadores do Airflow.
Console
No console do Google Cloud, acesse a página Ambientes.
Na lista de ambientes, clique no nome do ambiente. A página Detalhes do ambiente é aberta.
Selecione a guia Configuração do ambiente.
Na seção Modo de resiliência, clique em Editar.
Selecione Resiliência padrão (padrão) e clique em Salvar.
gcloud
gcloud composer environments update ENVIRONMENT_NAME \
--location LOCATION \
--disable-high-resilience
Substitua:
ENVIRONMENT_NAME
: o nome do ambiente do Cloud ComposerLOCATION
: a região em que o ambiente está localizado.
API
Crie uma solicitação de API
environments.patch
.Nesta solicitação:
No parâmetro
updateMask
, especifique a máscaraconfig.resilienceMode
.No corpo da solicitação, especifique
RESILIENCE_MODE_UNSPECIFIED
para mudar para o modo de resiliência padrão.
Exemplo:
// PATCH https://composer.googleapis.com/v1/projects/example-project/
// locations/us-central1/environments/example-environment?updateMask=
// config.resilienceMode
{
"config": {
"resilience_mode": { "RESILIENCE_MODE_UNSPECIFIED" }
}
}
Terraform
O campo resilience_mode
no bloco config
especifica a resiliência
modo Para usar o modo de resiliência padrão, defina esse valor como
STANDARD_RESILIENCE
:
resource "google_composer_environment" "example" {
provider = google-beta
name = "ENVIRONMENT_NAME"
region = "LOCATION"
config {
resilience_mode = "STANDARD_RESILIENCE"
}
}
Substitua:
ENVIRONMENT_NAME
: o nome do ambiente;LOCATION
: a região em que o ambiente está localizado.
Exemplo:
resource "google_composer_environment" "example" {
provider = google-beta
name = "example-environment"
region = "us-central1"
config {
resilience_mode = "STANDARD_RESILIENCE"
}
Verificar se o ambiente é executado no modo de alta resiliência
Console
No console do Google Cloud, acesse a página Ambientes.
Na lista de ambientes, clique no nome do ambiente. A página Detalhes do ambiente é aberta.
Selecione a guia Configuração do ambiente.
Na seção Modo de resiliência, confira o modo de resiliência do seu de nuvem.
gcloud
Para verificar se o modo de alta resiliência está ativado no seu ambiente, execute o
comando da CLI do Google Cloud a seguir. O valor de True
significa que alta
o modo de resiliência está ativado no seu ambiente.
gcloud composer environments describe ENVIRONMENT_NAME \
--location LOCATION \
--format="value(config.resilienceMode)"
Substitua:
ENVIRONMENT_NAME
: o nome do ambiente do Cloud ComposerLOCATION
: a região em que o ambiente está localizado.
A seguir
- Realize testes de failover para seu ambiente altamente resiliente.
- Recuperação de desastres com snapshots de ambienteh