Cloud Composer 1 | Cloud Composer 2 | Cloud Composer 3
O VPC Service Controls permite que as organizações definam um perímetro em torno dos recursos do Google Cloud para reduzir os riscos de exfiltração de dados.
Os ambientes do Cloud Composer podem ser implantados dentro de um perímetro de serviço. Ao configurar seu ambiente com o VPC Service Controls, é possível manter os dados confidenciais em sigilo enquanto aproveita os recursos de orquestração de fluxo de trabalho totalmente gerenciados do Cloud Composer.
A compatibilidade do VPC Service Controls com o Cloud Composer significa que:
- O Cloud Composer agora pode ser selecionado como um serviço seguro dentro de um perímetro do VPC Service Controls.
- Todos os recursos subjacentes usados pelo Cloud Composer estão configurados para serem compatíveis com a arquitetura do VPC Service Controls e seguem as regras dela.
A implantação dos ambientes do Cloud Composer com o VPC Service Controls oferece:
- Risco reduzido de exfiltração de dados.
- Proteção contra exposição de dados devido a controles de acesso configurados incorretamente.
- Risco reduzido de usuários mal-intencionados copiando dados para recursos não autorizados do Google Cloud ou invasores externos acessando recursos do Google Cloud pela Internet.
Servidor da Web do Airflow no modo VPC Service Controls
No modo VPC Service Controls, o Cloud Composer executa duas instâncias do servidor da Web do Airflow. A carga do Identity-Aware Proxy equilibra o tráfego do usuário entre essas instâncias. Os servidores da Web do Airflow são executados no modo "somente leitura", o que significa:
A serialização do DAG está ativada. Como resultado, o servidor da Web do Airflow não analisa arquivos de definição do DAG.
Os plug-ins não são sincronizados com o servidor da Web, portanto, não é possível modificar ou estender o a funcionalidade do servidor da Web com plug-ins.
O servidor da Web do Airflow usa uma imagem de contêiner pré-criada pelo serviço do Cloud Composer. Se você instalar imagens PyPI no ambiente, elas não serão instaladas na imagem do contêiner do servidor da Web.
Como criar um perímetro de serviço
Consulte Como criar um perímetro de serviço para saber como criar e configurar perímetros de serviço. Selecione o Cloud Composer como um dos serviços protegidos dentro do perímetro.
Como criar ambientes em um perímetro
Há algumas etapas adicionais necessárias para implantar o Cloud Composer em um perímetro. Ao criar o ambiente do Cloud Composer:
Ative a API Access Context Manager e a API do Cloud Composer no projeto. Consulte Como ativar APIs para referência.
Verifique se o perímetro de serviço tem os seguintes serviços acessíveis pela VPC: Caso contrário, o ambiente pode não criar:
- API Cloud Composer (composer.googleapis.com)
- API Compute Engine (compute.googleapis.com)
- API Kubernetes Engine (container.googleapis.com)
- API Container Registry (containerregistry.googleapis.com)
- API Artifact Registry (artifactregistry.googleapis.com)
- API Cloud Storage (storage.googleapis.com)
- API Cloud SQL Admin (sqladmin.googleapis.com)
- API Cloud Logging (logging.googleapis.com)
- API Cloud Monitoring (monitoring.googleapis.com)
- API Cloud Pub/Sub (pubsub.googleapis.com)
- API Cloud Resource Manager (cloudresourcemanager.googleapis.com)
- API Service Directory (servicedirectory.googleapis.com)
- API Cloud Key Management Service (cloudkms.googleapis.com), se você estiver usando chaves do Cloud KMS ou CMEK
- API Secret Manager (secretmanager.googleapis.com), se você estiver usando o Secret Manager como um back-end secreto
Use a versão composer-1.10.4 ou posterior.
Verifique se a serialização de DAGs está ativada. Se o ambiente usar o Cloud Composer versão 1.15.0 e posterior, a serialização será ativada por padrão.
Crie um novo ambiente do Cloud Composer com o IP particular ativado. Observe que esta configuração precisa ser definida durante a criação do ambiente.
Ao criar seu ambiente, lembre-se de configurar o acesso ao servidor da Web do Airflow. Para proteção máxima, permita o acesso ao servidor da Web somente a partir de intervalos de IP específicos. Para mais detalhes, consulte Configurar o acesso à rede do servidor da Web.
Como configurar ambientes atuais com o VPC Service Controls
É possível adicionar o projeto que contém seu ambiente ao perímetro se:
Você criou o perímetro conforme descrito na seção anterior.
Os ambientes são de IP particular.
- A serialização de DAGs está ativada nos seus ambientes.
Como instalar pacotes PyPI
Na configuração padrão do VPC Service Controls, o Cloud Composer oferece suporte apenas à instalação de pacotes PyPI de repositórios particulares que podem ser acessadas pelo endereço IP interno da rede VPC.
Instalar de um repositório particular
A configuração recomendada é definir um repositório PyPI privado, preencher com pacotes verificados usados pela organização e, em seguida, configurar o Cloud Composer para instalar dependências do Python a partir de um repositório particular.
Instalar a partir de um repositório público
Repositório remoto
Essa é a abordagem recomendada para instalar pacotes de um repositório público.
Para instalar pacotes PyPI de repositórios fora do espaço IP particular, faça o seguinte: siga estas etapas:
- Crie um Repositório remoto do Artifact Registry.
- Conceda a este repositório acesso a origens upstream.
- Configure o Airflow para instalar pacotes de um repositório do Artifact Registry.
Conexões externas
Para instalar pacotes PyPI de repositórios fora do espaço IP particular, faça o seguinte: siga estas etapas:
Configure o Cloud NAT para permitir que o Cloud Composer em execução no espaço de IP particular se conecte a repositórios PyPI externos.
Configure as regras de firewall para permitir conexões de saída do cluster do Composer para o repositório.
A conta de serviço usada para o plano de dados do Cloud Composer
precisa ter os seguintes papéis de permissão: Composer.Worker
e
iam.serviceAccountUser
.
Configurar a conectividade com APIs e serviços do Google
Em uma configuração do VPC Service Controls, para controlar o tráfego de rede,
configurar o acesso às APIs e aos serviços do Google pelo
restricted.googleapis.com
: Esse domínio bloqueia o acesso a APIs e
serviços do Google que não são compatíveis com o VPC Service Controls.
Os ambientes do Cloud Composer usam os seguintes domínios:
O
*.googleapis.com
é usado para acessar outros serviços do Google.*.pkg.dev
é usado para receber imagens de ambiente, como ao criar ou atualizar um ambiente.*.gcr.io
O GKE requer conectividade para Domínio do Container Registry, independentemente da versão do Cloud Composer.
Configure a conectividade com o endpoint restricted.googleapis.com
:
Domínio | Nome do DNS | Registro CNAME | Registro A |
---|---|---|---|
*.googleapis.com
|
googleapis.com. |
Nome DNS: *.googleapis.com. Tipo de registro de recurso: CNAME Nome canônico: googleapis.com. |
Tipo de registro de recurso: A Endereços IPv4: 199.36.153.4 , 199.36.153.5 , 199.36.153.6 , 199.36.153.7
|
*.pkg.dev
|
pkg.dev. |
Nome DNS: *.pkg.dev. Tipo de registro de recurso: CNAME Nome canônico: pkg.dev. |
Tipo de registro de recurso: A Endereços IPv4: 199.36.153.4 , 199.36.153.5 , 199.36.153.6 , 199.36.153.7
|
*.gcr.io
|
gcr.io. |
Nome DNS: *.gcr.io. Tipo de registro de recurso: CNAME Nome canônico: gcr.io. |
Tipo de registro de recurso: A Endereços IPv4: 199.36.153.4 , 199.36.153.5 , 199.36.153.6 , 199.36.153.7
|
Para criar uma regra de DNS:
Crie uma nova zona de DNS e use Nome do DNS como nome do DNS dessa zona.
Exemplo:
pkg.dev.
Adicione um conjunto de registros para o Registro CNAME.
Exemplo:
- Nome do DNS:
*.pkg.dev.
- Tipo de registro de recurso:
CNAME
- Nome canônico:
pkg.dev.
- Nome do DNS:
Adicione um conjunto de registros com para A Record:
Exemplo:
- Tipo de registro de recurso:
A
- Endereços IPv4:
199.36.153.4
,199.36.153.5
,199.36.153.6
,199.36.153.7
- Tipo de registro de recurso:
Para mais informações, consulte Como configurar a conectividade particular com as APIs e os serviços do Google.
Configurar regras de firewall
Se o projeto tiver regras de firewall não padrão, como regras que substituem regras de firewall implícitas modificar as regras pré-preenchidas a rede padrão, depois verifique se as regras de firewall a seguir configurada.
Por exemplo, o Cloud Composer pode falhar na criação de um ambiente se
você tiver uma regra de firewall que negue todo o tráfego de saída. Para evitar problemas,
definir regras allow
seletivas que sigam a lista e tenham maior prioridade
do que a regra deny
global.
Configure a rede VPC para permitir o tráfego do seu ambiente:
- Consulte Como usar regras de firewall para aprender a verificar, adicionar e atualizar regras para sua rede VPC.
- Usar Ferramenta de conectividade para validar a conectividade entre intervalos de IP.
- Você pode usar tags de rede para limitar ainda mais o acesso. Você pode definir essas tags ao criar um ambiente.
Descrição | Direção | Ação | Origem ou destino | Protocolos | Portas |
---|---|---|---|---|---|
DNS Configure conforme descrito no Suporte do VPC Service Controls para o Cloud DNS |
- | - | - | - | - |
APIs e serviços do Google | Saída | Permitir | Endereços IPv4 de restricted.googleapis.com que você usa para APIs e serviços do Google. |
TCP | 443 |
Nós do cluster do ambiente | Saída | Permitir | Intervalo de endereços IP primários da sub-rede do ambiente | TCP, UDP | todas |
Pods de cluster do ambiente | Saída | Permitir | Intervalo de endereços IP secundário para pods na sub-rede do ambiente | TCP, UDP | todas |
Plano de controle do cluster do ambiente | Saída | Permitir | Intervalo de IP do plano de controle do GKE | TCP, UDP | todas |
Servidor da Web | Saída | Permitir | Intervalo de IP da rede do servidor da Web | TCP | 3306, 3307 |
Para acessar os intervalos de IP:
Os intervalos de endereços do pod, do serviço e do plano de controle estão disponíveis na página Clusters do cluster do seu ambiente:
No console do Google Cloud, acesse a página Ambientes.
Na lista de ambientes, clique no nome do ambiente. A página Detalhes do ambiente é aberta.
Acesse a guia Configuração do ambiente.
Siga o link ver detalhes do cluster.
É possível conferir o intervalo de IP do servidor da Web do ambiente na guia Configuração do ambiente.
Você pode conferir o ID de rede do ambiente na guia Configuração do ambiente. Para conferir os intervalos de IP de uma sub-rede, acesse a página Redes VPC e clique no nome da rede para conferir os detalhes:
Registros do VPC Service Controls
Ao solucionar problemas de criação de ambiente, é possível analisar os registros de auditoria geradas pelo VPC Service Controls.
Além de outras mensagens de registro, é possível verificar informações nos registros sobre
cloud-airflow-prod@system.gserviceaccount.com
e
service-PROJECT_ID@cloudcomposer-accounts.iam.gserviceaccount.com
contas de serviço que configuram componentes dos seus ambientes.
O serviço do Cloud Composer usa
cloud-airflow-prod@system.gserviceaccount.com
conta de serviço para gerenciar
componentes de projeto de locatário dos seus ambientes.
A conta de serviço
service-PROJECT_ID@cloudcomposer-accounts.iam.gserviceaccount.com
, também conhecida como Composer Service Agent Service Account
, gerencia
componentes de ambiente em
projetos de serviço e host.
Limitações
- Todas as restrições de rede do VPC Service Controls também se aplicam aos ambientes do Cloud Composer. Para mais detalhes, consulte a documentação do VPC Service Controls.
A exibição de um modelo renderizado com funções na IU da Web com a serialização de DAGs ativada é compatível com ambientes que executam o Cloud Composer versão 1.12.0 ou posterior e o Airflow versão 1.10.9 ou posterior.
A definição da sinalização
async_dagbag_loader
comoTrue
não é compatível enquanto a serialização do DAG está ativada.A ativação da serialização de DAGs desativa todos os plug-ins do servidor da Web do Airflow, porque eles podem prejudicar a segurança da rede VPC em que o Cloud Composer está implantado. Isso não afeta o comportamento dos plug-ins do programador ou do worker, incluindo operadores do Airflow, sensores etc.
- Quando o Cloud Composer está sendo executado dentro de um perímetro, o acesso a repositórios PyPI públicos é restrito. Consulte Como instalar dependências do Python para aprender a instalar módulos do PyPI no modo de IP particular.