Cloud Composer 1 | Cloud Composer 2 | Cloud Composer 3
Los Controles del servicio de VPC permiten que las organizaciones definan un perímetro alrededor de los recursos de Google Cloud para mitigar riesgos de robo de datos.
Los entornos de Cloud Composer se pueden implementar dentro de un perímetro de servicio. Cuando configuras tu entorno con los Controles del servicio de VPC, puedes mantener la privacidad de los datos sensibles mientras aprovechas las capacidades de organización de flujos de trabajo completamente administradas de Cloud Composer.
La compatibilidad con los Controles del servicio de VPC para Cloud Composer significa lo siguiente:
- Ahora se puede seleccionar Cloud Composer como un servicio protegido dentro del perímetro de los Controles del servicio de VPC.
- Todos los recursos subyacentes que usa Cloud Composer se configuran para admitir la arquitectura de los Controles del servicio de VPC y seguir sus reglas.
Implementar entornos de Cloud Composer con los Controles del servicio de VPC te proporciona lo siguiente:
- Reducción del riesgo de robo de datos
- Protección contra la exposición de datos debido a controles de acceso mal configurados
- Reducción del riesgo de que usuarios maliciosos copien datos a recursos no autorizados de Google Cloud, o ante atacantes externos que acceden a recursos de Google Cloud desde Internet.
Servidor web de Airflow en modo de Controles del servicio de VPC
En el modo de los Controles del servicio de VPC, Cloud Composer ejecuta dos instancias del servidor web de Airflow. La carga de Identity-Aware Proxy balancea el tráfico de usuarios entre estas instancias. Los servidores web de Airflow se ejecutan en modo “de solo lectura”, lo que significa lo siguiente:
La serialización del DAG está habilitada. Como resultado, el servidor web de Airflow no analiza los archivos de definición del DAG.
Los complementos no se sincronizan con el servidor web, por lo que no puedes modificar ni extender la funcionalidad del servidor web con complementos.
El servidor web de Airflow usa una imagen de contenedor ya compilada por el servicio de Cloud Composer. Si instalas imágenes de PyPI en tu entorno, estas no se instalan en la imagen del contenedor del servidor web.
Crea un perímetro de servicio
Consulta Crea un perímetro de servicio a fin de obtener información para crear y configurar perímetros de servicio. Asegúrate de seleccionar Cloud Composer como uno de los servicios protegidos dentro del perímetro.
Crea entornos en un perímetro
Hay pasos adicionales necesarios para implementar Cloud Composer dentro de un perímetro. Cuando creas tu entorno de Cloud Composer, sigue estos pasos:
Habilita la API de Access Context Manager y la API de Cloud Composer para tu proyecto. Consulta Habilita API para obtener referencia.
Asegúrate de que tu perímetro de servicio tenga los siguientes servicios accesibles de VPC: De lo contrario, tu entorno podría no crearse:
- API de Cloud Composer (composer.googleapis.com)
- API de Compute Engine (compute.googleapis.com)
- API de Kubernetes Engine (container.googleapis.com)
- API de Container Registry (containerregistry.googleapis.com)
- API de Artifact Registry (artifactregistry.googleapis.com)
- La API de Cloud Storage (storage.googleapis.com)
- API de Administrador de Cloud SQL (sqladmin.googleapis.com)
- API de Cloud Logging (logging.googleapis.com)
- API de Cloud Monitoring (monitoring.googleapis.com)
- API de Cloud Pub/Sub (pubsub.googleapis.com)
- API de Cloud Resource Manager (cloudresourcemanager.googleapis.com)
- API de Directorio de servicios (servicedirectory.googleapis.com)
- API de Cloud Key Management Service (cloudkms.googleapis.com), si usas claves de Cloud KMS o CMEK
- API de Secret Manager (secretmanager.googleapis.com), si usas Secret Manager como backend de secretos
Usa la versión composer-1.10.4 o una posterior.
Asegúrate de que la serialización del DAG esté habilitada. Si tu entorno usa la versión 1.15.0 y posteriores de Cloud Composer, la serialización está habilitada de forma predeterminada.
Crea un nuevo entorno de Cloud Composer con la IP privada habilitada. Ten en cuenta que esta configuración debe establecerse durante la creación del entorno.
Cuando crees tu entorno, recuerda configurar el acceso al servidor web de Airflow. Para obtener la máxima protección, solo permite el acceso al servidor web desde rangos de IP específicos. Para obtener más información, consulta Configura el acceso a la red del servidor web.
Configura entornos existentes con los Controles del servicio de VPC
Puedes agregar el proyecto que contiene tu entorno al perímetro si se cumplen las siguientes condiciones:
Creaste el perímetro como se describe en la sección anterior.
Tus entornos son entornos de IP privada.
- Tus entornos tienen habilitada la serialización del DAG.
Instala paquetes de PyPI
En la configuración predeterminada de los Controles del servicio de VPC, Cloud Composer solo admite la instalación de paquetes de PyPI desde repositorios privados a los que se puede acceder desde el espacio de direcciones IP internas de la red de VPC.
Instalar desde un repositorio privado
La configuración recomendada es configurar un repositorio privado de PyPI, propagarlo con los paquetes aprobados que usa tu organización y, luego, configurar Cloud Composer para instalar dependencias de Python desde un repositorio privado.
Instala desde un repositorio público
Repositorio remoto
Este es el enfoque recomendado para instalar paquetes desde un repositorio público.
Para instalar paquetes de PyPI desde repositorios fuera del espacio de IP privado, sigue estos pasos:
- Crea un repositorio remoto de Artifact Registry.
- Otórgale a este repositorio acceso a las fuentes upstream.
- Configura Airflow para instalar paquetes desde un repositorio de Artifact Registry.
Conexiones externas
Para instalar paquetes de PyPI desde repositorios fuera del espacio de IP privada, sigue estos pasos:
Configura Cloud NAT para permitir que Cloud Composer se ejecute en el espacio de IP privada y se conecte con repositorios externos de PyPI.
Configura tus reglas de firewall para permitir conexiones salientes desde el clúster de Composer al repositorio.
La cuenta de servicio que se usa para el plano de datos de Cloud Composer debe tener los siguientes roles de permisos: Composer.Worker
y iam.serviceAccountUser
.
Configura la conectividad a los servicios y las APIs de Google
En una configuración de Controles del servicio de VPC, para controlar el tráfico de red, configura el acceso a las APIs y los servicios de Google a través de restricted.googleapis.com
. Este dominio bloquea el acceso a los servicios y a las APIs de Google que no son compatibles con los Controles del servicio de VPC.
Los entornos de Cloud Composer usan los siguientes dominios:
*.googleapis.com
se usa para acceder a otros servicios de Google.*.pkg.dev
se usa para obtener imágenes de entorno, como cuando se crean o actualizar un entorno.*.gcr.io
GKE requiere conectividad al dominio de Container Registry, independientemente de la versión de Cloud Composer.
Configura la conectividad con el extremo restricted.googleapis.com
.
Dominio | Nombre de DNS | Registro CNAME | Registro A |
---|---|---|---|
*.googleapis.com
|
googleapis.com. |
Nombre de DNS: *.googleapis.com. Tipo de registro de recursos: CNAME Nombre canónico: googleapis.com. |
Tipo de registro de recursos: A Direcciones IPv4: 199.36.153.4 , 199.36.153.5 , 199.36.153.6 , 199.36.153.7
|
*.pkg.dev
|
pkg.dev. |
Nombre de DNS: *.pkg.dev. Tipo de registro de recursos: CNAME Nombre canónico: pkg.dev. |
Tipo de registro de recursos: A Direcciones IPv4: 199.36.153.4 , 199.36.153.5 , 199.36.153.6 , 199.36.153.7
|
*.gcr.io
|
gcr.io. |
Nombre de DNS: *.gcr.io. Tipo de registro de recursos: CNAME Nombre canónico: gcr.io. |
Tipo de registro de recursos: A Direcciones IPv4: 199.36.153.4 , 199.36.153.5 , 199.36.153.6 , 199.36.153.7
|
Para crear una regla de DNS, sigue estos pasos:
Crea una zona de DNS nueva y usa Nombre de DNS como nombre de DNS de esta zona.
Ejemplo:
pkg.dev.
Agrega un conjunto de registros para el registro CNAME.
Ejemplo:
- Nombre de DNS:
*.pkg.dev.
- Tipo de registro de recursos:
CNAME
- Nombre canónico:
pkg.dev.
- Nombre de DNS:
Agrega un conjunto de registros con A Record:
Ejemplo:
- Tipo de registro de recursos:
A
- Direcciones IPv4:
199.36.153.4
,199.36.153.5
,199.36.153.6
,199.36.153.7
- Tipo de registro de recursos:
Para obtener más información, consulta Configura la conectividad privada a los servicios y las APIs de Google.
Configura reglas de firewall
Si tu proyecto tiene reglas de firewall no predeterminadas, como reglas que anulen reglas de firewall implícitas modifica las reglas prepropagadas en la red predeterminada y que se cumplan las siguientes reglas de firewall configurado.
Por ejemplo, es posible que Cloud Composer no cree un entorno si tienes una regla de firewall que rechace todo el tráfico de salida. Para evitar problemas, define reglas allow
selectivas que sigan la lista y tengan una prioridad más alta que la regla deny
global.
Configura tu red de VPC para permitir el tráfico desde tu entorno:
- Consulta Cómo usar reglas de firewall para obtener información sobre verificar, agregar y actualizar reglas para tu red de VPC.
- Usa Herramienta de conectividad para validar la conectividad entre rangos de IP.
- Puedes usar etiquetas de herramientas de redes para y limitar el acceso. Puedes configurar estas etiquetas cuando creas un entorno.
Descripción | Dirección | Acción | Origen o destino | Protocolos | Puertos |
---|---|---|---|---|---|
DNS Configura como se describe en Compatibilidad con los controles del servicio de VPC para Cloud DNS |
- | - | - | - | - |
Servicios y APIs de Google | Salida | Permitir | Direcciones IPv4 de restricted.googleapis.com que usas para las APIs y los servicios de Google. |
TCP | 443 |
Nodos de clúster del entorno | Salida | Permitir | Rango de direcciones IP principal de la subred del entorno | TCP, UDP | todos |
Pods del clúster del entorno | Salida | Permitir | Rango de direcciones IP secundario para Pods en la subred del entorno | TCP, UDP | todos |
Plano de control del clúster del entorno | Salida | Permitir | Rango de IP del plano de control de GKE | TCP, UDP | todos |
Servidor web | Salida | Permitir | Rango de IP de la red del servidor web | TCP | 3306 y 3307 |
Para obtener rangos de IP, haz lo siguiente:
Los rangos de direcciones de Pod, Service y Control Plane están disponibles en la página Clústeres del clúster de tu entorno:
En la consola de Google Cloud, ve a la página Entornos.
En la lista de entornos, haz clic en el nombre de tu entorno. Se abrirá la página Detalles del entorno.
Ve a la pestaña Configuración del entorno.
Sigue el vínculo Ver detalles del clúster.
Puedes ver el rango de IP del servidor web del entorno en la pestaña Configuración del entorno.
Puedes ver el ID de red del entorno en la pestaña Configuración del entorno. Para obtener los rangos de IP de una subred, ve a la página Redes de VPC y haz clic en el nombre de la red para ver los detalles:
Registros de Controles del servicio de VPC
Cuando solucionas problemas de creación de entornos, puedes analizar los registros de auditoría generada por los Controles del servicio de VPC.
Además de otros mensajes de registro, puedes consultar los registros para obtener información sobre las cuentas de servicio cloud-airflow-prod@system.gserviceaccount.com
y service-PROJECT_ID@cloudcomposer-accounts.iam.gserviceaccount.com
que configuran los componentes de tus entornos.
El servicio de Cloud Composer usa la cuenta de servicio cloud-airflow-prod@system.gserviceaccount.com
para administrar los componentes del proyecto del inquilino de tus entornos.
El
service-PROJECT_ID@cloudcomposer-accounts.iam.gserviceaccount.com
también conocida como Composer Service Agent Service Account
administra
componentes de entorno
proyectos host y de servicio.
Limitaciones
- Todas las restricciones de red de los Controles del servicio de VPC también se aplicarán a tus entornos de Cloud Composer. Consulta la documentación de los Controles del servicio de VPC para obtener más información.
La visualización de una plantilla renderizada con funciones en la IU web con serialización de DAG habilitada es compatible con entornos que ejecutan la versión 1.12.0 o posteriores de Cloud Composer y la versión 1.10.9 o posteriores de Airflow.
No se puede establecer la marca
async_dagbag_loader
enTrue
mientras la serialización de DAG está habilitada.La habilitación de la serialización de DAG inhabilita todos los complementos del servidor web de Airflow, ya que podrían poner en riesgo la seguridad de la red de VPC, en la que se implementa Cloud Composer. Esto no afecta el comportamiento de los complementos de trabajador o programador, incluidos los sensores, operadores, etc. de Airflow.
- Cuando Cloud Composer se ejecuta dentro de un perímetro, se restringe el acceso a los repositorios públicos de PyPI. Consulta Instala dependencias de Python para obtener información sobre cómo instalar módulos de PyPi en modo de IP privada.