Configura los Controles del servicio de VPC

Los Controles de servicio de nube privada virtual (Controles del servicio de VPC) permiten que las organizaciones definan un perímetro alrededor de los recursos de Google Cloud para mitigar riesgos de robo de datos.

Los entornos de Cloud Composer se pueden implementar dentro de un perímetro de servicio. Cuando configuras tu entorno con los Controles del servicio de VPC, puedes mantener la privacidad de los datos sensibles mientras aprovechas las capacidades de organización de flujos de trabajo completamente administradas de Cloud Composer.

La compatibilidad con los Controles del servicio de VPC para Cloud Composer significa lo siguiente:

  • Ahora se puede seleccionar Cloud Composer como un servicio protegido dentro del perímetro de los Controles del servicio de VPC.
  • Todos los recursos subyacentes que usa Cloud Composer se configuran para admitir la arquitectura de los Controles del servicio de VPC y seguir sus reglas.

La implementación de entornos de Cloud Composer con los Controles del servicio de VPC te proporciona lo siguiente:

  • Reducción del riesgo de robo de datos
  • Protección contra la exposición de datos debido a controles de acceso mal configurados
  • Reducción del riesgo de que usuarios maliciosos copien datos a recursos no autorizados de Google Cloud, o ante atacantes externos que acceden a recursos de Google Cloud desde Internet.

Crea un perímetro de servicio

Consulta Cómo crear un perímetro de servicio para obtener información sobre cómo crear y configurar perímetros de servicio. Asegúrate de seleccionar Cloud Composer como uno de los servicios protegidos dentro del perímetro.

Crea entornos en un perímetro

Hay algunos pasos adicionales necesarios para implementar Cloud Composer dentro de un perímetro. Cuando creas tu entorno de Cloud Composer, sigue estos pasos:

  1. Habilita la API de Access Context Manager y la API de Cloud Composer para tu proyecto. Consulta Habilita API para obtener referencia.

  2. Permite enumerar la siguiente cuenta de servicio agrégala a un AccessLevel y adjúntala al perímetro de servicio:

    • cloud-logs@system.gserviceaccount.com: Esta cuenta de servicio permite que Cloud Composer almacene registros en el servicio de Cloud Monitoring de tu proyecto.
  3. Agrega los siguientes servicios al perímetro para obtener la máxima protección de tu entorno: Cloud SQL, Pub/Sub, Monitoring, Cloud Storage, Kubernetes Engine y Container Registry.

  4. Usa la versión composer-1.10.4 o una posterior.

  5. Habilita la serialización de DAG en la base de datos de Airflow. Para ello, agrega la anulación de configuración [core] store_serialized_dags=True y [core] store_dag_code=True en la sección core cuando crees un entorno. Consulta serialización de DAG para obtener más detalles.

  6. Crea un nuevo entorno de Cloud Composer con la IP privada habilitada. Ten en cuenta que esta configuración debe configurarse durante la creación del entorno.

  7. Cuando crees tu entorno, recuerda configurar el acceso al servidor web de Airflow. Para obtener la máxima protección, solo permite el acceso al servidor web desde rangos de IP específicos. Para obtener más información, consulta el paso 5 en Crea un entorno nuevo.

Configura entornos existentes con los Controles del servicio de VPC

Si tu entorno cumple con ciertas condiciones, puedes configurar Cloud Composer para que funcione dentro de un perímetro:

  1. El entorno se creó con la API de Composer en versión beta, con la IP privada habilitada.

  2. La serialización de DAG está activada.

Si se cumplen estas condiciones, puedes agregar el proyecto que contiene tu entorno al perímetro, siempre y cuando el perímetro se haya creado como se describió en la sección anterior.

Instala paquetes de PyPI

En la configuración predeterminada de los Controles del servicio de VPC (que se muestra arriba), Cloud Composer solo admite la instalación de paquetes de PyPI desde repositorios privados accesibles desde el espacio de direcciones IP privadas de la red de VPC. La configuración recomendada para este proceso es configurar un repositorio privado de PyPI, propagarlo con los paquetes aprobados que usa tu organización y, luego,Configurar Cloud Composer para instalar dependencias de Python desde un repositorio privado.

También es posible instalar paquetes de PyPI desde repositorios fuera del espacio de IP privada. Lleva a cabo los pasos siguientes:

  1. Configura Cloud NAT para permitir que Composer se ejecute en el espacio de IP privada y se conecte con repositorios externos de PyPI.
  2. Configura tus reglas de firewall para permitir conexiones salientes desde el clúster de Composer al repositorio.

Cuando uses esta configuración, asegúrate de comprender los riesgos de usar repositorios externos y si deseas trabajar con ellos. Asegúrate de confiar en el contenido y la integridad de los repositorios externos, ya que estas conexiones podrían usarse como vectores de robo de datos.

Lista de tareas para la configuración de red

Tu red de VPC debe estar configurada correctamente para crear entornos de Cloud Composer dentro de un perímetro. Asegúrate de seguir los requisitos de configuración que se detallan a continuación.

  • En Cloud Console, navega a la sección Red de VPC -> Firewall y verifica que las siguientes reglas de firewall estén configuradas:

    • Permitir la salida desde el rango de IP del nodo de GKE a cualquier lugar, puerto 53
    • Permitir la salida desde el rango de IP del nodo de GKE al rango de IP del nodo de GKE, todos los puertos
    • Permitir la salida desde el rango de IP del nodo de GKE al rango de IP de la instancia principal de GKE, todos los puertos
    • Permitir la salida desde el rango de IP del nodo de GKE a 199.36.153.4/30, puerto 443 (restricted.googleapis.com)
    • Permite la entrada de verificaciones de estado de GCP 130.211.0.0/22,35.191.0.0/16 al rango de IP de nodo. Puertos TCP 80 y 443
    • Permitir la salida desde el rango de IP del nodo a las verificaciones de estado de GCP. Puertos TCP 80 y 443

    Consulta Cómo usar reglas de firewall para aprender a verificar, agregar y actualizar las reglas de tu red de VPC.

  • Configura la conectividad con el extremo restricted.googleapis.com.

    • Verifica la existencia de un mapeo de DNS de *.googleapis.com a restricted.googleapis.com
    • El DNS *.gcr.io debe resolverse como 199.36.153.4/30 de manera similar al extremo googleapis.com. Para ello, crea una zona nueva como: CNAME *.gcr.io -> gcr.io. A gcr.io. -> 199.36.153.4, 199.36.153.5, 199.36.153.6, 199.36.153.7

    Para obtener más información, consulta Cómo configurar una conectividad privada a los servicios y las API de Google.

Limitaciones

  • Todas las restricciones de red de los Controles del servicio de VPC también se aplicarán a tus entornos de Cloud Composer. Consulta la documentación de los Controles del servicio de VPC para obtener más información.

  • La habilitación de la serialización de DAG evita que Airflow muestre una plantilla renderizada con funciones en la IU web. Esto se podría solucionar en una versión futura de Airflow y Cloud Composer.

  • No se puede establecer la marca async_dagbag_loader en True mientras la serialización de DAG está habilitada.

  • La habilitación de la serialización de DAG inhabilita todos los complementos del servidor web de Airflow, ya que podrían poner en riesgo la seguridad de la red de VPC, en la que se implementa Cloud Composer. Esto no afecta el comportamiento de los complementos de trabajador o programador, incluidos los sensores, operadores, etc. de Airflow.

  • Cuando Cloud Composer se ejecuta dentro de un perímetro, se restringe el acceso a los repositorios públicos de PyPI. Consulta Instala dependencias de Python para obtener información sobre cómo instalar módulos de PyPi en modo de IP privada.