Configura Secret Manager para tu entorno

Cloud Composer 1 | Cloud Composer 2

En esta página, se muestra cómo usar Secret Manager para almacenar las conexiones y secretos de Airflow de forma segura.

Antes de comenzar

  • Para usar Secret Manager, tu entorno de Cloud Composer debe usar Airflow 1.10.10 o posterior y Python 3.6 o posterior.
  • Python 2 no es compatible.

Configura Secret Manager para tu entorno

En esta sección, se explica cómo configurar Secret Manager para que puedas usar secretos con tu entorno de Cloud Composer.

Habilita la API de Secret Manager

Console

Habilita la API de Secret Manager.

Habilita la API

gcloud

Habilita la API de Secret Manager:

gcloud services enable secretmanager.googleapis.com

Configura el control de acceso

Debes configurar el control de acceso para que Airflow pueda acceder a los secretos almacenados en Secret Manager.

Para ello, la cuenta de servicio que accede a los secretos debe tener una función con el permiso secretmanager.versions.access. Por ejemplo, la función Administrador de accesos a secretos de Secret Manager incluye este permiso.

Puedes otorgar esta función a nivel de Secret, proyecto, organización o carpeta.

Usa una de las siguientes opciones:

Habilita la serialización del DAG

En general, solo debes usar el backend de Secret Manager desde los métodos execute() de tus operadores o con las plantillas de Jinja. Por ejemplo, puedes recuperar variables con var.value.example_var.

El servidor web de Airflow se ejecuta con una cuenta de servicio diferente con permisos limitados, por lo que no puede acceder a los secretos en Secret Manager. Si el código del DAG accede a los secretos durante el procesamiento del DAG (no solo desde las tareas) y no es posible ajustarlo para acceder a los secretos desde los métodos execute(), habilita la serialización del DAG. Después de hacerlo, el servidor web de Airflow toma DAG procesados y no necesita acceso a secretos.

Habilita y configura el backend de Secret Manager

  1. Anula la siguiente opción de configuración de Airflow:

    Sección Clave Valor
    secrets backend airflow.providers.google.cloud.secrets.secret_manager.CloudSecretManagerBackend
  2. Para agregar una configuración opcional, anula la siguiente opción de configuración de Airflow:

    Sección Clave Valor
    secrets backend_kwargs Consulta la siguiente descripción.

    El valor backend_kwargs es la representación JSON del objeto backend_kwargs con los siguientes campos:

    • connections_prefix: especifica el prefijo del nombre del secreto que se leerá para obtener conexiones. La cantidad predeterminada es airflow-connections.
    • variables_prefix: especifica el prefijo del nombre del secreto que se leerá para obtener variables. La cantidad predeterminada es airflow-variables.
    • gcp_key_path: Ruta de acceso al archivo JSON de credenciales de Google Cloud (si no se proporciona, se usa la cuenta de servicio predeterminada).
    • gcp_keyfile_dict: el diccionario JSON de credenciales de Google Cloud. Este campo y gcp_key_path son mutuamente excluyentes.
    • sep: Es el separador que se usa para concatenar connections_prefix y conn_id. Configuración predeterminada: -.
    • project_id: Es el ID del proyecto de Google Cloud en el que se almacenan los secretos.

    Por ejemplo, el valor de backend_kwargs puede ser: {"project_id": "<project id>", "connections_prefix":"example-connections", "variables_prefix":"example-variables", "sep":"-"}

Agrega conexiones y variables en Secret Manager

Para crear secretos, sigue los pasos que se describen en Crea secretos y versiones.

Variables

  • Debe usar el formato [variable_prefix][sep][variable_name].
  • El valor predeterminado para [variable_prefix] es airflow-variables.
  • El separador predeterminado [sep] es -

Por ejemplo, si el nombre de la variable es example-var, el nombre del secreto es airflow-variables-example-var.

Nombres de las conexiones

  • Debe usar el formato [connection_prefix][sep][connection_name].
  • El valor predeterminado para [connection_prefix] es airflow-connections.
  • El separador predeterminado [sep] es -

Por ejemplo, si el nombre de la conexión es exampleConnection, el nombre del secreto es airflow-connections-exampleConnection.

Valores de conexión

  • Se debe usar la representación de URI. Por ejemplo, mysql://login:password@examplehost:9000

  • El URI debe estar codificado en formato URL (codificado con porcentaje). Por ejemplo, una contraseña que tiene un símbolo de espacio debe estar codificada como URL de la siguiente manera: mysql://login:secret%20password@examplehost:9000.

Airflow tiene un método conveniente para generar los URI de conexión. Puedes encontrar un ejemplo de cómo codificar un URL complejo con elementos JSON adicionales en la documentación de Airflow.

Usa Secret Manager con Cloud Composer

Cuando recuperas variables y conexiones, Cloud Composer primero verifica Secret Manager. Si no se encuentra la variable o la conexión solicitadas, Cloud Composer verifica las variables de entorno y la base de datos de Airflow.

Leer variables con plantillas de Jinja

Puedes usar Secret Manager a fin de leer variables con plantillas de Jinja para campos de operador con plantillas (resueltas en el momento de la ejecución).

Para el secreto airflow-variables-secret_filename:

file_name = '{{var.value.secret_filename}}'

Lee variables con operadores personalizados y devoluciones de llamada

También puedes usar Secret Manager para leer variables en operadores personalizados o métodos de devolución de llamada de operadores. Leer las variables desde los DAG puede tener un impacto negativo en el rendimiento, por lo que debes usar las plantillas de Jinja si deseas usar variables en tus DAG.

Por ejemplo, para el secreto airflow-variables-secret_filename, haz lo siguiente:

from airflow.models.variable import Variable
file_name = Variable.get('secret_filename')

Leer conexiones

A menos que escribas un operador personalizado, rara vez necesitas acceder directamente a las conexiones. La mayoría de los hooks reciben el nombre de conexión como su parámetro de creación de instancias, y deben recuperar las conexiones del backend del secreto automáticamente cuando se ejecutan las tareas.

Leer las conexiones directamente puede ser útil cuando escribes tu propio hook.

Por ejemplo, para la conexión airflow-connections-exampleConnection:

from airflow.hooks.base_hook import BaseHook
exampleConnection = BaseHook.get_connection('exampleConnection')

BaseHook.get_connection muestra un objeto Connection. Es posible obtener la representación de string de URI de una conexión como esta:

exampleConnectionUri = BaseHook.get_connection('exampleConnection').get_uri()

¿Qué sigue?