Airflow Apache

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Questo documento descrive come configurare il tuo deployment Google Kubernetes Engine in modo da utilizzare Google Cloud Managed Service per Prometheus per raccogliere metriche dall'esportatore Airflow. Questo documento illustra come procedere nel seguente modo:

  • Configura l'esportatore Airflow per generare i report sulle metriche.
  • Configura una risorsa PodMonitoring per Managed Service per Prometheus per raccogliere le metriche esportate.
  • Accedi a una dashboard in Cloud Monitoring per visualizzare le metriche.
  • Configura le regole di avviso per monitorare le metriche.

Queste istruzioni si applicano solo se utilizzi la raccolta gestita con Managed Service per Prometheus. Se invece utilizzi una raccolta di cui è stato eseguito il deployment autonomo, consulta la documentazione di Airflow per informazioni sull'installazione.

Per informazioni su Airflow, consulta l'articolo Airflow.

Prerequisiti

Per raccogliere metriche dall'esportatore Airflow utilizzando Managed Service per Prometheus e la raccolta gestita, il tuo deployment deve soddisfare i seguenti requisiti:

  • Il cluster deve eseguire Google Kubernetes Engine versione 1.21.4-gke.300 o successive.
  • Devi eseguire Managed Service per Prometheus con la raccolta gestita abilitata. Per maggiori informazioni, consulta la Guida introduttiva alla raccolta gestita.

Airflow espone automaticamente le metriche in formato Prometheus; non è necessario installarle separatamente. Per verificare che l'esportatore Airflow stia emettendo metriche sugli endpoint previsti, procedi nel seguente modo:

  1. Configura il port forwarding utilizzando il seguente comando:
    kubectl -n NAMESPACE_NAME port-forward deploy/airflow-statsd 9102
    
  2. Accedi all'endpoint localhost:9102/metrics utilizzando il browser o l'utilità curl in un'altra sessione del terminale.

Definisci una risorsa PodMonitoring

Per il rilevamento dei target, l'operatore Managed Service per Prometheus richiede una risorsa PodMonitoring che corrisponde all'esportatore Airflow nello stesso spazio dei nomi.

Puoi utilizzare la seguente configurazione di PodMonitoring:

# Copyright 2022 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

apiVersion: monitoring.googleapis.com/v1
kind: PodMonitoring
metadata:
  name: airflow
  labels:
    app.kubernetes.io/name: airflow
    app.kubernetes.io/part-of: google-cloud-managed-prometheus
spec:
  endpoints:
  - port: 9102
    scheme: http
    interval: 30s
    path: /metrics
  selector:
    matchLabels:
      tier: airflow
      component: statsd
      release: airflow
Assicurati che i valori dei campi port e matchLabels corrispondano a quelli dei pod Airflow che vuoi monitorare. Le etichette e i valori mostrati qui sono impostati per impostazione predefinita quando viene eseguito il deployment di Airflow con Helm.

Per applicare le modifiche alla configurazione da un file locale, esegui questo comando:

kubectl apply -n NAMESPACE_NAME -f FILE_NAME

Puoi anche utilizzare Terraform per gestire le configurazioni.

Definisci regole e avvisi

Puoi utilizzare la seguente configurazione Rules per definire gli avvisi sulle metriche Airflow:

# Copyright 2022 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

apiVersion: monitoring.googleapis.com/v1
kind: Rules
metadata:
  name: airflow-rules
  labels:
    app.kubernetes.io/component: rules
    app.kubernetes.io/name: airflow-rules
    app.kubernetes.io/part-of: google-cloud-managed-prometheus
spec:
  groups:
  - name: airflow
    interval: 30s
    rules:
    - alert: AirflowDAGImportErrors
      annotations:
        description: |-
          Airflow dag import errors
            VALUE = {{ $value }}
            LABELS: {{ $labels }}
        summary: Airflow dag import errors (instance {{ $labels.instance }})
      expr: airflow_dag_processing_import_errors > 0
      for: 5m
      labels:
        severity: critical

Per applicare le modifiche alla configurazione da un file locale, esegui questo comando:

kubectl apply -n NAMESPACE_NAME -f FILE_NAME

Puoi anche utilizzare Terraform per gestire le configurazioni.

Per maggiori informazioni sull'applicazione di regole al tuo cluster, consulta Avvisi e valutazione delle regole gestite.

Puoi regolare le soglie di avviso in base alle tue esigenze.

Verificare la configurazione

Puoi utilizzare Metrics Explorer per verificare di aver configurato correttamente l'esportatore Airflow. Cloud Monitoring potrebbe impiegare uno o due minuti per importare le metriche.

Per verificare se le metriche sono state importate, procedi nel seguente modo:

  1. Nella console Google Cloud, seleziona Monitoring o fai clic sul pulsante seguente:
    Vai a Monitoring
  2. Nel riquadro di navigazione, seleziona Metrics Explorer.
  3. Seleziona la scheda PromQL ed esegui la seguente query:
    up{job="airflow", cluster="CLUSTER_NAME", namespace="NAMESPACE_NAME"}

Visualizza dashboard

L'integrazione di Cloud Monitoring include la dashboard Panoramica di Airflow Prometheus. Le dashboard vengono installate automaticamente quando configuri l'integrazione. Puoi anche visualizzare le anteprime statiche delle dashboard senza installare l'integrazione.

Per visualizzare una dashboard installata, procedi come segue:

  1. Nella console Google Cloud, seleziona Monitoring o fai clic sul pulsante seguente:
    Vai a Monitoring
  2. Nel pannello di navigazione, seleziona Dashboard.
  3. Seleziona la scheda Elenco dashboard.
  4. Scegli la categoria Integrazioni.
  5. Fai clic sul nome della dashboard, ad esempio Panoramica di Airflow Prometheus.

Per visualizzare un'anteprima statica della dashboard:

  1. Nella console Google Cloud, seleziona Monitoring o fai clic sul pulsante seguente:
    Vai a Monitoring
  2. Nel riquadro di navigazione, seleziona Integrazioni.
  3. Fai clic sul filtro della piattaforma di deployment Kubernetes Engine.
  4. Individua l'integrazione di Apache Airflow e fai clic su Visualizza dettagli.
  5. Seleziona la scheda Dashboard.

Risolvere i problemi

Per informazioni sulla risoluzione dei problemi di importazione delle metriche, consulta la sezione Problemi con la raccolta dagli esportatori in Risolvere i problemi lato importazione.