Esegui la migrazione delle regole di avviso e dei destinatari da Prometheus

In questa pagina viene descritto come eseguire la migrazione delle regole di avviso di Prometheus ai criteri di avviso di Cloud Monitoring con una condizione basata su PromQL. Il processo di migrazione è utile se utilizzi PromQL in ambienti esterni a Google Cloud. Eseguendo la migrazione delle regole di avviso Prometheus a Cloud Monitoring, puoi gestire tutti i tuoi criteri di avviso in un unico ambiente.

Per informazioni generali sui criteri di avviso con condizioni basate su PromQL, consulta Criteri di avviso con PromQL.

Puoi anche importare le dashboard di Grafana. Per ulteriori informazioni, consulta Importare le dashboard Grafana in Cloud Monitoring.

Come funziona la migrazione

In gcloud CLI, puoi eseguire la migrazione delle regole di avviso e dei destinatari esistenti per creare criteri di avviso e canali di notifica di Cloud Monitoring. gcloud CLI può eseguire i seguenti tipi di migrazione:

  • Se fornisci un file di configurazione Prometheus con una regola di avviso, gcloud CLI crea un criterio di avviso con una condizione basata su PromQL.

    Puoi fornire più file di configurazione Prometheus contemporaneamente per creare più criteri di avviso con una condizione basata su PromQL.

  • Se fornisci un file Prometheus Alertmanager con almeno un ricevitore, gcloud CLI converte ogni ricevitore in un canale di notifica equivalente in Monitoring.

  • Se fornisci contemporaneamente un file Alertmanager Prometheus e un file di configurazione Prometheus, gcloud CLI crea il criterio di avviso e i canali di notifica, quindi associa ogni nuovo canale di notifica al nuovo criterio di avviso.

    Se fornisci più file di configurazione con regole di avviso, gcloud CLI assegna ogni canale di notifica dal file Alertmanager a ogni nuovo criterio di avviso.

Se la regola di avviso di Prometheus fa riferimento a una metrica personalizzata, gcloud CLI richiede un descrittore della metrica equivalente per creare il criterio di avviso.

I file di configurazione Prometheus e i file Prometheus Alertmanager devono essere formattati come file di regole Prometheus validi in YAML o JSON.

Mappatura campi

Gcloud CLI mappa i campi tra una regola di avviso Prometheus e un criterio di avviso di Cloud Monitoring come segue:

Regola di avviso di Prometheus Criterio di avviso di Cloud Monitoring
alert conditionPrometheusQueryLanguage.alertRule
expr conditionPrometheusQueryLanguage.query
for conditionPrometheusQueryLanguage.duration
labels conditionPrometheusQueryLanguage.labels
annotations: "summary" documentation.subject
annotations: "description" documentation.content

Variabili della documentazione di Google Cloud nelle regole di avviso di Prometheus migrate

Prometheus utilizza modelli di campi di avviso per configurare variabili nelle annotazioni e nelle etichette delle regole di avviso. Quando esegui la migrazione delle regole di avviso Prometheus dotate di modelli di campo di avviso, Cloud Monitoring converte i modelli in variabili di documentazione di Cloud Monitoring nel seguente modo:

Modello di campo di avviso Prometheus Variabile di documentazione di Cloud Monitoring
{{$value}}

${metric.label.value}

Questa variabile è un'implementazione di ${metric.label.KEY}, dove value contiene il valore della query PromQL.

{{humanize $value}}

${metric.label.value}

Questa variabile è un'implementazione di ${metric.label.KEY}, dove value contiene il valore della query PromQL.

{{$labels}} ${metric_or_resource.labels}
{{humanize $labels}} ${metric_or_resource.labels}
{{$labels.key}}

Viene visualizzato come ${metric_or_resource.label.KEY} nella configurazione della documentazione criterio di avviso.

  • Se KEY è un'etichetta valida, questa variabile viene visualizzata nella notifica come valore di ${metric.label.KEY}.
  • Se KEY è una risorsa valida, questa variabile viene visualizzata nella notifica come valore di ${resource.label.KEY}.
  • Se KEY non è né un'etichetta valida né una risorsa valida, questa variabile viene visualizzata nella notifica come stringa vuota.
{{humanize $labels.<key>}}

Viene visualizzato come ${metric_or_resource.label.KEY} nella configurazione della documentazione criterio di avviso.

  • Se KEY è un'etichetta valida, questa variabile viene visualizzata nella notifica come valore di ${metric.label.KEY}.
  • Se KEY è una risorsa valida, questa variabile viene visualizzata nella notifica come valore di ${resource.label.KEY}.
  • Se KEY non è né un'etichetta valida né una risorsa valida, questa variabile viene visualizzata nella notifica come stringa vuota.

Esegui la migrazione delle regole di avviso e dei destinatari da Prometheus

Per eseguire la migrazione delle regole di avviso Prometheus ai criteri di avviso di Cloud Monitoring con condizioni basate su PromQL, utilizza il comando gcloud alpha monitoring policies migrate. Questo comando consente anche di eseguire la migrazione dei ricevitori Prometheus ai canali di notifica di Cloud Monitoring.

  • Per eseguire la migrazione di una regola di avviso, devi disporre di un file di regole YAML o JSON Prometheus contenente la regola di avviso.
  • Per eseguire la migrazione di un ricevitore, è necessario un file YAML o JSON Prometheus Alertmanager contenente il ricevitore.

Google Cloud non supporta la migrazione delle regole di registrazione Prometheus. Per utilizzare le regole di registrazione, ti consigliamo di utilizzare uno strumento di valutazione delle regole con deployment autonomo.

Crea un criterio di avviso da un file di configurazione Prometheus

Per creare un criterio di avviso da un file di configurazione Prometheus, esegui questo comando. Puoi creare più criteri di avviso fornendo più percorsi di file:

gcloud alpha monitoring policies migrate \
--policies-from-prometheus-alert-rules-yaml=PATH_TO_FILE_1,PATH_TO_FILE_2

Creare canali di notifica da un file di configurazione di Prometheus Alertmanager

Per creare canali di notifica da un file di configurazione di avviso Prometheus, esegui questo comando:

gcloud alpha monitoring policies migrate \
--channels-from-prometheus-alertmanager-yaml=PATH_TO_FILE

Creare contemporaneamente criteri di avviso e canali di notifica

Per creare criteri di avviso dai file di configurazione Prometheus e creare contemporaneamente canali di notifica da un file di configurazione Prometheus Alertmanager, esegui questo comando:

gcloud alpha monitoring policies migrate \
--policies-from-prometheus-alert-rules-yaml=PATH_TO_FILE_1,PATH_TO_FILE_2 \
--channels-from-prometheus-alertmanager-yaml=PATH_TO_FILE

Esempio

Hai un file di configurazione Prometheus con una regola di avviso che invia un avviso quando l'utilizzo della CPU rimane superiore al 75% per un minuto. La regola di avviso è configurata come segue:

groups:
- name: Utilization_Alerts
  interval: 30s
  rules:
  - alert: CPU_Utilization_Over_75
    expr: compute_googleapis_com:instance_cpu_utilization > 75
    for: 60s
    labels:
      severity: page
    annotations:
      subject: "Subject: ${metric.label.value}"
      description: "CPU utilization is over 75%"

Hai anche un file AlertManager Prometheus che contiene email, PagerDuty e destinatari webhook.

receivers:
- name: 'team-emails'
  email_configs:
  - to: EMAIL_ADDRESS
- name: 'team-pager'
  pagerduty_configs:
  - service_key: SERVICE_KEY
- name: 'team-webhook'
  webhook_configs:
  - url: WEBHOOK_ADDRESS

Per creare il criterio di avviso e il canale di notifica, esegui questo comando:

gcloud alpha monitoring policies migrate \
--policies-from-prometheus-alert-rules-yaml=PATH_TO_CONFIG_FILE \
--channels-from-prometheus-alertmanager-yaml=PATH_TO_ALERTMANAGER_FILE

gcloud CLI crea quindi un criterio di avviso come l'esempio seguente:

  {
  "name": "projects/PROJECT_ID/alertPolicies/POLICY_ID",
  "displayName": "Utilization_Alerts/CPU_Utilization_Over_75",
  "documentation": {
    "content": "CPU utilization is over 75%",
    "mimeType": "text/markdown",
    "subject": "Subject: ${metric.label.value}"
  },
  "userLabels": {},
  "conditions": [
    {
      "name": "projects/PROJECT_ID/alertPolicies/POLICY_ID/conditions/CONDITION_ID",
      "displayName": "CPU_Utilization_Over_75"
      "conditionPrometheusQueryLanguage": {
        "alertRule": "CPU_Utilization_Over_75",
        "duration": "60s",
        "evaluationInterval": "30s",
        "labels": {
          "severity": "page"
        },
        "query": "compute_googleapis_com:instance_cpu_utilization > 75",
        "ruleGroup": "Utilization_Alerts"
      }
    }
  ],
  "alertStrategy": {},
  "combiner": "OR",
  "enabled": true,
  "notificationChannels": [
    "projects/google.com:PROJECT_ID/notificationChannels/CHANNEL_ID_1",
    "projects/google.com:PROJECT_ID/notificationChannels/CHANNEL_ID_2",
    "projects/google.com:PROJECT_ID/notificationChannels/CHANNEL_ID_3"
  ]
}

Esegui la migrazione delle regole di avviso da Managed Service per Prometheus

Google Cloud configura la valutazione delle regole gestite per Managed Service per Prometheus utilizzando le risorse personalizzate Rules, ClusterRules e GlobalRules.

Per eseguire la migrazione di queste risorse a un criterio di avviso di Google Cloud con una condizione basata su PromQL, segui questi passaggi:

  1. Copia la sezione groups della risorsa personalizzata in un nuovo file delle regole Prometheus.

  2. Esegui la migrazione del file delle regole utilizzando gcloud CLI.

Ad esempio, hai la seguente risorsa personalizzata di regole:

apiVersion: monitoring.googleapis.com/v1
kind: Rules
metadata:
  namespace: NAMESPACE_NAME
  name: example-rules
spec:
  groups:
  - name: example
    interval: 30s
    rules:
    - alert: FewerThanTenInstancesUp
      expr: sum(up) < 10

Il file di regole Prometheus creato copiando groups dalla risorsa personalizzata Regole precedente è simile al seguente:

  groups:
  - name: example
    interval: 30s
    rules:
    - alert: FewerThanTenInstancesUp
      expr: sum(up) < 10

Esegui la migrazione di più risorse personalizzate delle regole

Se desideri eseguire la migrazione di più regole, regole personalizzate o regole globali, ti consigliamo di creare e migrare un file di regole separato per ogni risorsa. Per ulteriori informazioni, consulta la documentazione di Prometheus.

Gestire espressioni di filtro e aggregazione

Le regole e ClusterRules filtrano automaticamente le espressioni di avviso di Prometheus in base a determinate etichette. Per preservare questo comportamento nella query di un criterio di avviso migrato, devi includere esplicitamente queste etichette in un filtro o in un'espressione di aggregazione del file delle regole di Prometheus prima di eseguire la migrazione del file.

Ad esempio, lo strumento di valutazione delle regole gestite per Managed Service per Prometheus esegue l'espressione sum(up) < 10 nel seguente modo:

sum(up{project_id="test-project", cluster="test-cluster", namespace="NAMESPACE_NAME"}) < 10

Tuttavia, se un criterio di avviso include la query PromQL sum(up) < 10, Cloud Monitoring esegue la query come solo sum(up) < 10. Questa query viene applicata a ogni progetto, cluster e spazio dei nomi Google Cloud nell'ambito delle metriche. Per evitare questo comportamento, ti consigliamo di aggregare la query per etichette per assicurarti che Cloud Monitoring esegua la query come previsto. Ad esempio, quando crei il file di regole dalla risorsa personalizzata Regole, puoi modificare sum(up) < 10 nella seguente espressione:

sum (up) by (project_id, cluster, namespace) < 10

L'espressione precedente genera una serie temporale separata per ogni progetto, cluster e spazio dei nomi Google Cloud, quindi confronta ogni serie temporale con la soglia di avviso pari a <10.

La tabella seguente mostra l'ordine di valutazione dei filtri di espressione di avviso per regole e ClusterRules:

Tipo di risorsa regola Filtra etichette
Regola
  1. project_id
  2. cluster
  3. namespace
ClusterRule
  1. project_id
  2. cluster

Per ulteriori informazioni sul comportamento dei filtri nelle espressioni Prometheus, consulta Selettori di vettori istantanei.