Valutazione di regole e avvisi con raccolta di cui è stato eseguito il deployment autonomo

Questo documento descrive una configurazione per la valutazione di regole e avvisi in un deployment di Managed Service for Prometheus che utilizza la raccolta di cui è stato eseguito il deployment autonomo.

Il seguente diagramma illustra un deployment che utilizza più cluster in due progetti Google Cloud e utilizza la valutazione di regole e avvisi:

Un deployment per la valutazione di regole e avvisi che utilizza la raccolta con deployment autonomo.

Per configurare e utilizzare un deployment come quello nel diagramma, tieni presente quanto segue:

  • Le regole vengono installate all'interno di ogni server di raccolta Managed Service for Prometheus, proprio come quando vengono utilizzati Prometheus standard. La valutazione delle regole viene eseguita in base ai dati archiviati localmente su ciascun server. I server sono configurati per conservare i dati abbastanza a lungo da coprire il periodo di ricerca di tutte le regole, che in genere non supera l'ora. I risultati delle regole vengono scritti in monarca dopo la valutazione,

  • Viene eseguito manualmente il deployment di un'istanza Prometheus AlertManager in ogni singolo cluster. I server Prometheus vengono configurati modificando il campo alertmanager_config del file di configurazione per inviare le regole di avviso attivate alla loro istanza AlertManager locale. I silenzi, le conferme e i flussi di lavoro di gestione degli incidenti vengono in genere gestiti in uno strumento di terze parti come PagerDuty.

    Puoi centralizzare la gestione degli avvisi in più cluster in un unico AlertManager utilizzando una risorsa endpoint Kubernetes.

  • Un unico cluster in esecuzione in Google Cloud è designato come cluster di valutazione delle regole globali per un ambito di metriche. Il deployment del valutatore autonomo delle regole viene eseguito in quel cluster e le regole vengono installate utilizzando il formato file file della regola Prometheus standard.

    Il valutatore della regola autonomo è configurato per utilizzare ambito_project_A, che contiene i progetti 1 e 2. Le regole eseguite in base a scopeng_project_A vengono automaticamente aggiunte ai progetti 1 e 2. All'account di servizio sottostante devono essere concesse le autorizzazioni di Monitoring Visualizzatore per ambitong_project_A.

    La valutazione della regola è configurata per l'invio di avvisi al Prometheus AlertManager locale utilizzando il campo alertmanager_config del file di configurazione.

L'utilizzo di una valuta globale con deployment automatico può avere effetti imprevisti, a seconda che tu mantenga o aggreghi le etichette project_id, location, cluster e namespace nelle regole:

  • Se le tue regole mantengono l'etichetta project_id (utilizzando una clausola by(project_id)), i risultati delle regole vengono scritti di nuovo su Monarc utilizzando il valore project_id originale della serie temporale sottostante.

    In questo scenario, devi assicurarti che l'account di servizio sottostante disponga delle autorizzazioni Monitoring Metric Writer per ogni progetto monitorato in scopeng_project_A. Se aggiungi un nuovo progetto monitorato a scopeng_project_A, devi anche aggiungere manualmente una nuova autorizzazione all'account di servizio.

  • Se le tue regole non conservano l'etichetta project_id (non utilizzando una clausola by(project_id)), i risultati delle regole vengono scritti di nuovo su Monarc utilizzando il valore project_id del cluster in cui è in esecuzione il valutatore della regola globale.

    In questo scenario, non è necessario modificare ulteriormente l'account di servizio sottostante.

  • Se le tue regole conservano l'etichetta location (utilizzando una clausola by(location)), i risultati delle regole vengono scritti di nuovo su Monarch utilizzando ogni area geografica Google Cloud originale da cui ha avuto origine la serie temporale sottostante.

    Se le tue regole non conservano l'etichetta location, i dati vengono scritti nella posizione del cluster in cui è in esecuzione il valutatore della regola globale.

Ti consigliamo vivamente di mantenere le etichette cluster e namespace nei risultati di valutazione delle regole, quando possibile. In caso contrario, il rendimento delle query potrebbe diminuire e potresti riscontrare limiti di cardinalità. È sconsigliato rimuovere entrambe le etichette.