Questo documento descrive una configurazione per la valutazione di regole e avvisi in un deployment di Managed Service for Prometheus che utilizza la raccolta di cui è stato eseguito il deployment autonomo.
Il seguente diagramma illustra un deployment che utilizza più cluster in due progetti Google Cloud e utilizza la valutazione di regole e avvisi:
Per configurare e utilizzare un deployment come quello nel diagramma, tieni presente quanto segue:
Le regole vengono installate all'interno di ogni server di raccolta Managed Service for Prometheus, proprio come quando vengono utilizzati Prometheus standard. La valutazione delle regole viene eseguita in base ai dati archiviati localmente su ciascun server. I server sono configurati per conservare i dati abbastanza a lungo da coprire il periodo di ricerca di tutte le regole, che in genere non supera l'ora. I risultati delle regole vengono scritti in monarca dopo la valutazione,
Viene eseguito manualmente il deployment di un'istanza Prometheus AlertManager in ogni singolo cluster. I server Prometheus vengono configurati modificando il campo
alertmanager_config
del file di configurazione per inviare le regole di avviso attivate alla loro istanza AlertManager locale. I silenzi, le conferme e i flussi di lavoro di gestione degli incidenti vengono in genere gestiti in uno strumento di terze parti come PagerDuty.Puoi centralizzare la gestione degli avvisi in più cluster in un unico AlertManager utilizzando una risorsa endpoint Kubernetes.
Un unico cluster in esecuzione in Google Cloud è designato come cluster di valutazione delle regole globali per un ambito di metriche. Il deployment del valutatore autonomo delle regole viene eseguito in quel cluster e le regole vengono installate utilizzando il formato file file della regola Prometheus standard.
Il valutatore della regola autonomo è configurato per utilizzare ambito_project_A, che contiene i progetti 1 e 2. Le regole eseguite in base a scopeng_project_A vengono automaticamente aggiunte ai progetti 1 e 2. All'account di servizio sottostante devono essere concesse le autorizzazioni di Monitoring Visualizzatore per ambitong_project_A.
La valutazione della regola è configurata per l'invio di avvisi al Prometheus AlertManager locale utilizzando il campo
alertmanager_config
del file di configurazione.
L'utilizzo di una valuta globale con deployment automatico può avere effetti imprevisti, a seconda che tu mantenga o aggreghi le etichette project_id
, location
, cluster
e namespace
nelle regole:
Se le tue regole mantengono l'etichetta
project_id
(utilizzando una clausolaby(project_id)
), i risultati delle regole vengono scritti di nuovo su Monarc utilizzando il valoreproject_id
originale della serie temporale sottostante.In questo scenario, devi assicurarti che l'account di servizio sottostante disponga delle autorizzazioni Monitoring Metric Writer per ogni progetto monitorato in scopeng_project_A. Se aggiungi un nuovo progetto monitorato a scopeng_project_A, devi anche aggiungere manualmente una nuova autorizzazione all'account di servizio.
Se le tue regole non conservano l'etichetta
project_id
(non utilizzando una clausolaby(project_id)
), i risultati delle regole vengono scritti di nuovo su Monarc utilizzando il valoreproject_id
del cluster in cui è in esecuzione il valutatore della regola globale.In questo scenario, non è necessario modificare ulteriormente l'account di servizio sottostante.
Se le tue regole conservano l'etichetta
location
(utilizzando una clausolaby(location)
), i risultati delle regole vengono scritti di nuovo su Monarch utilizzando ogni area geografica Google Cloud originale da cui ha avuto origine la serie temporale sottostante.Se le tue regole non conservano l'etichetta
location
, i dati vengono scritti nella posizione del cluster in cui è in esecuzione il valutatore della regola globale.
Ti consigliamo vivamente di mantenere le etichette cluster
e namespace
nei risultati di valutazione delle regole, quando possibile. In caso contrario, il rendimento delle query potrebbe
diminuire e potresti riscontrare limiti di cardinalità. È sconsigliato rimuovere entrambe le etichette.