Le policy dell'agente consentono l'installazione e la manutenzione automatizzate degli agenti Google Cloud Observability in un gruppo di VM Compute Engine che corrispondono ai criteri specificati dall'utente. Puoi creare una policy per un progettoGoogle Cloud che gestisce le VM esistenti e nuove associate a quel progettoGoogle Cloud , garantendo l'installazione, la disinstallazione e l'upgrade automatico facoltativo di tutti gli agenti Google Cloud Observability su queste VM.
Puoi creare e gestire le policy dell'agente utilizzando il gruppo di comandi gcloud beta compute instances ops-agents policies
in Google Cloud CLI o il modulo Terraform agent-policy
.
Le policy dell'agente utilizzano la suite di strumenti VM Manager in Compute Engine per gestire le policy del sistema operativo, che possono automatizzare il deployment e la manutenzione delle configurazioni software come gli agenti Google Cloud Observability: l'Ops Agent, l'agente Monitoring legacy e l'agente Logging legacy.
Sistemi operativi supportati
Puoi applicare una policy dell'agente alle istanze VM di Compute Engine che eseguono i sistemi operativi mostrati nella tabella seguente:
Sistema operativo | Ops Agent
(norme GA e beta†) |
Agente Logging
(solo per le norme beta†) |
Agente Monitoring
(solo criteri beta†) |
---|---|---|---|
CentOS 8 | |||
Rocky Linux 8 | |||
RHEL 6 | |||
RHEL 7: rhel-7, rhel-7-6-sap-ha, rhel-7-7-sap-ha, rhel-7-9-sap-ha |
‡ | ||
RHEL 8: rhel-8, rhel-8-4-sap-ha, rhel-8-6-sap-ha, rhel-8-8-sap-ha |
‡ | ||
Debian 9 (Stretch) | |||
Debian 11 (Bullseye) | |||
Deep Learning VM Images basate su Debian 11 (Bullseye) | |||
Ubuntu LTS 18.04 (Bionic Beaver): ubuntu-1804-lts, ubuntu-minimal-1804-lts |
|||
Ubuntu LTS 20.04 (Focal Fossa): ubuntu-2004-lts, ubuntu-minimal-2004-lts |
|||
Ubuntu LTS 22.04 (Jammy Jellyfish): buntu-2204-lts, ubuntu-minimal-2204-lts |
|||
SLES 12: sles-12, sles-12-sp5-sap |
|||
SLES 15: sles-15, sles-15-sp2-sap, sles-15-sp3-sap, sles-15-sp4-sap, sles-15-sp5-sap, sles-15-sp6-sap |
|||
OpenSUSE Leap 15: opensuse-leap (opensuse-leap-15-3-*, opensuse-leap-15-4-*) |
|||
Windows Server: 2016, 2019, 2022, Core 2016, Core 2019, Core 2022 |
gcloud beta compute instances ops-agents policies
create
:
- Ops Agent viene mappato al tipo di agente
ops-agent
. - Logging agent viene mappato al tipo di agente
logging
. - Agente Monitoring corrisponde al tipo di agente
metrics
.
rhel-7-9-sap-ha
, rhel-8-2-sap-ha
o
rhel-8-4-sap-ha
.
Crea una policy dell'agente
Questa sezione descrive l'utilizzo di Google Cloud SDK per la gestione delle policy degli agenti. Per informazioni sull'utilizzo di Terraform, consulta Integrazione di Terraform.
Per creare una policy dell'agente utilizzando Google Cloud CLI, completa i seguenti passaggi:
Se non l'hai ancora fatto, installa Google Cloud CLI.
I criteri dell'agente descritti in questo documento utilizzano il gruppo di comandi
beta
.Se non l'hai ancora fatto, installa il componente
beta
di gcloud CLI:gcloud components install beta
Per verificare se è installato il componente
beta
, esegui:gcloud components list
Se hai già installato il componente
beta
, assicurati di avere l'ultima versione:gcloud components update
Scarica e utilizza il seguente script per abilitare le API e impostare le autorizzazioni appropriate per l'utilizzo di Google Cloud CLI:
set-permissions.sh
.Per informazioni sullo script, consulta Lo script
set-permissions.sh
.Utilizza il comando
gcloud beta compute instances ops-agents policies
create
per creare una policy. Per la sintassi del comando, consulta la documentazionegcloud beta compute instances ops-agents policies
create
.Per esempi che mostrano come formattare il comando, consulta la sezione Esempi nella documentazione di Google Cloud CLI.
Per maggiori informazioni sugli altri comandi del gruppo di comandi e sulle opzioni disponibili, consulta la documentazione
gcloud beta compute instances ops-agents policies
.
Best practice per l'utilizzo dei criteri degli agenti
Per controllare l'impatto sui sistemi di produzione durante l'implementazione, ti consigliamo di utilizzare le etichette e le zone delle istanze per filtrare le istanze a cui si applica il criterio.
Di seguito è riportato un esempio di piano di implementazione graduale per le VM Debian 11 in un progetto
chiamato my_project
:
Fase 1: crea una policy denominata ops-agents-policy-safe-rollout
per installare l'agente Logging e l'agente Monitoring legacy su tutte le VM con le etichette env=test
e app=myproduct
.
gcloud beta compute instances \
ops-agents policies create ops-agents-policy-safe-rollout \
--agent-rules="type=logging,version=current-major,package-state=installed,enable-autoupgrade=true;type=metrics,version=current-major,package-state=installed,enable-autoupgrade=true" \
--os-types=short-name=debian,version=11 \
--group-labels=env=test,app=myproduct \
--project=my_project
Per saperne di più su come specificare il sistema operativo, vedi
gcloud beta compute instances ops-agents policies
create
.
Fase 2: aggiorna la policy in modo che abbia come target le VM in una singola zona con le etichette env=prod
e app=myproduct
.
gcloud beta compute instances \
ops-agents policies update ops-agents-policy-safe-rollout \
--group-labels=env=prod,app=myproduct \
--zones=us-central1-c \
Fase 3: aggiorna le norme per cancellare il filtro delle zone in modo che vengano implementate a livello globale
gcloud beta compute instances \
ops-agents policies update ops-agents-policy-safe-rollout \
--clear-zones
Policy sulle VM precedenti a OS Config
Potrebbe essere necessario installare e configurare manualmente l'agente OS Config sulle VM precedenti a OS Config. Per informazioni sull'installazione e la verifica manuale dell'agente OS Config, consulta l'elenco di controllo per la verifica di VM Manager.
Risolvere i problemi relativi ai criteri dell'agente beta
Questa sezione fornisce informazioni per aiutarti a risolvere i problemi relativi ai criteri dell'agente beta per Ops Agent, l'agente Monitoring legacy e l'agente Logging legacy.
I comandi ops-agents policy
non vanno a buon fine
Quando un comando gcloud beta compute instances ops-agents policies
non va a buon fine, la risposta mostra un
errore di convalida. Correggi gli errori modificando gli argomenti e i flag del comando come suggerito dal messaggio di errore.
Oltre agli errori di convalida, potresti visualizzare errori che indicano le seguenti condizioni:
Le sezioni seguenti descrivono in modo più dettagliato queste condizioni.
Autorizzazione IAM insufficiente
Se un comando gcloud beta compute instances ops-agents policies
non va a buon fine e viene visualizzato un errore di autorizzazione, assicurati di aver eseguito lo script set-permissions.sh
come descritto in Creare una policy dell'agente per configurare i ruoli della policy OS Config:
-
GuestPolicy Admin (
roles/osconfig.guestPolicyAdmin
): Fornisce l'accesso completo alle policy guest. -
Editor GuestPolicy (
roles/osconfig.guestPolicyEditor
): Consente agli utenti di ottenere, aggiornare ed elencare le policy guest. -
GuestPolicy Viewer (
roles/osconfig.guestPolicyViewer
): fornisce l'accesso di sola lettura per ottenere ed elencare le policy guest.
Per saperne di più sullo script set-permissions.sh
, consulta
Lo script set-permissions.sh
.
L'API OS Config non è abilitata
Un esempio di errore è il seguente:
API [osconfig.googleapis.com] not enabled on project PROJECT_ID.
Would you like to enable and retry (this will take a few minutes)?
(y/N)?
Puoi inserire y
per abilitare l'API oppure eseguire lo script set-permissions.sh
, descritto in Creare un criterio dell'agente, per concedere tutte le autorizzazioni necessarie. Se inserisci y
al prompt nel messaggio di errore, devi comunque eseguire lo script set-permissions.sh
per impostare le autorizzazioni necessarie.
Per verificare che l'API OS Config sia abilitata per il progetto, esegui i seguenti comandi:
gcloud services list --project PROJECT_ID | grep osconfig.googleapis.com
Di seguito è riportato l'output previsto:
osconfig.googleapis.com Cloud OS Config API
La norma esiste già
Un esempio di errore è il seguente:
ALREADY_EXISTS: Requested entity already exists
Questo errore indica che la norma esiste già con lo stesso nome, ID progetto e regione. Puoi utilizzare il comando gcloud beta compute instances ops-agents policies
describe
per confermarlo.
Il criterio non esiste
Un esempio di errore è il seguente:
NOT_FOUND: Requested entity was not found
Questo errore potrebbe significare che il criterio non è mai stato creato, che è stato eliminato o che l'ID criterio specificato non è corretto. Assicurati che l'elemento
POLICY_ID utilizzato in un comando gcloud beta compute instances ops-agents policies
describe
, update
o
delete
corrisponda a una policy esistente. Per ottenere un elenco delle policy
dell'agente, utilizza il comando gcloud beta compute instances ops-agents policies
list
.
Il criterio viene creato, ma sembra non avere effetto
Gli agenti OS Config vengono implementati in ogni istanza Compute Engine per gestire i pacchetti per gli agenti Logging e Monitoring. Il criterio potrebbe sembrare non avere effetto se l'agente OS Config sottostante non è installato.
Linux
Per verificare che l'agente OS Config sia installato, esegui questo comando:
gcloud compute ssh instance-id \
--project project-id \
-- sudo systemctl status google-osconfig-agent
Un output di esempio è:
google-osconfig-agent.service - Google OSConfig Agent
Loaded: loaded (/lib/systemd/system/google-osconfig-agent.service; enabled; vendor preset:
Active: active (running) since Wed 2020-01-15 00:14:22 UTC; 6min ago
Main PID: 369 (google_osconfig)
Tasks: 8 (limit: 4374)
Memory: 102.7M
CGroup: /system.slice/google-osconfig-agent.service
└─369 /usr/bin/google_osconfig_agent
Windows
Per verificare che l'agente OS Config sia installato, esegui i seguenti passaggi:
Connettiti all'istanza utilizzando RDP o uno strumento simile e accedi a Windows.
Apri un terminale PowerShell, quindi esegui il seguente comando PowerShell. Non sono necessari privilegi amministrativi.
Get-Service google_osconfig_agent
Un output di esempio è:
Status Name DisplayName
------ ---- -----------
Running google_osconfig_a… Google OSConfig Agent
Se l'agente OS Config non è installato, potresti utilizzare un sistema operativo che non supporta VM Manager. Il documento Dettagli del sistema operativo di Compute Engine indica quali funzionalità di VM Manager sono supportate per ogni sistema operativo Compute Engine.
Se il sistema operativo supporta VM Manager, puoi installare l'agente OS Config manualmente.
L'agente OS Config è installato, ma non installa l'agente Monitoring
Per verificare se si verificano errori quando l'agente OS Config applica i criteri, puoi controllare il log dell'agente OS Config. Puoi farlo utilizzando Esplora log o SSH o RDP per controllare le singole istanze di Compute Engine.
Per visualizzare i log dell'agente OS Config in Esplora log, utilizza il seguente filtro:
resource.type="gce_instance"
logId(OSConfigAgent)
Per visualizzare i log dell'agente OS Config:
CentOS, RHEL,
SLES, SUSE
Esegui questo comando:
gcloud compute ssh INSTANCE_ID \
--project PROJECT_ID \
-- sudo cat /var/log/messages \
| grep "OSConfigAgent\|google-fluentd\|stackdriver-agent"
Debian, Ubuntu
Esegui questo comando:
gcloud compute ssh INSTANCE_ID \
--project PROJECT_ID \
-- sudo cat /var/log/syslog \
| grep "OSConfigAgent\|google-fluentd\|stackdriver-agent"
Windows
Connettiti all'istanza utilizzando RDP o uno strumento simile e accedi a Windows.
Apri l'app Visualizzatore eventi, quindi seleziona Registri di Windows > Applicazione e cerca i log con
Source
uguale aOSConfigAgent
.
Se si verifica un errore durante la connessione al servizio OS Config, assicurati di eseguire lo script set-permissions.sh
come descritto in Creare un criterio dell'agente per configurare i metadati di OS Config.
Per verificare che i metadati di OS Config siano abilitati, puoi eseguire il seguente comando:
gcloud compute project-info describe \
--project PROJECT_ID \
| grep "enable-osconfig\|enable-guest-attributes" -A 1
Di seguito è riportato l'output previsto:
- key: enable-guest-attributes
value: 'TRUE'
- key: enable-osconfig
value: 'TRUE'
Gli agenti di osservabilità sono installati, ma non funzionano correttamente
Per informazioni sul debug di agenti specifici, consulta i seguenti documenti:
- Risolvere i problemi relativi all'agente operativo
- Risolvere i problemi dell'agente Logging legacy
- Risolvere i problemi relativi all'agente Monitoring legacy
Attiva i log a livello di debug per l'agente OS Config
Può essere utile attivare la registrazione a livello di debug nell'agente OS Config quando segnali un problema.
Puoi impostare i metadati osconfig-log-level: debug
per attivare il logging a livello di debug per l'agente OS Config. I log raccolti contengono più informazioni per
aiutare le indagini.
Per attivare la registrazione a livello di debug per l'intero progetto, esegui questo comando:
gcloud compute project-info add-metadata \
--project PROJECT_ID \
--metadata osconfig-log-level=debug
Per attivare la registrazione a livello di debug per una VM, esegui questo comando:
gcloud compute instances add-metadata INSTANCE_ID \
--project PROJECT_ID \
--metadata osconfig-log-level=debug
Script di supporto
Questa sezione fornisce ulteriori informazioni sugli script helper descritti in questo documento:
Lo script set-permissions.sh
Dopo aver scaricato lo script set-permissions.sh
, puoi utilizzarlo per eseguire le seguenti azioni, in base agli argomenti che fornisci:
Abilita l'API Cloud Logging, l'API Cloud Monitoring e l'API OS Config per il progetto.
Concedi i ruoli Identity and Access Management Scrittore log (
roles/logging.logWriter
) e Scrittore metriche Monitoring (roles/monitoring.metricWriter
) al service account predefinito di Compute Engine in modo che gli agent possano scrivere log e metriche nelle API Logging e Cloud Monitoring.Abilita i metadati di OS Config per il progetto in modo che l'agente OS Config su ogni VM sia attivo.
Concedi uno dei seguenti ruoli IAM all'utente o al account di servizio non proprietario necessario per creare e gestire i criteri. I proprietari del progetto hanno accesso completo per creare e gestire le policy; a tutti gli altri utenti o service account deve essere concesso uno dei seguenti ruoli:
-
GuestPolicy Admin (
roles/osconfig.guestPolicyAdmin
): Fornisce l'accesso completo alle policy guest. -
Editor GuestPolicy (
roles/osconfig.guestPolicyEditor
): Consente agli utenti di ottenere, aggiornare ed elencare le policy guest. -
GuestPolicy Viewer (
roles/osconfig.guestPolicyViewer
): fornisce l'accesso di sola lettura per ottenere ed elencare le policy guest.
Quando esegui lo script, devi specificare solo la parte
guestPolicy*
del nome del ruolo. Lo script fornisce la parteroles/osconfig.
del nome.-
GuestPolicy Admin (
Gli esempi riportati di seguito mostrano alcune invocazioni comuni per lo script. Per ulteriori informazioni, consulta i commenti nello script.
Per abilitare le API, concedi i ruoli necessari al account di servizio predefinito e abilita i metadati di OS Config per un progetto, esegui lo script nel seguente modo:
bash set-permissions.sh --project=PROJECT_ID
Per concedere inoltre uno dei ruoli OS Config a un utente che non dispone del ruolo Proprietario (roles/owner
) nel progetto, esegui lo script nel seguente modo:
bash set-permissions.sh --project=PROJECT_ID \ --iam-user=USER_EMAIL \ --iam-permission-role=guestPolicy[Admin|Editor|Viewer]
Per concedere uno dei ruoli OS Config a un account di servizio non predefinito, esegui lo script nel seguente modo:
bash set-permissions.sh --project=PROJECT_ID \ --iam-service-account=SERVICE_ACCT_EMAIL \ --iam-permission-role=guestPolicy[Admin|Editor|Viewer]
Lo script diagnose.sh
Dato un ID progetto, un ID istanza Compute Engine e l'ID policy dell'agente, lo script diagnose.sh
raccoglie automaticamente le informazioni necessarie per diagnosticare i problemi relativi alla policy:
- La versione dell'agente OS Config
- La policy guest OS Config sottostante
- Le norme applicabili a questa istanza Compute Engine
- I repository dei pacchetti dell'agente estratti in questa istanza Compute Engine
Per richiamare lo script, esegui questo comando:
bash diagnose.sh --project-id=PROJECT_ID \ --gce-instance-id=INSTANCE_ID \ --policy-id=POLICY_ID
Integrazione di Terraform
Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base. Per informazioni su come funziona Terraform, consulta Utilizzo di Terraform.
Il supporto di Terraform per i criteri degli agenti si basa sui comandi della Google Cloud CLI. Per creare una policy dell'agente utilizzando Terraform, segui le istruzioni del modulo Terraform agent-policy
.
Puoi trovare esempi di norme anche nella
directory examples
.