Configura Cloud Monitoring con un agente autonomo

Cloud Monitoring ti aiuta a ottenere visibilità su prestazioni, disponibilità e integrità delle tue applicazioni e della tua infrastruttura. Puoi utilizzare Cloud Monitoring e altre parti dell'osservabilità di Google Cloud per monitorare, risolvere i problemi e gestire i servizi VMware Engine su larga scala.

La configurazione dell'inoltro delle metriche viene definita separatamente per ogni cloud privato utilizzando un agente autonomo. Ogni cloud privato richiede un agente separato, ospitato in una VM Compute Engine o in una VM VMware.

Dopo aver attivato correttamente l'inoltro delle metriche, puoi visualizzarle in Metrics Explorer di Cloud Monitoring. I tipi di risorse e le metriche di VMware Engine iniziano con external.googleapis.com/vmware/vcenter e il FQDN di vCenter è contrassegnato come parte dello spazio dei nomi.

Prima di iniziare

I passaggi descritti in questo documento presuppongono che tu abbia prima eseguito quanto segue:

  1. Abilita l'API Cloud Monitoring
  2. Identifica un account utente della soluzione da utilizzare con l'agente autonomo e imposta una password efficace per l'account utente della soluzione.
  3. Crea una VM Compute Engine o una VM VMware da utilizzare come host per l'agente autonomo. Le VM Compute Engine devono trovarsi in una rete VPC (Virtual Private Cloud) con peering con la rete VPC del cloud privato contenente le risorse da monitorare.

    Per un esempio di creazione di una VM Compute Engine, consulta la Guida rapida all'utilizzo di una VM Linux di Compute Engine. Per un esempio di creazione di una VM VMware, consulta Creare una VM VMware.

Se utilizzi una VM Compute Engine per ospitare l'agente autonomo, Google gestisce la rotazione della chiave per l'account di servizio a cui ti connetti. Tuttavia, può essere conveniente creare una VM VMware se disponi di capacità inutilizzata nel tuo cloud privato e non ti dispiace gestire autonomamente la rotazione della chiave.

Indipendentemente da dove crei la VM host dell'agente, deve soddisfare i seguenti requisiti:

Requisiti

La VM host dell'agente deve soddisfare i seguenti requisiti di sistema:

  • Sistemi operativi Linux supportati:
    • CentOS 6, 7 o 8
    • Red Hat Enterprise Linux 6, 7 o 8
    • SLES 12 o 15
    • Ubuntu 14, 16, 18 o 19
  • Almeno 4 GB di RAM
  • Spazio di installazione di 300 MB disponibile
  • Directory di installazione impostata su /opt/bpagent
  • Utilità CLI curl installata

La VM host dell'agente deve inoltre avere accesso ai seguenti indirizzi per raccogliere e inviare metriche e log:

  • Porta 443 (TCP) per la connessione HTTPS al server vCenter (valore predefinito)
  • monitoring.googleapis.com:443 (external access)
  • logging.googleapis.com:443 (external access)

Attivazione del forwarding delle metriche

La procedura per configurare la VM host dell'agente e attivare l'inoltro delle metriche consiste nei seguenti passaggi:

  1. Installa l'agente sulla VM
  2. Specifica un account di servizio
  3. Configurare l'agente in modo che acceda al tuo cloud privato per le metriche
  4. Configurare l'agente in modo che acceda all'account di servizio per i report
  5. Raccogliere metriche e log
  6. Configurare un cloud privato per l'inoltro syslog

Installazione dell'agente autonomo

Per installare l'agente sulla VM host:

  1. Connettiti alla VM host dell'agente.
  2. Esegui lo script di installazione da remoto:

    sudo sh -c "$(curl -S https://storage.googleapis.com/gcve-observability-agent/latest/vmware-linux-amd64/installer/install.sh)"
    

Per i sistemi in cui la VM host dell'agente potrebbe non avere accesso alla rete esterna, puoi scaricare l'agente e lo script di installazione utilizzando i seguenti comandi:

  • Per ottenere l'agente autonomo, esegui quanto segue:

    curl -S https://storage.googleapis.com/gcve-observability-agent/latest/vmware-linux-amd64/artifacts/bpagent-headless-vmware.tar.gz > agent.tar.gz
    
  • Per ottenere lo script di installazione, esegui quanto segue:

    curl -S https://storage.googleapis.com/gcve-observability-agent/latest/vmware-linux-amd64/installer/install.sh > install.sh
    
  • Per installare l'agente, esegui quanto segue sulla VM host dell'agente:

    sudo sh install.sh agent.tar.gz
    

Specifica un account di servizio personalizzato

Per inoltrare i dati dall'agente a Cloud Monitoring è necessario un account di servizio del tuo progetto Google Cloud. Questo account di servizio deve avere il ruolo Amministratore monitoraggio per le metriche e il ruolo Scrittore log per i log.

Se non hai un account di servizio per il monitoraggio e la registrazione delle applicazioni, creane uno:

  1. Nella console Google Cloud, vai a IAM e amministrazione > Account di servizio.

    Vai a Service account

  2. Fai clic su Crea account di servizio.

  3. Inserisci un nome, un ID e una descrizione per l'account di servizio. Ti consigliamo di ricordare che l'account viene utilizzato per l'integrazione dell'agente.

  4. Fai clic su Crea e continua.

  5. In Ruolo, seleziona Monitoring Admin.

  6. In Ruolo, seleziona Logs Writer.

  7. Fai clic su Continua.

  8. Fai clic su Fine.

Se hai creato una VM VMware come VM host dell'agente, recupera la chiave privata dell'account di servizio per poterla utilizzare per configurare l'agente:

  1. Nella console Google Cloud, vai a IAM e amministrazione > Account di servizio.

    Vai a Service account

  2. Trova il tuo account di servizio nell'elenco degli account di servizio.

  3. Nella colonna Azioni, fai clic sul menu delle azioni dell'account di servizio e seleziona Gestisci chiavi.

  4. Fai clic su Aggiungi chiave e seleziona Crea nuova chiave.

  5. Seleziona il tipo di chiave JSON e fai clic su Crea.

  6. Apri il file JSON generato e copia l'intero contenuto del file. La raccolta delle metriche e la raccolta dei log utilizzano entrambi lo stesso file della chiave JSON.

  7. Nella VM host dell'agente, copia il file della chiave JSON nella directory/opt/bpagent/config/destinations/google_cloud.

Configura l'agente in modo che acceda al tuo cloud privato per le metriche

L'agente autonomo deve accedere al tuo cloud privato per raccogliere le metriche. Nella VM host dell'agente, configura l'accesso copiando e configurando il file vmware_vcenter.yaml:

  1. Copia vmware_vcenter.yaml nella directory config/metrics/sources:

    cp /opt/bpagent/config/metrics/examples/vmware_vcenter.yaml /opt/bpagent/config/metrics/sources
    
  2. Modifica vmware_vcenter.yaml in modo che corrisponda alle informazioni nell'ambiente VMware Engine:

    collection_interval: 1m0s
    connection_info:
    connection_timeout: "30"
    enable_performance_counters: "true"
    host: VCSA_FQDN
    password: SOLUTION_USER_PASSWORD
    performance_counter_end_time: ""
    performance_counter_query_timeout: "15"
    performance_counter_start_time: ""
    port: "443"
    sdk_path: ""
    ssl_config: "No Verify"
    username: SOLUTION_USER_ACCOUNT

    Sostituisci quanto segue:

    • VCSA_FQDN: il nome di dominio completo (FQDN) dell'appliance vCenter Server nel tuo cloud privato
    • SOLUTION_USER_PASSWORD: la password corrispondente all'account utente della soluzione in uso
    • SOLUTION_USER_ACCOUNT: l'account utente della soluzione utilizzato dall'agente per segnalare le informazioni

Configura l'agente in modo che acceda all'account di servizio per i report

L'agente autonomo deve avere accesso a Google Cloud Observability per inviare metriche e log. Configura l'agente in modo che acceda al progetto utilizzato per i report tramite l'account di servizio con autorizzazioni di monitoraggio e registrazione.

Nella VM host dell'agente, copia e configura il file log_agent.yaml:

  1. Copia log_agent.example.yaml in log_agent.yaml prima della modifica:

    cp /opt/bpagent/config/log_agent.example.yaml /opt/bpagent/config/log_agent.yaml
    
  2. Nella parte inferiore di log_agent.yaml, inserisci il nome del progetto e il percorso completo al file della chiave JSON. Per le VM host dell'agente create in Compute Engine, rimuovi o commenta la riga credentials_file.

    ...
    - id: my_project_destination
      project_id: PROJECT_ID
      type: google_cloud_output
      credentials_file: /opt/bpagent/config/destinations/google_cloud/JSON_KEY_FILE

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del progetto in cui vuoi generare i log
    • JSON_KEY_FILE: il nome del file della chiave privata dell'account di servizio. Rimuovi o inserisci un commento in questa riga per le VM host dell'agente create in Compute Engine.

    Se devi inoltrare il syslog da ESXi, nell'agente di log autonomo, segui la procedura riportata di seguito per modificare la porta predefinita da 5142 a 514:

    1. Vai a /opt/bpagent/config.
    2. Aggiorna il numero di porta su 514 come segue:
    - id: vmware-vcenter-logs
        # A syslog address of the form `:`
        listen_address: 0.0.0.0:514
        # Enable TLS for the TCP listener
        enable_tls: false
    

Raccogliere metriche e log

Per raccogliere metriche o log, l'agente autonomo deve essere in esecuzione sulla VM agente ospitante. Connettiti alla VM host dell'agente e utilizza i seguenti comandi per avviare o interrompere l'agente:

  • Per avviare l'agente sulla VM host, esegui quanto segue:

    systemctl start bpagent
    
  • Per interrompere l'agente sulla VM host, esegui quanto segue:

    systemctl stop bpagent
    

Configurare un cloud privato per l'inoltro syslog

VMware Engine si integra con Cloud Logging inoltrando i messaggi syslog da vCenter e NSX-T all'agente autonomo. L'agente autonomo è configurato per analizzare i log di vCenter e NSX-T in modo che Cloud Logging possa leggerli.

Per inoltrare i messaggi syslog da VMware Engine, segui questi passaggi:

  • Per il forwarding di syslog di vCenter, segui i passaggi descritti in Inoltrare i messaggi syslog di vCenter. Nel campo Server, inserisci l'indirizzo IP o il nome host della VM dell'host agente. L'agente autonomo utilizza il protocollo di comunicazione TCP e ascolta sulla porta 5142. L'agente autonomo deve essere in esecuzione affinché la configurazione di syslog possa essere collegata correttamente.
  • Per l'inoltro dei messaggi syslog di NSX-T, segui la procedura descritta in Inoltra i messaggi syslog di NSX-T. Nel campo FQDN o indirizzo IP, inserisci l'indirizzo IP o il nome host della VM host dell'agente. L'agente autonomo utilizza il protocollo di comunicazione TCP e rimane in ascolto sulla porta 5142.

Se prevedi di inoltrare syslog dagli host ESXi, modifica la porta predefinita su cui l'agente di log è in ascolto da 5142 a 514. In questo caso, utilizza la stessa porta (514) per inoltrare syslog da vCenter e NSX-T.

Disinstallazione dell'agente

Per rimuovere l'agente da una VM, connettiti alla VM dell'agente ed esegui i seguenti comandi nella riga di comando:

  1. Interrompi e disattiva l'agente autonomo:

    systemctl stop bpagent
    
    systemctl disable bpagent
    
  2. Esegui i seguenti comandi per rimuovere il servizio dell'agente autonomo:

    rm /etc/systemd/system/bpagent.service
    
    rm -rf /opt/bpagent
    
  3. Aggiorna la configurazione di sistema in base alle modifiche del servizio ed elimina eventuali unità non riuscite:

    systemctl daemon-reload
    
    systemctl reset-failed
    

Dashboard di Cloud Monitoring

Dopo aver attivato l'inoltro delle metriche, puoi installare dashboard predefinite per VMware Engine. Le seguenti dashboard forniscono informazioni aggregate su tutte le origini specificate:

  • Dashboard Panoramica:visualizzazione di alto livello che elenca le risorse chiave come data center, cluster e VM.
  • Dashboard Concorrenza:utilizzo delle risorse per archiviazione, CPU, memoria e rete per aiutarti a individuare le VM e gli host principali in base alla domanda di risorse.
  • Dashboard sul rendimento delle macchine virtuali: indicatori sul rendimento delle istanze di macchine virtuali (VM) che possono essere filtrati in base al nome dell'istanza e utilizzati per confrontare il rendimento di più VM tra loro.

Per accedere a una dashboard di VMware Engine:

  1. Nella console Google Cloud, vai a Monitoraggio > Dashboard.

    Accedi a Dashboard

  2. Nella scheda Sample Library (Raccolta di esempi), seleziona la categoria VMware.

  3. Seleziona la dashboard di tuo interesse e fai clic su Importa.

Le definizioni di queste dashboard sono archiviate anche su GitHub. Per la procedura di installazione o visualizzazione delle definizioni come dashboard personalizzate, consulta Installare dashboard di esempio.

Avvisi di Cloud Monitoring

Puoi utilizzare le metriche dell'integrazione per attivare avvisi e notifiche basati su soglie e incidenti personalizzati. Ad esempio, puoi chiedere a Cloud Monitoring di inviarti una notifica via SMS quando qualcuno crea una nuova VM nel tuo cloud privato.

Per maggiori dettagli, consulta la pagina Introduzione agli avvisi.

Elenco delle metriche raccolte

Dopo aver attivato correttamente l'inoltro delle metriche, puoi visualizzarle in Metrics Explorer di Cloud Monitoring. I tipi di risorse e le metriche di VMware Engine iniziano con il prefisso external.googleapis.com/vmware/vcenter. in Metrics Explorer.

Ecco l'elenco completo delle metriche raccolte per VMware Engine, con il prefisso omesso:

Tipo di risorsa e metrica Descrizione
cluster.cpu.available CPU disponibile in un cluster, in megahertz
cluster.memory.available Memoria disponibile in un cluster, in byte
cluster.cpu.threads Numero di thread CPU in un cluster
cluster.cpu.effective CPU effettiva in un cluster di tutti gli host in esecuzione. Gli host non rispondenti o in modalità di manutenzione non vengono conteggiati.
cluster.effective_hosts Numero di host effettivi in un cluster. Gli host non rispondenti o in modalità di manutenzione non vengono conteggiati.
cluster.memory.effective Memoria effettiva in un cluster di tutti gli host in esecuzione. Gli host non rispondenti o in modalità di manutenzione non vengono conteggiati.
cluster.hosts Numero di host in un cluster
cluster.vsan.latency Latenza vSAN di un cluster, in microsecondi
cluster.vsan.throughput Velocità effettiva di lettura/scrittura vSAN di un cluster, in byte
cluster.vsan.iops IOPS vSAN di un cluster
cluster.vsan.congestions Valore di congestione vSAN di un cluster
cluster.vsan.oio I/O in attesa (oio) di vSAN in un cluster
datacenter.cpu.average_host_utilization Utilizzo medio dell'host di un data center, in percentuale
datacenter.clusters Numero di cluster in un data center
datacenter.datastores Numero di datastore in un data center
datacenter.hosts Numero di host in un data center
datacenter.host_systems Numero di sistemi host in un data center
datacenter.hosts/powered_on Numero di host accesi in un data center
datacenter.hosts/powered_off Numero di host spenti in un data center
datacenter.disk/space Spazio su disco totale in un data center, in terabyte
datastore.capacity_bytes Capacità di un datastore, in byte
datastore.capacity_utilization Utilizzo della capacità di un datastore, in percentuale
host_system.network.transmitted_packets Numero di pacchetti di rete trasmessi dal sistema host
host_system.network.received_packets Numero di pacchetti di rete ricevuti dal sistema host
host_system.dropped_packets Numero di pacchetti di rete persi dal sistema host
host_system.network.adapters Numero di adattatori di rete del sistema host
host_system.memory.utilization Utilizzo della memoria del sistema host, in percentuale
host_system.memory.utilization_ratio Rapporto di utilizzo della memoria del sistema host
host_system.memory.used Memoria utilizzata dal sistema host, in megabyte
host_system.disk.read Lettura del disco del sistema host, in kilobyte al secondo
host_system.disk_latency Latenza del disco del sistema host, in millisecondi
host_system.cpu.usage Utilizzo della CPU del sistema host, in percentuale
host_system.cpu.utilization_ratio Rapporto di utilizzo della CPU del sistema host
host_system.cpu.capacity Capacità della CPU del sistema host, in megahertz
host_system.cpu.reserved_capacity Capacità CPU riservata del sistema host, in megahertz
host_system.cpu.average_speed Velocità media della CPU del sistema host, in megahertz
host_system.cpu.used CPU utilizzata dal sistema host, in megahertz
host_system.vsan.throughput La velocità in lettura/scrittura vSAN del sistema host, in byte
host_system.vsan.iops IOPS vSAN del sistema host
host_system.vsan.latency Latenza vSAN del sistema host, in microsecondi
host_system.vsan.client_cache_hits Hit della cache client vSAN del sistema host
host_system.vsan.client_cache_hit_rate Percentuale di successo della cache del client vSAN del sistema host
host_system.vsan.congestions Valore di congestione vSAN del sistema host
resource_pool.memory.swapped_bytes Memoria scambiata di vCenter, in megabyte
resource_pool.memory.shared_bytes Memoria condivisa vCenter, in megabyte
resource_pool.memory.private_bytes Memoria privata vCenter, in megabyte
resource_pool.memory.shares Numero di condivisioni della memoria di vCenter
resource_pool.memory.overhead_usage_bytes Utilizzo dell'overhead della memoria di vCenter, in megabyte
resource_pool.memory.host_usage_bytes Utilizzo della memoria dell'host vCenter, in megabyte
resource_pool.memory.active_guest_usage_bytes Utilizzo della memoria vCenter da parte degli ospiti attivi, in megabyte
resource_pool.memory.balloon_size Dimensioni della memoria del balloon vCenter, in megabyte
resource_pool.cpu.usage CPU utilizzata da vCenter, in megahertz
resource_pool.cpu.shares Numero di quote CPU nel pool di risorse, in megabyte
vm.memory.ballooned Dimensioni della memoria balloon della VM, in megabyte
vm.network.throughput_bytes Velocità effettiva di rete della VM, in kilobyte al secondo
vm.memory.used_percent Memoria utilizzata dalla VM, in percentuale della memoria disponibile
vm.memory.usage_bytes Memoria utilizzata dalla VM, in megabyte
vm.disk.throughput_bytes Velocità effettiva di lettura/scrittura del disco della VM, in kilobyte al secondo
vm.disk.used_percent Utilizzo del disco della VM, in percentuale dello spazio di archiviazione disponibile
vm.disk.usage_bytes Utilizzo del disco della VM, in byte
vm.disk.free_bytes Spazio su disco disponibile della VM, in byte
vm.cpu.used_percent Utilizzo della CPU della VM, in percentuale della CPU disponibile
vm.cpu.usage Utilizzo della CPU della VM, in megahertz
vm.cpu.ready_percent CPU della VM pronta, ma non in grado di funzionare, in percentuale
vm.vsan.throughput Velocità effettiva di lettura e scrittura vSAN della VM, in byte
vm.vsan.iops IOPS vSAN della VM
vm.vsan.latency Latenza vSAN della VM, in microsecondi
vm.vsan.readCount Conteggio delle letture vSAN della VM
vm.vsan.writeCount Conteggio delle scritture vSAN della VM
vsphere.cpu.available CPU disponibili nei cluster gestiti da vSphere, in gigahertz
vsphere.memory.available Memoria disponibile nei cluster gestiti da vSphere, in gigabyte
vsphere.clusters.total Numero di cluster gestiti da vSphere
vsphere.clusters Conteggio dei cluster gestiti da vSphere con il codice colore dello stato del cluster (ad es. verde, grigio, rosso o giallo)
vsphere.cpu.cpus Numero totale di core della CPU del sistema host gestiti da vSphere
vsphere.datacenters Numero di data center gestiti da vSphere
vsphere.datastores.total Numero di datastore in vSphere
vsphere.datastores Numero di datastore gestiti da vSphere con il codice colore dello stato del datastore (ad es. verde, grigio, rosso o giallo)
vsphere.disk.space Spazio su disco totale collegato in vSphere, in terabyte
vsphere.host_systems Numero di sistemi host in vSphere
vsphere.hosts Conteggio dei sistemi host gestiti da vSphere con il codice colore dello stato del sistema host (ad es. verde, grigio, rosso o giallo)
vsphere.network.adapters Numero di adattatori di rete in vSphere
vsphere.hosts.powered_off Numero di host spenti in vSphere
vsphere.hosts.powered_on Numero di host accesi in vSphere
vsphere.virtual_machines.total Numero di VM in tutti i cluster vSphere
vsphere.virtual_machines Numero di VM gestite da vSphere con il codice colore dello stato della VM (ad es. verde, grigio, rosso o giallo)