Puoi controllare l'integrità di un volume Google Cloud Hyperdisk o Persistent Disk esaminando la metrica Stato prestazioni disco. Questa metrica indica se le prestazioni del disco sono potenzialmente interessate da eventi avversi in Compute Engine.
Un problema che influisce sullo stato delle prestazioni del disco potrebbe essere visibile anche nella dashboard Personal Service Health (PSH) o nella dashboard Google Cloud Service Health del tuo progetto.
Questo documento illustra lo stato delle prestazioni del disco e come utilizzarlo per risolvere i problemi di prestazioni.
Quando controllare lo stato di un disco
Se noti un problema di prestazioni con un disco, controlla il suo stato esaminando la metrica dello stato delle prestazioni del disco. La metrica dello stato delle prestazioni del disco viene aggiornata ogni minuto e rappresenta le prestazioni del disco nell'intero minuto precedente. Per la procedura per controllare l'integrità del disco, consulta Visualizzare lo stato delle prestazioni del disco.
La tabella seguente riassume i possibili valori dello stato delle prestazioni del disco.
Stato | Significato |
---|---|
Healthy |
Le prestazioni del disco sono come previsto. |
Degraded |
Potresti notare temporaneamente una latenza I/O superiore al previsto. |
Severely degraded |
Si verificano latenze I/O elevate o altri errori. |
Se lo stato del rendimento non è Healthy
, consulta Informazioni su ogni stato per conoscere i passaggi successivi.
Se lo stato del rendimento è Healthy
, il disco funziona normalmente e devi verificare altre cause del problema di rendimento.
Devi verificare la presenza di errori dell'applicazione o del sistema operativo e assicurarti che il disco sia ottimizzato correttamente. Per le linee guida sull'ottimizzazione, consulta Ottimizzare Hyperdisk e Ottimizzare il disco permanente.
La relazione tra lo stato del disco e le altre metriche sulle prestazioni del disco
Lo stato di salute del disco, indicato dalla metrica dello stato del rendimento, mostra il
stato interno del disco dal punto di vista di Google. Se lo stato di un disco è Degraded
o Severely Degraded
, la causa principale si trova sempre nell'infrastruttura Compute Engine.
In genere, non puoi modificare lo stato di un disco modificando il carico di lavoro. Tuttavia, in rari casi, una modifica al carico di lavoro potrebbe attivare un problema interno, pertanto potrebbe essere possibile attenuare un problema modificando il carico di lavoro.
Per informazioni sulle altre metriche sulle prestazioni del disco disponibili, consulta Esaminare le metriche sulle prestazioni del disco.
Scenari che non influiscono sullo stato delle prestazioni del disco
Lo stato delle prestazioni del disco non è correlato ai problemi di prestazioni causati dai seguenti fattori:
- Ottimizzazione del disco incompleta o insufficiente
- Limite di prestazioni associato al disco e al tipo di macchina (se il tipo di macchina scelto non può soddisfare i requisiti di prestazioni del carico di lavoro)
- Aumento del carico sul disco a causa del traffico del carico di lavoro
- Errore dell'utente, dell'applicazione o del sistema operativo
- Dischi pieni o danneggiati
- Per i volumi Hyperdisk e Extreme Persistent Disk, IOPS o throughput sottoposti a provisioning insufficienti.
In queste situazioni, è tua responsabilità migliorare le prestazioni, ad esempio ottimizzando il disco, aumentando il carico di lavoro, modificando il tipo di macchina e eseguendo il provisioning di più capacità, IOPS o velocità effettiva.
Visualizzare lo stato di un disco in Cloud Monitoring
Per visualizzare lo stato di un disco, crea un grafico in Metrics Explorer.
Ruoli e autorizzazioni richiesti
Per ottenere le autorizzazioni necessarie per controllare la metrica dello stato delle prestazioni del disco, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:
-
Visualizzatore monitoraggio (
roles/monitoring.viewer
) -
Per salvare un grafico in una dashboard:
Editor di monitoraggio (
roles/monitoring.editor
)
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Creare un grafico in Metrics Explorer
Per creare un grafico, crea una query con l'interfaccia basata su menu, Monitoring Query Language (MQL) o PromQL.
Interfaccia basata su menu
Per visualizzare lo stato di uno o più dischi in un grafico, segui queste istruzioni.
-
Nella console Google Cloud, vai alla pagina leaderboard Esplora metriche:
Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.
- Nell'elemento Metrica, espandi il menu Seleziona una metrica,
digita
VM Instance
nella barra dei filtri e poi utilizza i sottomenu per selezionare un tipo di risorsa e una metrica specifici:- Nel menu Risorse attive, seleziona Istanza VM.
- Nel menu Categorie di metriche attive, seleziona Istanza.
- Nel menu Metriche attive, seleziona Stato del rendimento del disco.
- Fai clic su Applica.
compute.googleapis.com/instance/disk/performance_status
. - Configura la modalità di visualizzazione dei dati.
Disattiva l'aggregazione. Assicurati che nell'elemento Aggregation, il primo menu sia impostato su Non aggregato e il secondo su Nessuna.
Per visualizzare lo stato di un disco specifico, filtra in base adevice_name
.
Per ulteriori informazioni sulla configurazione di un grafico, consulta Selezionare le metriche durante l'utilizzo di Metrics Explorer.
MQL
Apri l'editor di query: segui i passaggi descritti in Scrivere query MQL.
Inserisci la query nell'editor delle query. Ad esempio, per visualizzare lo stato del rendimento di un disco specifico, inserisci la seguente query:
fetch gce_instance | metric 'compute.googleapis.com/instance/disk/performance_status' | filter metric.device_name == 'DISK_NAME' | group_by 1m, [value_performance_status_fraction_true: fraction_true(value.performance_status)] | every 1m
Sostituisci
DISK_NAME
con il nome del disco, ad esempiodisk-1
.
PromQL
Apri l'editor di query: segui i passaggi descritti in Scrivere query PromQL.
Inserisci la query nell'editor delle query. Ad esempio, per visualizzare lo stato del rendimento di un disco specifico, inserisci la seguente query:
last_over_time (compute_googleapis_com:instance_disk_performance_status {monitored_resource="gce_instance", project_id ="PROJECT_ID", device_name="DISK_NAME"}[${__interval}])
Sostituisci DISK_NAME
con il nome del disco, ad esempio
disk-1
.
Se visualizzi i risultati in un grafico, sono presenti 3 righe per ogni disco, una per ogni possibile stato. Analogamente, se visualizzi il risultato della query in una tabella, la tabella contiene 3 righe per ogni disco.
Se hai creato la query con PromQL o MQL, ogni riga avrà un valore 1
o 0
. Per le query create con i menu, i valori saranno 100%
o 0
.
Lo stato corrente del disco è rappresentato dalla riga il cui valore è 100%
o 1
.
Ad esempio, lo screenshot seguente mostra il grafico di un disco denominato a-test-VM
,
il cui stato è Healthy
:
Se visualizzi i risultati della query come tabella, la tabella seguente è un esempio di risultati per un disco Healthy
:
performance_status | valore |
---|---|
Healthy |
1 |
Degraded |
0 |
Severely Degraded |
0 |
Lo screenshot seguente mostra il grafico di un disco denominato replica-23509
il cui stato è Degraded (In stato degradato):
Per informazioni sul significato di ogni stato del rendimento, consulta Informazioni su ogni stato. Dopo aver creato il grafico, puoi salvarlo in una dashboard per utilizzarlo in futuro.
Risultati frazionati
Se la query include risultati frazionati come nella tabella seguente, solitamente è perché il periodo di visualizzazione selezionato era lungo. Di conseguenza, Cloud Monitoring ha aggregato i dati nel tempo.
Un valore 77%
per lo stato Healthy
indica che lo stato del disco era Healthy
nel 77% del periodo di visualizzazione selezionato.
performance_status | valore |
---|---|
Healthy |
77% |
Degraded |
23% |
Severely Degraded |
0 |
Per una visione più granulare dell'integrità di un disco, utilizza un periodo di visualizzazione di alcune ore o di alcuni minuti.
Informazioni su ogni stato
Questa sezione illustra il significato di ogni stato e quando potresti dover intraprendere un'ulteriore azione.
Healthy
Lo stato Healthy
indica che, dal punto di vista di Google, il disco funziona normalmente.
Se un disco Healthy
presenta problemi di prestazioni, non contattare l'assistenza. Risolvi invece il problema del disco utilizzando alcuni dei seguenti suggerimenti:
- Esamina le metriche relative alle prestazioni del disco, ad esempio la latenza e la profondità della coda.
- Controlla i log e le metriche del tuo carico di lavoro per rilevare anomalie e colli di bottiglia.
- Se utilizzi un Persistent Disk, assicurati che la capacità di cui è stato eseguito il provisioning possa soddisfare le esigenze di prestazioni del disco. Se utilizzi volumi Hyperdisk o Extreme Persistent Disk, verifica di aver eseguito il provisioning di IOPS e throughput sufficienti.
- Assicurati di aver seguito le linee guida per ottimizzare il disco. Per ulteriori informazioni, consulta Ottimizzare HyperDisk e Ottimizzare il disco permanente.
Degraded
In genere non è necessario contattare l'assistenza se lo stato del disco è Degraded
. Un Degraded status
è generalmente causato dalla normale manutenzione interna dell'infrastruttura Compute Engine.
Potresti non notare alcun impatto sul rendimento del disco mentre lo stato è Degraded
. Se il problema di prestazioni e lo stato Degraded
sono correlati nel tempo, il problema di prestazioni potrebbe non essere correlato allo stato
Degraded
.
Nell'improbabile caso in cui un problema di prestazioni sia dovuto allo stato Degraded
,
l'impatto è in genere temporaneo. Lo stato del disco dovrebbe tornare a Healthy
entro alcuni minuti.
Puoi ignorare lo stato Degraded
se non ci sono problemi di rendimento con il disco.
Che cosa fare in caso di problemi di rendimento
Se lo stato del rendimento del disco è Degraded
e riscontri un problema di rendimento, segui questi passaggi:
- Controlla la dashboard di PSH per verificare se si è verificato un incidente che interessa il disco. In caso di incidente, non contattare l'assistenza perché Google è a conoscenza del problema e sta lavorando per risolverlo.
- Se non sono presenti problemi noti, attendi almeno 5 minuti affinché il problema di rendimento si risolva autonomamente.
Se dopo 5 minuti il problema di prestazioni non è stato risolto e lo stato è ancora
Degraded
, assicurati che il problema non sia dovuto a un'ottimizzazione insufficiente del disco. Ad esempio, controlla la latenza e la profondità della coda del disco. È possibile che il problema di rendimento e lo statoDegraded
non siano correlati e siano solo una coincidenza. A tale scopo, esamina le metriche del disco e le linee guida per l'ottimizzazione del rendimento.Se i problemi di prestazioni persistono e tutte le seguenti condizioni sono soddisfatte, puoi contattare l'assistenza per ricevere aiuto:
- Lo stato del disco è
Degraded
da più di 5 minuti - Hai ragionevoli garanzie che non si tratti di un problema relativo al carico di lavoro perché hai ottimizzato il disco e verificato che non ci siano altri problemi, come un collo di bottiglia o un'applicazione sovraccaricata
- Non ci sono avvisi nella dashboard PSH
- Lo stato del disco è
Google sconsiglia di creare un avviso direttamente per lo stato Degraded
, ma consiglia di creare un avviso per lo stato dell'applicazione di livello superiore e di utilizzare questa metrica per eseguire il debug dei problemi.
Severely Degraded
Un disco con stato di prestazioni Severely Degraded
presenta un
problema di prestazioni. Questo problema può essere dovuto a un incidente o a un errore e potrebbe essere già visibile nella dashboard PSH o nella dashboard Integrità del servizio Google Cloud.
Cosa fare
Se lo stato delle prestazioni del disco è Severely Degraded
, segui questi passaggi:
- Controlla la dashboard PSH e la dashboard di integrità generale di Google Cloud per verificare la presenza di un incidente che interessa il disco. In caso di incidente, non contattare l'assistenza, poiché Google è a conoscenza del problema e sta lavorando per risolverlo.
- Se non sono presenti problemi noti in entrambe le dashboard, contatta l'assistenza per ricevere aiuto.
Albero decisionale
Il seguente diagramma illustra come procedere se un disco presenta un problema di rendimento e riassume le informazioni riportate nelle sezioni precedenti.
Come mostrato nel diagramma di flusso, devi contattare l'assistenza solo se non sono presenti avvisi noti nelle dashboard di PSH e del servizio cloud e lo stato del disco è Severely Degraded
. Se il disco è Degraded
, contatta l'assistenza solo se sono soddisfatte tutte le seguenti condizioni:
- Il disco è
Degraded
da più di 5 minuti - Hai escluso un errore o una configurazione errata del carico di lavoro (ad esempio problemi di rete)
- Non è possibile eseguire ottimizzazioni aggiuntive a livello di applicazione, workload o disco
- Hai esaminato tutte le metriche del disco
- Hai esaminato i log del carico di lavoro e della macchina virtuale (VM)
Passaggi successivi
- Scopri di più sulla creazione di grafici con Esplora metriche e su come perfezionare i risultati delle query aggiungendo filtri a un grafico.
- Controlla la presenza di eventi di stato del servizio attivi e passati nella dashboard di Personalized Service Health e in Google Service Health
- Per le linee guida sull'ottimizzazione delle prestazioni, consulta Ottimizzare Hyperdisk e Ottimizzare il disco permanente.