Questa pagina è stata tradotta dall'API Cloud Translation.

Panoramica dell'archiviazione per i cluster GKE

Autopilot Standard

Questo documento illustra le opzioni di archiviazione supportate da GKE e alcune considerazioni chiave per selezionare l'opzione migliore per le esigenze della tua attività. Per determinare la famiglia di macchine appropriata per la tua selezione, consulta Confronto tra le serie di macchine.

GKE supporta i seguenti tipi di archiviazione e integrazioni:

Archiviazione a blocchi utilizzando Persistent Disk
Archiviazione a blocchi utilizzando Google Cloud Hyperdisk
Archiviazione a blocchi utilizzando i pool di archiviazione Hyperdisk
Archiviazione temporanea e a blocchi non elaborati utilizzando l'SSD locale
File system parallelo (Managed Lustre)
Network File System (Filestore)
Archiviazione di oggetti utilizzando Cloud Storage FUSE
Database gestiti
Artefatti build

Archiviazione a blocchi (Persistent Disk)

I volumi Persistent Disk sono dispositivi di archiviazione di rete durevoli gestiti da Compute Engine a cui i cluster GKE possono accedere come se si trattasse di dischi fisici su un computer o un server. Quando i cluster richiedono spazio di archiviazione aggiuntivo, puoi collegare altri volumi Persistent Disk ai nodi o ridimensionare i volumi Persistent Disk esistenti. Puoi consentire a GKE di eseguire il provisioning dinamico di PersistentVolume supportati da Persistent Disk oppure puoi eseguire il provisioning manuale dei dischi.

Questa opzione di archiviazione è supportata sui cluster GKE Autopilot e Standard.

Per impostazione predefinita, i volumi Persistent Disk sono risorse a livello di zona (mantenute in una singola zona all'interno di una regione). Puoi creare volumi Persistent Disk a livello di regione (mantenuti in due zone della stessa regione). Puoi anche collegare un volume del Persistent Disk in modalità di sola lettura a più nodi contemporaneamente. Questa funzionalità è supportata sia per i volumi Persistent Disk a livello di zona sia per quelli a livello di regione.

Lo spazio di archiviazione del Persistent Disk su GKE è permanente, il che significa che i dati memorizzati sui dischi verranno conservati anche se il pod che li utilizza viene terminato.

Perché utilizzare l'archiviazione Persistent Disk

Utilizza l'archiviazione Persistent Disk se i tuoi cluster richiedono l'accesso a un'archiviazione a blocchi durevole, ad alte prestazioni e a disponibilità elevata. Un volume Persistent Disk è in genere collegato a un singolo pod. Questa opzione di archiviazione supporta la modalità di accesso ReadWriteOnce. GKE supporta la configurazione dei volumi Persistent Disk con una serie di opzioni di latenza e prestazioni, tra cui:

Disco permanente bilanciato: adatto per applicazioni aziendali standard. Questa opzione offre un equilibrio tra prestazioni e costi. Supportati da unità a stato solido (SSD). Questa è l'opzione predefinita per il provisioning dinamico dei volumi su cluster e nodi che eseguono GKE 1.24 o versioni successive.
Persistent Disk con prestazioni: adatto per analisi di scale out, database e memorizzazione nella cache permanente. Questa opzione è ideale per i carichi di lavoro sensibili alle prestazioni. Supportati da unità a stato solido (SSD).
Disco permanente standard: adatto a carichi di lavoro di big data e big compute. Questa opzione è il tipo di disco più conveniente. Supportati da hard disk (HDD) standard.
Extreme Persistent Disk: adatto per applicazioni aziendali come SAP HANA e Oracle. Questa opzione offre le massime prestazioni per soddisfare le esigenze dei più grandi database in memoria. Supportati da unità a stato solido (SSD). Per le applicazioni con requisiti di prestazioni elevati, in cui Persistent Disk non offre prestazioni sufficienti, utilizza i dischi Hyperdisk Extreme.

Per iniziare a utilizzare questa opzione di archiviazione, consulta queste risorse:

Per scoprire di più sui tipi di disco disponibili, consulta Opzioni di archiviazione nella documentazione di Compute Engine.
Il driver CSI per il disco permanente di Compute Engine è il modo principale per utilizzare l'archiviazione del Persistent Disk con GKE. Per istruzioni, consulta Utilizzo del driver CSI per il disco permanente di Compute Engine.

Archiviazione a blocchi (Google Cloud Hyperdisk)

I volumi Hyperdisk utilizzano l'archiviazione a blocchi di Google Cloud nuova generazione. I volumi Hyperdisk ti consentono di ottimizzare dinamicamente le prestazioni dell'archiviazione a blocchi in base al tuo carico di lavoro. Puoi configurare operazioni di I/O al secondoo (IOPS) e il throughput in modo indipendente per le tue applicazioni e adattarti alle mutevoli esigenze di prestazioni nel tempo.

Questa opzione di archiviazione è supportata sui cluster GKE Autopilot e Standard. I volumi Hyperdisk sono risorse a livello di zona, soggette a disponibilità regionale. Lo spazio di archiviazione Hyperdisk su GKE è persistente, il che significa che i dati memorizzati sui dischi verranno conservati anche se il pod che li utilizza viene terminato.

Perché utilizzare lo spazio di archiviazione Hyperdisk

Utilizza l'archiviazione Hyperdisk se devi ridimensionare e regolare dinamicamente IOPS o throughput. Un volume Hyperdisk viene in genere collegato a un singolo pod. Questa opzione di archiviazione supporta la modalità di accesso ReadWriteOnce. Puoi scegliere tra le seguenti opzioni di archiviazione Hyperdisk per GKE in base alle tue esigenze di prezzo/prestazioni:

Hyperdisk bilanciato: la soluzione ideale per la maggior parte dei workload. Questa è una buona opzione per il deployment della maggior parte delle app aziendali e line-of-business, nonché di database e server web.
Hyperdisk Throughput: ottimizzato per un throughput elevato a costi contenuti. Questa è una buona opzione se il tuo caso d'uso ha come target l'analisi di scalabilità orizzontale (ad esempio Hadoop o Kafka), il ripristino di dati freddi dai server di backup e i workload sensibili ai costi orientati al throughput.
Hyperdisk Extreme: ottimizzato per le prestazioni IOPS. Questa è una buona opzione se stai eseguendo il deployment di carichi di lavoro ad alte prestazioni, ad esempio sistemi di gestione di database.
Hyperdisk ML: ottimizzato per i workload di addestramento e inferenza AI/ML che devono caricare rapidamente i pesi del modello. Utilizza questa opzione per ridurre l'inattività delle risorse GPU/TPU dovuta a colli di bottiglia della latenza.

Le opzioni di archiviazione Hyperdisk sono supportate nei cluster GKE Autopilot e Standard.

Per iniziare a utilizzare questa opzione di archiviazione, consulta queste risorse:

Per una panoramica, consulta Informazioni su Hyperdisk per GKE.
Per i limiti per disco, inclusi il throughput e le IOPS massimi, consulta la sezione Limiti di Hyperdisk per disco nella documentazione di Compute Engine.
Per configurare e utilizzare lo spazio di archiviazione Hyperdisk Throughput ed Extreme nei tuoi cluster, consulta Scalare le prestazioni di archiviazione con Hyperdisk.

Archiviazione a blocchi (pool di archiviazione Hyperdisk)

Un pool di archiviazione Hyperdisk è un pool di risorse di archiviazione (capacità, throughput e IOPS) di cui è stato eseguito il provisioning e che i dischi nel cluster GKE possono utilizzare. Le risorse di archiviazione sono condivise tra tutti gli Hyperdisk che crei all'interno del pool di archiviazione.

I cluster GKE Standard consentono di includere in un pool di archiviazione sia i dischi di avvio Hyperdisk (per i sistemi operativi) sia gli Hyperdisk collegati (per l'archiviazione dei dati). I cluster GKE Autopilot supportano solo Hyperdisk collegati per i pool di archiviazione.

Per iniziare a utilizzare questa opzione di archiviazione, consulta le seguenti risorse:

Per una panoramica, consulta Informazioni sui pool di archiviazione Hyperdisk.
Per configurare il pool di archiviazione Hyperdisk nei cluster GKE, consulta Ottimizzare le prestazioni e i costi dello spazio di archiviazione con il pool di archiviazione Hyperdisk.

Archiviazione temporanea e a blocchi non elaborati (SSD locale)

I dischi SSD locali sono unità fisiche collegate direttamente ai nodi. Possono offrire prestazioni migliori, ma sono effimeri. Ogni volume SSD locale è collegato a un nodo specifico. Non puoi spostare il volume in un altro nodo.

Questa opzione di archiviazione è supportata sui cluster GKE Standard. Il supporto di Autopilot per l'SSD locale è disponibile in anteprima sulle macchine A2 Ultra A100, sui cluster e sui pool di nodi che eseguono GKE 1.27 e versioni successive.

L'archiviazione temporanea supportata dall'archiviazione SSD locale su GKE è legata al ciclo di vita di un pod. Quando il pod viene terminato, viene eliminato anche lo spazio di archiviazione temporaneo associato.

Perché utilizzare l'SSD locale

L'utilizzo dell'archiviazione SSD locale nei cluster GKE è adatto se hai bisogno della memorizzazione nella cache a caldo per i database e per l'analisi in tempo reale o di uno spazio di archiviazione temporaneo ottimizzato per Flash che offre le latenze più basse. L'archiviazione SSD locale può essere particolarmente efficace come livello di memorizzazione nella cache davanti a Cloud Storage per i casi d'uso di AI/ML, elaborazione batch, analisi e database in memoria.

Per iniziare a utilizzare questa opzione di archiviazione, consulta queste risorse:

Per una panoramica, consulta Informazioni sull'archiviazione SSD locale per GKE.
Per configurare e utilizzare lo spazio di archiviazione SSD locale nei cluster come emptyDir, consulta Provisioning e utilizzo dello spazio di archiviazione temporaneo basato su SSD locale.
Per configurare e utilizzare l'archiviazione SSD locale nei cluster come risorse PersistentVolumes locali, consulta Provisioning e utilizzo dell'archiviazione a blocchi non elaborati basata su SSD locali.

File system parallelo (Managed Lustre)

Managed Lustre è un file system parallelo completamente gestito e ad alte prestazioni su Google Cloud, integrato con GKE tramite il driver CSI Managed Lustre. È progettato per carichi di lavoro impegnativi che richiedono spazio di archiviazione persistente, scalabile e ad alta velocità effettiva, in particolare nell'AI/ML e nel computing ad alte prestazioni (HPC). Il driver CSI Lustre gestito automatizza la gestione del ciclo di vita delle istanze Lustre gestite, consentendoti di eseguirne il provisioning e di accedervi tramite oggetti Kubernetes standard come PersistentVolume e PersistentVolumeClaim.

Questa opzione di archiviazione è supportata sui cluster GKE Autopilot e Standard che eseguono nodi Container-Optimized OS. Lo spazio di archiviazione Lustre gestito su GKE è permanente, quindi i dati rimangono anche se il pod che lo utilizza viene terminato.

Perché utilizzare l'archiviazione Managed Lustre

Utilizza l'archiviazione Managed Lustre per i carichi di lavoro che richiedono accesso ai file a velocità effettiva elevata e bassa latenza da più pod contemporaneamente. È una buona scelta per i seguenti casi d'uso:

AI/ML: workload di addestramento e inferenza che devono accedere a grandi set di dati.
HPC: simulazioni scientifiche e ingegneristiche su larga scala.

Per iniziare a utilizzare questa opzione di archiviazione, consulta queste risorse:

Per una panoramica della funzionalità, consulta Informazioni sul driver CSI Lustre gestito.
Per creare e utilizzare un volume supportato da una nuova istanza Managed Lustre, consulta Accedere alle istanze Managed Lustre con il driver CSI Managed Lustre.
Per connetterti a un'istanza Managed Lustre esistente, consulta Accedere alle istanze Managed Lustre esistenti con il driver CSI Managed Lustre.

File system di rete (Filestore)

Filestore fornisce un file system condiviso basato su cloud per dati non strutturati, con accesso al Network File System (NFS). Le istanze Filestore fungono da file server su Google Cloud che forniscono spazio di archiviazione durevole con accesso ReadWriteMany per i tuoi cluster GKE. Le istanze Filestore sono disaccoppiate dall'host e richiedono un intervento manuale minimo. I failover dei workload sono fluidi perché non sono necessarie operazioni di infrastruttura per collegare o scollegare i volumi.

Questa opzione di archiviazione è supportata sui cluster GKE Autopilot e Standard. L'archiviazione Filestore con il livello di servizio Enterprise ha come impostazione predefinita la disponibilità regionale, mentre gli altri livelli di servizio hanno la disponibilità zonale. L'archiviazione Filestore su GKE è permanente, il che significa che i dati archiviati nelle istanze verranno conservati anche se il pod che li utilizza viene terminato.

Perché utilizzare lo spazio di archiviazione Filestore

Utilizza l'archiviazione Filestore se le tue applicazioni richiedono l'accesso al file system di rete (NFS) e più lettori e autori. Questa opzione di archiviazione è adatta se il tuo caso d'uso riguarda sistemi di gestione dei contenuti, migrazione di applicazioni, analisi dei dati, rendering ed elaborazione multimediale.

Per una maggiore efficienza dei costi, Filestore Multishares per GKE ti consente di condividere un'istanza di livello Enterprise Filestore di 10 GiB o più grande con un massimo di 80 PersistentVolume.

Per iniziare a utilizzare questa opzione di archiviazione, consulta queste risorse:

Per una panoramica, consulta Informazioni sul supporto di Filestore per GKE.
Il driver CSI Filestore è il modo principale per utilizzare l'archiviazione Filestore con GKE. Per istruzioni, consulta Accedere alle istanze Filestore con il driver CSI Filestore.
Per le istruzioni relative a Filestore multishares, consulta Ottimizzare lo spazio di archiviazione con Filestore multishares per GKE.

Archiviazione di oggetti (Cloud Storage FUSE)

Cloud Storage è uno spazio di archiviazione di oggetti per dati binari e di oggetti, blob e dati non strutturati. Il driver CSI di Cloud Storage FUSE gestisce l'integrazione di Cloud Storage FUSE con le API Kubernetes per utilizzare i bucket Cloud Storage esistenti come volumi. Puoi utilizzare il driver CSI di Cloud Storage FUSE per montare i bucket come file system sui nodi GKE.

Il driver CSI di Cloud Storage FUSE supporta le modalità di accesso ReadWriteMany, ReadOnlyMany e ReadWriteOnce nei cluster GKE Autopilot e Standard. Gli oggetti Cloud Storage hanno disponibilità regionale. I dati di Cloud Storage su GKE sono persistenti, il che significa che i dati archiviati nei bucket rimarranno anche se il pod che li utilizza viene terminato.

Perché utilizzare Cloud Storage FUSE

L'opzione FUSE di Cloud Storage è adatta se hai bisogno della semantica dei file davanti a Cloud Storage per la portabilità. Cloud Storage FUSE è anche una scelta comune per gli sviluppatori che vogliono archiviare e accedere ai dati di addestramento e dei modelli di machine learning (ML) come oggetti in Cloud Storage.

Per iniziare a utilizzare questa opzione di archiviazione, consulta queste risorse:

Per una panoramica, consulta Cloud Storage FUSE.
Per utilizzare i bucket Google Cloud nei cluster, consulta Accedere ai bucket Cloud Storage con il driver CSI FUSE di Cloud Storage.

Database gestiti

Un database gestito, come Cloud SQL o Spanner, offre un overhead operativo ridotto ed è ottimizzato per l'infrastruttura Google Cloud. I database gestiti richiedono meno impegno per la manutenzione e il funzionamento rispetto a un database che esegui il deployment direttamente in Kubernetes.

Perché utilizzare i database gestiti

L'utilizzo di un database gestito Google Cloud consente ai tuoi carichi di lavoro stateful su GKE di accedere a dati permanenti automatizzando le attività di manutenzione come backup, applicazione di patch e scalabilità. Crea un database, sviluppa la tua app e lascia che Google Cloud la ridimensioni per te. Tuttavia, ciò significa anche che potresti non avere accesso alla versione esatta di un database, di un'estensione o al tipo esatto di database che ti interessa.

GKE fornisce il supporto per la connessione con servizi di database gestiti, tra cui: Google Cloud

AlloyDB per PostgreSQL: database completamente gestito e compatibile con PostgreSQL con prestazioni, disponibilità e scalabilità superiori per i workload transazionali e analitici. Consulta Connettersi da Google Kubernetes Engine ad AlloyDB per PostgreSQL.
Cloud SQL: database MySQL, PostgreSQL e SQL Server completamente gestito. Consulta Connettersi da Google Kubernetes Engine.
Spanner: database relazionale scalabile in orizzontale con coerenza e disponibilità elevate. Consulta Eseguire il deployment di un'app utilizzando GKE Autopilot e Cloud Spanner.
Memorystore for Redis: servizio di datastore in memoria completamente gestito. Consulta Connessione a un'istanza Redis da un cluster Google Kubernetes Engine.

Per iniziare a utilizzare questa opzione di archiviazione, consulta queste risorse:

Spiegazione delle opzioni di Google Cloud database.
Per considerazioni sull'utilizzo di un database gestito o di un database containerizzato ospitato su GKE, consulta Pianifica i deployment di database su GKE.

Artefatti build (Artifact Registry)

Artifact Registry è un gestore di repository per immagini container, pacchetti di sistemi operativi e pacchetti di linguaggio creati e distribuiti da te.

Perché utilizzare Artifact Registry

Artifact Registry è un'opzione adatta per archiviare le tue immagini container private, i grafici Helm e altri artefatti di build.

Per eseguire il pull delle immagini dai repository Docker di Artifact Registry a GKE, consulta la sezione Deployment su Google Kubernetes Engine nella documentazione di Artifact Registry.

Passaggi successivi

Leggi il post del blog Una mappa delle opzioni di archiviazione in Google Cloud.
Progetta una strategia di archiviazione ottimale per il tuo carico di lavoro cloud.
Scopri come utilizzare le astrazioni di archiviazione di Kubernetes in GKE: PersistentVolumes, StatefulSets.
Consulta la pagina delle risorse Dati su GKE per scoprire le soluzioni di dati che puoi integrare con GKE.