Questa pagina fornisce una panoramica dello spazio dei nomi gerarchico, delle funzionalità principali e i casi d'uso, i vantaggi e le limitazioni da considerare.
Panoramica
Lo spazio dei nomi gerarchico è una funzionalità offerta da Cloud Storage che consente di organizzare gli oggetti in cartelle. Con lo spazio dei nomi gerarchico, puoi memorizzare i dati in una struttura di file system logica. Organizzare i dati in una struttura del filesystem migliora le prestazioni, garantisce la coerenza e semplifica la gestione dei carichi di lavoro orientati ai file e con un'intensità di dati elevata.
Le operazioni di gestione delle cartelle offrono affidabilità e funzionalità di gestione, tra cui creazione, eliminazione, elencazione e rinominazione delle cartelle. L'organizzazione gerarchica degli oggetti semplifica l'organizzazione dei dati e snellisce le attività di gestione dei dati. Una cartella in un bucket con dello spazio dei nomi gerarchico abilitato può contenere oggetti, altre cartelle o combinazione di entrambi.
Devi scegliere se utilizzare o meno lo spazio dei nomi gerarchico quando crei il bucket. L'impostazione dello spazio dei nomi gerarchico del bucket non può essere modificata dopo la creazione del bucket. Per informazioni sull'attivazione dello spazio dei nomi gerarchico per il tuo bucket, consulta Creare e gestire bucket spazio dei nomi gerarchico abilitato.
Il seguente diagramma mostra un esempio di un bucket con uno spazio dei nomi gerarchico abilitato, dove gli oggetti sono organizzati in una struttura gerarchica di cartelle.
Funzionalità principali
Lo spazio dei nomi gerarchico fornisce le seguenti funzionalità:
Numero di query iniziali al secondo (QPS) più elevato: bucket con lo spazio dei nomi gerarchico abilitato offre una QPS iniziale più elevata per operazioni di scrittura rispetto ai bucket senza spazio dei nomi gerarchico in un bucket in cui è abilitato il controllo delle versioni. Il QPS iniziale più elevato semplifica la scalabilità dei carichi di lavoro che richiedono un uso intensivo dei dati e offre una maggiore velocità in uscita.
Cartelle: le cartelle fungono da contenitore per oggetti e altre cartelle. con supporto per operazioni come la creazione, l'eliminazione e il recupero delle cartelle.
Rinomina cartelle: l'operazione di ridenominazione delle cartelle consente di rinominare in modo atomico il percorso di una cartella e le relative cartelle sottostanti senza eliminare alcun oggetto. Questa tecnica è efficiente e consente di risparmiare tempo, soprattutto per le cartelle di grandi dimensioni con più oggetti.
Elenca cartelle: l'operazione Elenca cartelle elenca tutte le cartelle nel bucket o all'interno di una cartella specifica, aiutandoti a gestire e comprendere la struttura dei dati archiviati in un bucket.
Quando abilitare lo spazio dei nomi gerarchico per il bucket
Dovresti valutare l'abilitazione dello spazio dei nomi gerarchico quando utilizzi applicazioni che si aspettano una gerarchia e una semantica di tipo file system. Spazio dei nomi gerarchico è vantaggioso per le attività ad alta intensità di dati come i carichi di lavoro di analisi, AI e ML. Ecco alcuni scenari comuni in cui è consigliabile utilizzare un ambito di nomi gerarchico:
Elaborazione basata su Hadoop: i carichi di lavoro Hadoop e Spark in genere prevedono una struttura di archiviazione simile a un file system e una denominazione basata sul tempo per file e cartelle. Lo spazio dei nomi gerarchico si integra con il connettore Cloud Storage per fornire un throughput migliorato e ridenominazioni atomiche delle cartelle, migliorando l'integrità e la coerenza dei dati per molte pipeline di elaborazione dei dati.
Elaborazione di carichi di lavoro orientati ai file: carichi di lavoro come l'elaborazione di analisi in batch, i servizi finanziari o il calcolo ad alte prestazioni sono strutturati in partizioni in base a una gerarchia di cartelle e file. Lo spazio dei nomi gerarchico aiuta a gestire questi ambienti con uno spazio API per la gestione delle cartelle. Inoltre, lo spazio dei nomi gerarchico semplifica la gestione delle cartelle che contengono altre cartelle e altri oggetti. Con un unico comando API, puoi rinominare rapidamente una cartella e tutti i relativi contenuti, risparmiando tempo e risorse preziose.
Elaborazione di IA e ML: strumenti di AI e ML come TensorFlow, Pandas e PyTorch prevedono accesso e semantica come un file system. Lo spazio dei nomi gerarchico, soprattutto se combinato con FUSE di Cloud Storage, offre un aumento del throughput e un accesso efficiente ai dati. Di conseguenza, lo spazio dei nomi gerarchico migliora le prestazioni e l'affidabilità dell'iterazione del modello di ML.
Prima di attivare lo spazio dei nomi gerarchico per il bucket, devi prendere in considerazione le limitazioni dello spazio dei nomi gerarchico. Per informazioni sulle limitazioni degli spazi dei nomi gerarchici, consulta Limitazioni.
Vantaggi dello spazio dei nomi gerarchico
Quando attivi lo spazio dei nomi gerarchico per i tuoi bucket, puoi eseguire quanto segue:
Ottimizza l'organizzazione: puoi organizzare i dati in una struttura di cartelle gerarchica, che ti aiuta a gestire e individuare file o set di dati.
Stabilire un ecosistema simile a un file system: lo spazio dei nomi gerarchico introduce funzionalità simili a quelle di un file system, come cartelle, rinominazione di cartelle ed elencazione di cartelle, che sono utili per le applicazioni orientate ai file, incluso l'ecosistema Hadoop e i carichi di lavoro di AI e ML.
Miglioramento delle prestazioni: ridimensionando i carichi di lavoro con un'intensità di dati elevata per gestire un throughput più elevato, puoi migliorare il rendimento complessivo della tua applicazione.
Supporto piattaforme
I bucket con spazio dei nomi gerarchico supportano quanto segue Funzionalità della piattaforma Cloud Storage:
Tutte le API degli oggetti Cloud Storage e i modelli funzionalità di Cloud Storage. Per informazioni dettagliate sulle funzionalità non supportate, consulta Limiti.
Trasferimento di dati da un bucket standard a un bucket con dello spazio dei nomi gerarchico usando Storage Transfer Service.
Integrazione con i seguenti prodotti:
Connettore Cloud Storage, gestito da Dataproc per per i carichi di lavoro Hadoop. Per ulteriori informazioni, consulta Utilizzare lo spazio dei nomi gerarchico. per i carichi di lavoro Hadoop abilitati
Cloud Storage FUSE per l'accesso ai bucket in stile file system tramite client.
Limitazioni
Di seguito sono riportate le limitazioni dello spazio dei nomi gerarchico:
Devi scegliere se utilizzare o meno lo spazio dei nomi gerarchico quando crei il bucket. L'impostazione dello spazio dei nomi gerarchico del bucket non può essere modificata dopo la creazione del bucket.
Per abilitare lo spazio dei nomi gerarchico, in un bucket deve essere attivato anche l'accesso uniforme a livello di bucket.
Le seguenti funzionalità di Cloud Storage non sono supportate in preview per i bucket che utilizzano spazio dei nomi gerarchico:
- Eliminazione temporanea
- Autoclass
- Controllo delle versioni degli oggetti
- Blocco della conservazione degli oggetti
- Blocco di bucket
Passaggi successivi
- Crea e gestisci bucket con uno spazio dei nomi gerarchico abilitato.
- Creare e gestire le cartelle.
- Rinominare le cartelle.
- Utilizza lo spazio dei nomi gerarchico per i carichi di lavoro Hadoop.
Provalo
Se non conosci Google Cloud, crea un account per valutare le prestazioni di Cloud Storage in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
Prova Cloud Storage gratuitamente