Spazio dei nomi gerarchico

Questa pagina fornisce una panoramica dello spazio dei nomi gerarchico, delle funzionalità principali, dei casi d'uso comuni, dei vantaggi e delle limitazioni da considerare.

Panoramica

Lo spazio dei nomi gerarchico è una funzionalità offerta da Cloud Storage che consente di organizzare gli oggetti in cartelle. Con lo spazio dei nomi gerarchico, puoi archiviare i dati in una struttura di file system logica. L'organizzazione dei dati in una struttura di file system migliora le prestazioni, garantisce coerenza e semplifica la gestione di carichi di lavoro orientati ai file e ad alta intensità di dati.

Le operazioni di gestione delle cartelle offrono affidabilità e gestione, tra cui creazione, eliminazione, elenco e ridenominazione delle cartelle. L'organizzazione gerarchica degli oggetti semplifica l'organizzazione dei dati e snellisce le attività di gestione dei dati. Una cartella in un bucket in cui è abilitato uno spazio dei nomi gerarchico può contenere oggetti, altre cartelle o una combinazione di entrambi.

Puoi abilitare lo spazio dei nomi gerarchico solo quando crei un bucket. Per informazioni sull'abilitazione dello spazio dei nomi gerarchico per il tuo bucket, consulta Creare e gestire i bucket con lo spazio dei nomi gerarchico abilitato.

Il seguente diagramma mostra un esempio di bucket con spazio dei nomi gerarchico abilitato in cui gli oggetti sono organizzati in una struttura gerarchica di cartelle.

Figura 1. Gerarchia di bucket con cartelle e oggetti.
Figura 1. Gerarchia di bucket con cartelle e oggetti.

Funzionalità principali

Lo spazio dei nomi gerarchico fornisce le seguenti funzionalità:

  • Numero di query iniziali al secondo (QPS) più elevato: i bucket in cui è abilitato lo spazio dei nomi gerarchico offrono un valore QPS iniziale più elevato per le operazioni di lettura e scrittura rispetto ai bucket senza uno spazio dei nomi gerarchico abilitato. Il valore QPS iniziale più elevato semplifica la scalabilità dei carichi di lavoro che richiedono un uso intensivo di dati e offre una velocità effettiva migliore.

  • Cartelle: le cartelle fungono da container per oggetti e altre cartelle, con il supporto di operazioni come la creazione, l'eliminazione e il recupero delle cartelle.

  • Rinominare le cartelle: l'operazione di ridenominazione delle cartelle consente di rinominare atomicamente il percorso di una cartella e delle relative cartelle sottostanti senza eliminare gli oggetti. Questa tecnica è efficiente e fa risparmiare tempo, soprattutto per le cartelle di grandi dimensioni con più oggetti.

  • Elenca cartelle: l'operazione di elenco delle cartelle elenca tutte le cartelle nel bucket o sotto una cartella specifica, aiutandoti a gestire e comprendere la struttura dei dati archiviati all'interno di un bucket.

Quando devi abilitare lo spazio dei nomi gerarchico per il tuo bucket

Abilita lo spazio dei nomi gerarchico quando usi applicazioni che prevedono una gerarchia e una semantica di tipo file system. Lo spazio dei nomi gerarchico è vantaggioso per le attività ad alta intensità di dati come i carichi di lavoro di analisi, AI e ML. Ecco alcuni scenari comuni in cui dovresti prendere in considerazione l'utilizzo dello spazio dei nomi gerarchico:

  • Elaborazione basata su Hadoop: i carichi di lavoro Hadoop e Spark tradizionalmente si aspettano una struttura di archiviazione simile a un file system e una denominazione basata sul tempo per file e cartelle. Lo spazio dei nomi gerarchico si integra con il connettore Cloud Storage per fornire una velocità effettiva avanzata e rinominare le cartelle atomiche, migliorando l'integrità e la coerenza dei dati per molte pipeline di elaborazione dati.

  • Elaborazione dei carichi di lavoro orientati ai file: i carichi di lavoro, come l'elaborazione dell'analisi batch, i servizi finanziari o il computing ad alte prestazioni, sono strutturati in partizioni basate su una gerarchia di cartelle e file. Lo spazio dei nomi gerarchico consente di gestire questi ambienti con un'API dedicata per la gestione delle cartelle. Inoltre, lo spazio dei nomi gerarchico semplifica la gestione delle cartelle che contengono altre cartelle e oggetti. Con un singolo comando API puoi rinominare rapidamente una cartella e tutti i suoi contenuti, risparmiando tempo e risorse preziosi.

  • Elaborazione di IA e ML: gli strumenti di IA e ML come TensorFlow, Pandas e PyTorch prevedono accesso e semantica come un file system. Lo spazio dei nomi gerarchico , soprattutto se combinato con Cloud Storage FUSE, offre una velocità effettiva maggiore e un accesso ai dati efficiente. Di conseguenza, lo spazio dei nomi gerarchico migliora le prestazioni e l'affidabilità dell'iterazione del modello ML.

Prima di abilitare lo spazio dei nomi gerarchico per il tuo bucket, devi considerare le limitazioni di questo tipo di spazio. Per informazioni sulle limitazioni degli spazi dei nomi gerarchici, consulta Limitazioni.

Vantaggi dello spazio dei nomi gerarchico

Quando abiliti lo spazio dei nomi gerarchico per i tuoi bucket, puoi:

  • Ottimizza l'organizzazione: puoi organizzare i tuoi dati in una struttura gerarchica di cartelle, che ti aiuta a gestire e individuare file o set di dati.

  • Creazione di un ecosistema simile al file system: lo spazio dei nomi gerarchico introduce funzionalità simili a quelle del file system, come cartelle, ridenominazione delle cartelle e elenco delle cartelle, utili per le applicazioni orientate ai file, tra cui l'ecosistema Hadoop e i carichi di lavoro IA e ML.

  • Miglioramento delle prestazioni: scalando i carichi di lavoro ad alta intensità di dati per gestire una velocità effettiva più elevata, puoi migliorare le prestazioni complessive della tua applicazione.

Supporto piattaforme

I bucket con spazio dei nomi gerarchico supportano le seguenti funzionalità della piattaforma Cloud Storage:

  • tutte le API degli oggetti Cloud Storage e le funzionalità di Cloud Storage più diffuse. Per maggiori dettagli sulle funzionalità non supportate, consulta Limitazioni.

  • Trasferimento di dati da un bucket standard a un bucket con spazio dei nomi gerarchico utilizzando Storage Transfer Service.

  • Integrazione con i seguenti prodotti:

Limitazioni

Di seguito sono riportati i limiti dello spazio dei nomi gerarchico:

  • Puoi abilitare lo spazio dei nomi gerarchico solo quando crei un bucket. Non puoi modificare i bucket con uno spazio dei nomi semplice per includere uno spazio dei nomi gerarchico.

  • Le seguenti funzionalità di Cloud Storage non sono supportate in anteprima per i bucket che utilizzano lo spazio dei nomi gerarchico:

    • Eliminazione temporanea
    • Autoclass
    • Controllo delle versioni degli oggetti
    • ACL degli oggetti
    • Blocco della conservazione degli oggetti
    • Blocco di bucket
  • Sebbene sia possibile visualizzare i bucket creati con lo spazio dei nomi gerarchico nella console Google Cloud, non puoi gestire le relative cartelle utilizzando la console Google Cloud. Per la gestione delle cartelle, ti consigliamo di utilizzare la riga di comando, le API REST o le librerie client.

Passaggi successivi

Provalo

Se non conosci Google Cloud, crea un account per valutare le prestazioni di Cloud Storage in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.

Prova Cloud Storage gratuitamente