Spazio dei nomi gerarchico

Questa pagina fornisce una panoramica dello spazio dei nomi gerarchico, delle funzionalità principali e i casi d'uso, i vantaggi e le limitazioni da considerare.

Panoramica

Lo spazio dei nomi gerarchico è una funzionalità offerta da Cloud Storage che consente di organizzare gli oggetti in cartelle. Con lo spazio dei nomi gerarchico, per archiviare i dati in una struttura logica di file system. Organizza i dati in un struttura del file system migliora le prestazioni, garantisce la coerenza e semplifica la gestione di carichi di lavoro ad alta intensità di dati e orientati ai file.

Le operazioni di gestione delle cartelle offrono affidabilità e gestione funzionalità che includono la creazione, l'eliminazione, l'elenco e la ridenominazione delle cartelle. La l'organizzazione gerarchica degli oggetti semplifica l'organizzazione dei dati e semplifica le attività di gestione dei dati. Una cartella in un bucket con dello spazio dei nomi gerarchico abilitato può contenere oggetti, altre cartelle o combinazione di entrambi.

Puoi abilitare lo spazio dei nomi gerarchico solo quando crei un bucket. Per informazioni sull'attivazione dello spazio dei nomi gerarchico per il tuo bucket, consulta Creare e gestire bucket spazio dei nomi gerarchico abilitato.

Il seguente diagramma mostra un esempio di un bucket con uno spazio dei nomi gerarchico abilitato, dove gli oggetti sono organizzati in una struttura gerarchica di cartelle.

Figura 1. Gerarchia di bucket con cartelle e oggetti.
Figura 1. Gerarchia di bucket con cartelle e oggetti.

Funzionalità principali

Lo spazio dei nomi gerarchico fornisce le seguenti funzionalità:

  • Numero di query iniziali al secondo (QPS) più elevato: bucket con lo spazio dei nomi gerarchico abilitato offre una QPS iniziale più elevata per operazioni di scrittura rispetto ai bucket senza spazio dei nomi gerarchico in un bucket con il controllo delle versioni attivo. Il valore QPS iniziale più elevato semplifica la scalabilità con uso intensivo di dati carichi di lavoro prioritari e migliora la velocità effettiva.

  • Cartelle: le cartelle fungono da contenitore per oggetti e altre cartelle. con supporto per operazioni come la creazione, l'eliminazione e il recupero delle cartelle.

  • Rinominare le cartelle: l'operazione di ridenominazione delle cartelle ti consente di rinomina il percorso di una cartella e le relative cartelle sottostanti senza eliminare alcun di oggetti strutturati. Questa tecnica è efficace e fa risparmiare tempo, soprattutto con più oggetti.

  • Elenca cartelle: l'operazione di elenco delle cartelle elenca tutte le cartelle nel bucket. o in una cartella specifica, aiutandoti a gestire e comprendere dei dati archiviati in un bucket.

Quando devi abilitare lo spazio dei nomi gerarchico per il tuo bucket

Dovresti valutare l'abilitazione dello spazio dei nomi gerarchico quando utilizzi applicazioni che si aspettano una gerarchia e una semantica di tipo file system. Spazio dei nomi gerarchico è vantaggioso per attività ad alta intensità di dati come carichi di lavoro di analisi, AI e ML. Di seguito sono riportati alcuni scenari comuni in cui dovresti prendere in considerazione l'utilizzo spazio dei nomi gerarchico:

  • Elaborazione basata su Hadoop: i carichi di lavoro Hadoop e Spark tradizionalmente si aspettano una struttura di archiviazione di tipo file system e una denominazione basata sul tempo per file e cartelle. Lo spazio dei nomi gerarchico si integra con il connettore Cloud Storage per migliorare la velocità effettiva e le ridenominazioni delle cartelle atomiche, migliorando i dati e coerenza per molte pipeline di elaborazione dati.

  • Elaborazione dei carichi di lavoro orientati ai file: carichi di lavoro come l'analisi batch di elaborazione dei dati, servizi finanziari o computing ad alte prestazioni sono strutturati in partizioni basate su una gerarchia di cartelle e file. Lo spazio dei nomi gerarchico aiuta a gestire questi ambienti con uno spazio API per la gestione delle cartelle. Inoltre, lo spazio dei nomi gerarchico semplifica la gestione di cartelle che contengono altre cartelle e oggetti. Con una singola API puoi rinominare rapidamente una cartella e il suo contenuto, salvando in termini di tempo e risorse.

  • Elaborazione di IA e ML: strumenti di AI e ML come TensorFlow, Pandas e PyTorch prevedono accesso e semantica come un file system. Spazio dei nomi gerarchico , soprattutto se combinato con Cloud Storage FUSE, offre una velocità effettiva superiore e un accesso efficiente ai dati. Di conseguenza, lo spazio dei nomi gerarchico migliora le prestazioni e l'affidabilità dell'iterazione del modello.

Prima di abilitare lo spazio dei nomi gerarchico per il tuo bucket, devi considerare la classe Limitazioni dello spazio dei nomi gerarchico. Per informazioni su limitazioni dello spazio dei nomi gerarchico, consulta Limitazioni.

Vantaggi dello spazio dei nomi gerarchico

Quando abiliti lo spazio dei nomi gerarchico per i tuoi bucket, puoi eseguire seguenti:

  • Ottimizza l'organizzazione: puoi organizzare i dati in un ordine gerarchico struttura di cartelle, che aiuta a gestire e individuare file o set di dati.

  • Creazione di un ecosistema di tipo file system: spazio dei nomi gerarchico introduce funzionalità simili a quelle dei file system come cartelle, ridenominazione delle cartelle e l'elenco di cartelle, utile per le applicazioni orientate ai file, tra cui l'ecosistema Hadoop e i carichi di lavoro di AI e ML.

  • Miglioramento delle prestazioni: mediante la scalabilità dei carichi di lavoro con uso intensivo dei dati per gestire con una velocità effettiva più elevata, puoi migliorare le prestazioni complessive un'applicazione.

Supporto piattaforme

I bucket con spazio dei nomi gerarchico supportano quanto segue Funzionalità della piattaforma Cloud Storage:

  • Tutte le API degli oggetti Cloud Storage e i modelli funzionalità di Cloud Storage. Per maggiori dettagli sulle funzionalità non supportate, consulta la sezione Limitazioni.

  • Trasferimento di dati da un bucket standard a un bucket con dello spazio dei nomi gerarchico usando Storage Transfer Service.

  • Integrazione con i seguenti prodotti:

Limitazioni

Di seguito sono riportati i limiti dello spazio dei nomi gerarchico:

  • Puoi abilitare lo spazio dei nomi gerarchico solo quando crei di sincronizzare la directory di una VM con un bucket. Non puoi modificare i bucket con uno spazio dei nomi semplice per includere un dello spazio dei nomi gerarchico.

  • Le seguenti funzionalità di Cloud Storage non sono supportate in preview per i bucket che utilizzano spazio dei nomi gerarchico:

    • Eliminazione temporanea
    • Autoclass
    • Controllo delle versioni degli oggetti
    • ACL degli oggetti
    • Blocco della conservazione degli oggetti
    • Blocco di bucket
  • Sebbene sia possibile visualizzare i bucket creati con lo spazio dei nomi gerarchico nella console Google Cloud, non puoi gestire le relative cartelle utilizzando nella console Google Cloud. Ti consigliamo di utilizzare la riga di comando, le API REST o il client librerie per la gestione delle cartelle.

Passaggi successivi

Provalo

Se non conosci Google Cloud, crea un account per valutare le prestazioni di Cloud Storage in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.

Prova Cloud Storage gratuitamente