Panoramica del prodotto Cloud Storage

Questa pagina fornisce una panoramica di Cloud Storage e del suo funzionamento.

Cloud Storage è un servizio per l'archiviazione di oggetti in Google Cloud. Un oggetto è un dato immutabile costituito da un file di qualsiasi formato. Gli oggetti vengono memorizzati in container chiamati bucket.

Tutti i bucket sono associati a un progetto e puoi raggruppare i progetti in un'organizzazione. Ogni progetto, bucket, cartella gestita e oggetto in Google Cloud è una risorsa in Google Cloud, così come lo sono elementi come le istanze Compute Engine.

Dopo aver creato un progetto, puoi creare bucket Cloud Storage, caricare oggetti nei bucket e scaricare oggetti dai bucket. Puoi anche concedere autorizzazioni per rendere i tuoi dati accessibili ai principali da te specificati o a chiunque sulla rete internet pubblica.

La Google Cloud gerarchia

Ecco come la struttura di Cloud Storage può essere applicata a un caso reale:

  • Organizzazione: la tua azienda, chiamata Example Inc., crea un' Google Cloud organizzazione chiamata exampleinc.org.

  • Progetto: la società Example Inc. sta creando diverse applicazioni, ognuna associata a un progetto. Ogni progetto ha il proprio insieme di API Cloud Storage, oltre ad altre risorse.

  • Bucket: ogni progetto può contenere più bucket, ovvero contenitori per memorizzare gli oggetti. Ad esempio, puoi creare un bucket photos per tutti i file di immagini generati dalla tua app e un bucket videos separato.

  • Oggetto: ogni bucket può contenere un numero praticamente illimitato di singoli oggetti, come un'immagine denominata puppy.png.

  • Cartella gestita: ogni bucket può contenere anche più cartelle gestite, che concedono un accesso aggiuntivo rispetto a quello concesso al bucket complessivo. Questo accesso aggiuntivo si applica agli oggetti con un prefisso corrispondente al nome della cartella gestita. Ad esempio, puoi creare una animals/cartella gestita, che concede agli utenti designati l'accesso aggiuntivo a oggetti come animals/puppy.png e animals/kitten.png.

  • Bucket abilitati per spazi di nomi gerarchici: per i bucket è possibile attivare lo spazio dei nomi gerarchico. I bucket con spazio dei nomi gerarchico attivo possono memorizzare i dati in una struttura di file system logica. Le operazioni di gestione delle cartelle forniscono affidabilità e funzionalità di gestione, tra cui creazione, eliminazione, elencazione e rinominazione delle cartelle. Lo spazio dei nomi gerarchico è utile per attività ad alta intensità di dati come i workload di analisi, AI e ML, in quanto offre limiti QPS iniziali fino a otto volte superiori per la lettura e la scrittura di oggetti rispetto ai bucket senza spazio dei nomi gerarchico abilitato.

Strumenti di base per Cloud Storage

Ecco alcuni modi di base per interagire con Cloud Storage:

  • Console: la console Google Cloud fornisce un'interfaccia visiva per gestire i dati in un browser.

  • Google Cloud CLI: l'interfaccia a riga di comando gcloud ti consente di interagire con Cloud Storage tramite un terminale utilizzando i comandi gcloud storage.

  • Librerie client: le librerie client di Cloud Storage ti consentono di gestire i tuoi dati utilizzando uno dei tuoi linguaggi preferiti, tra cui C++, C#, Go, Java, Node.js, PHP, Python e Ruby.

  • API REST: gestisci i dati utilizzando l'API JSON o XML.

  • Terraform: Terraform è uno strumento Infrastructure as Code (IaC) che puoi utilizzare per eseguire il provisioning dell'infrastruttura per Cloud Storage.

  • Cloud Storage FUSE: Cloud Storage FUSE ti consente di montare i bucket Cloud Storage sul tuo file system locale. In questo modo, le applicazioni possono leggere da un bucket o scrivere in un bucket utilizzando la semantica del file system standard.

  • gRPC: gRPC ti consente di interagire con Cloud Storage. gRPC è un framework RPC universale open source ad alte prestazioni sviluppato da Google che puoi utilizzare per definire i tuoi servizi utilizzando Protocol Buffers.

Protezione dei dati

Dopo aver caricato gli oggetti su Cloud Storage, hai un controllo granulare sulla modalità di protezione e condivisione dei dati. Di seguito sono riportati alcuni modi per proteggere i dati caricati su Cloud Storage:

  • Identity and Access Management: utilizza IAM per controllare chi ha accesso alle risorse del tuo Google Cloud progetto. Le risorse includono bucket e oggetti Cloud Storage, nonché altre entità come le istanze Compute Engine. Google Cloud Puoi concedere alle entità determinati tipi di accesso a bucket e oggetti, ad esempio update, create o delete.

  • Crittografia dei dati: Cloud Storage utilizza la crittografia lato server per criptare i tuoi dati per impostazione predefinita. Puoi anche utilizzare opzioni di crittografia dei dati supplementari, come le chiavi di crittografia gestite dal cliente e le chiavi di crittografia fornite dal cliente.

  • Autenticazione: assicurati che chiunque acceda ai tuoi dati disponga di credenziali adeguate.

  • Blocco di bucket: regola la durata della conservazione degli oggetti nei bucket specificando un criterio di conservazione.

  • Eliminazione temporanea: evita la perdita permanente dei dati contro l'eliminazione accidentale o dannosa conservando gli oggetti e i bucket eliminati di recente. Per impostazione predefinita, Cloud Storage attiva l'eliminazione temporanea per tutti i bucket con un periodo di conservazione di sette giorni.

  • Controllo delle versioni degli oggetti: quando una versione attiva di un oggetto viene sostituita o eliminata, può essere conservata come versione non corrente se attivi il controllo delle versioni degli oggetti.

  • Filtro IP dei bucket (anteprima): con il filtro IP dei bucket, puoi limitare l'accesso a un bucket in base all'indirizzo IP di origine della richiesta e proteggere i tuoi dati da accessi non autorizzati da indirizzi IP specifici o da Virtual Private Cloud (VPC).

Nomi delle risorse

Ogni risorsa ha un nome univoco che la identifica, in modo simile a un nome file. I bucket hanno un nome della risorsa nel formato projects/_/buckets/BUCKET_NAME, dove BUCKET_NAME è l'ID del bucket. Gli oggetti hanno un nome risorsa nel formato projects/_/buckets/BUCKET_NAME/objects/OBJECT_NAME, dove OBJECT_NAME è l'ID dell'oggetto.

Un #NUMBER aggiunto alla fine del nome della risorsa indica una generazione specifica dell'oggetto. #0 è un identificatore speciale per la versione più recente di un oggetto. #0 è utile da aggiungere quando il nome dell'oggetto termina con una stringa che altrimenti verrebbe interpretata come un numero di generazione.

Guide rapide

Per conoscere le nozioni di base sull'utilizzo di Cloud Storage, consulta le seguenti guide:

Passaggi successivi