Questa pagina fornisce una panoramica di Cloud Storage e del suo funzionamento.
Cloud Storage è un servizio per l'archiviazione di oggetti in Google Cloud. Un oggetto è un dato immutabile costituito da un file di qualsiasi formato. Gli oggetti vengono memorizzati in container chiamati bucket.
Tutti i bucket sono associati a un progetto e puoi raggruppare i progetti in un'organizzazione. Ogni progetto, bucket, cartella gestita e oggetto in Google Cloud è una risorsa in Google Cloud, così come lo sono elementi come le istanze Compute Engine.
Dopo aver creato un progetto, puoi creare bucket Cloud Storage, caricare oggetti nei bucket e scaricare oggetti dai bucket. Puoi anche concedere autorizzazioni per rendere i tuoi dati accessibili ai principali da te specificati o a chiunque sulla rete internet pubblica.
La Google Cloud gerarchia
Ecco come la struttura di Cloud Storage può essere applicata a un caso reale:
Organizzazione: la tua azienda, chiamata Example Inc., crea un' Google Cloud organizzazione chiamata
exampleinc.org
.Progetto: la società Example Inc. sta creando diverse applicazioni, ognuna associata a un progetto. Ogni progetto ha il proprio insieme di API Cloud Storage, oltre ad altre risorse.
Bucket: ogni progetto può contenere più bucket, ovvero contenitori per memorizzare gli oggetti. Ad esempio, puoi creare un bucket
photos
per tutti i file di immagini generati dalla tua app e un bucketvideos
separato.Oggetto: ogni bucket può contenere un numero praticamente illimitato di singoli oggetti, come un'immagine denominata
puppy.png
.Cartella gestita: ogni bucket può contenere anche più cartelle gestite, che concedono un accesso aggiuntivo rispetto a quello concesso al bucket complessivo. Questo accesso aggiuntivo si applica agli oggetti con un prefisso corrispondente al nome della cartella gestita. Ad esempio, puoi creare una
animals/
cartella gestita, che concede agli utenti designati l'accesso aggiuntivo a oggetti comeanimals/puppy.png
eanimals/kitten.png
.Bucket abilitati per spazi di nomi gerarchici: per i bucket è possibile attivare lo spazio dei nomi gerarchico. I bucket con spazio dei nomi gerarchico attivo possono memorizzare i dati in una struttura di file system logica. Le operazioni di gestione delle cartelle forniscono affidabilità e funzionalità di gestione, tra cui creazione, eliminazione, elencazione e rinominazione delle cartelle. Lo spazio dei nomi gerarchico è utile per attività ad alta intensità di dati come i workload di analisi, AI e ML, in quanto offre limiti QPS iniziali fino a otto volte superiori per la lettura e la scrittura di oggetti rispetto ai bucket senza spazio dei nomi gerarchico abilitato.
Strumenti di base per Cloud Storage
Ecco alcuni modi di base per interagire con Cloud Storage:
Console: la console Google Cloud fornisce un'interfaccia visiva per gestire i dati in un browser.
Google Cloud CLI: l'interfaccia a riga di comando gcloud ti consente di interagire con Cloud Storage tramite un terminale utilizzando i comandi
gcloud storage
.Librerie client: le librerie client di Cloud Storage ti consentono di gestire i tuoi dati utilizzando uno dei tuoi linguaggi preferiti, tra cui C++, C#, Go, Java, Node.js, PHP, Python e Ruby.
Terraform: Terraform è uno strumento Infrastructure as Code (IaC) che puoi utilizzare per eseguire il provisioning dell'infrastruttura per Cloud Storage.
Cloud Storage FUSE: Cloud Storage FUSE ti consente di montare i bucket Cloud Storage sul tuo file system locale. In questo modo, le applicazioni possono leggere da un bucket o scrivere in un bucket utilizzando la semantica del file system standard.
gRPC: gRPC ti consente di interagire con Cloud Storage. gRPC è un framework RPC universale open source ad alte prestazioni sviluppato da Google che puoi utilizzare per definire i tuoi servizi utilizzando Protocol Buffers.
Protezione dei dati
Dopo aver caricato gli oggetti su Cloud Storage, hai un controllo granulare sulla modalità di protezione e condivisione dei dati. Di seguito sono riportati alcuni modi per proteggere i dati caricati su Cloud Storage:
Identity and Access Management: utilizza IAM per controllare chi ha accesso alle risorse del tuo Google Cloud progetto. Le risorse includono bucket e oggetti Cloud Storage, nonché altre entità come le istanze Compute Engine. Google Cloud Puoi concedere alle entità determinati tipi di accesso a bucket e oggetti, ad esempio
update
,create
odelete
.Crittografia dei dati: Cloud Storage utilizza la crittografia lato server per criptare i tuoi dati per impostazione predefinita. Puoi anche utilizzare opzioni di crittografia dei dati supplementari, come le chiavi di crittografia gestite dal cliente e le chiavi di crittografia fornite dal cliente.
Autenticazione: assicurati che chiunque acceda ai tuoi dati disponga di credenziali adeguate.
Blocco di bucket: regola la durata della conservazione degli oggetti nei bucket specificando un criterio di conservazione.
Eliminazione temporanea: evita la perdita permanente dei dati contro l'eliminazione accidentale o dannosa conservando gli oggetti e i bucket eliminati di recente. Per impostazione predefinita, Cloud Storage attiva l'eliminazione temporanea per tutti i bucket con un periodo di conservazione di sette giorni.
Controllo delle versioni degli oggetti: quando una versione attiva di un oggetto viene sostituita o eliminata, può essere conservata come versione non corrente se attivi il controllo delle versioni degli oggetti.
Filtro IP dei bucket (anteprima): con il filtro IP dei bucket, puoi limitare l'accesso a un bucket in base all'indirizzo IP di origine della richiesta e proteggere i tuoi dati da accessi non autorizzati da indirizzi IP specifici o da Virtual Private Cloud (VPC).
Nomi delle risorse
Ogni risorsa ha un nome univoco che la identifica, in modo simile a un nome file.
I bucket hanno un nome della risorsa nel formato
projects/_/buckets/BUCKET_NAME
, dove
BUCKET_NAME
è l'ID del bucket. Gli oggetti hanno un
nome risorsa nel formato
projects/_/buckets/BUCKET_NAME/objects/OBJECT_NAME
,
dove OBJECT_NAME
è l'ID dell'oggetto.
Un #NUMBER
aggiunto alla fine del nome della risorsa indica una generazione specifica dell'oggetto. #0
è un identificatore speciale per la versione più recente di un oggetto. #0
è utile da aggiungere quando il nome dell'oggetto termina con una stringa che altrimenti verrebbe interpretata come un numero di generazione.
Guide rapide
Per conoscere le nozioni di base sull'utilizzo di Cloud Storage, consulta le seguenti guide:
Passaggi successivi
- Scopri le nozioni di base di Cloud Storage tramite la console Google Cloud o Google Cloud CLI.
- Prova le Google Cloud soluzioni di avvio rapido che utilizzano Cloud Storage.
- Inizia a utilizzare le librerie client.
- Importa rapidamente i dati online in Cloud Storage o tra i bucket Cloud Storage utilizzando Storage Transfer Service.