Questa pagina è stata tradotta dall'API Cloud Translation.

Operazioni batch di archiviazione

Questo documento descrive le operazioni batch di archiviazione, una funzionalità di Cloud Storage che consente di eseguire operazioni su miliardi di oggetti in modalità serverless. Utilizzando le operazioni batch di archiviazione, puoi automatizzare operazioni API su larga scala su miliardi di oggetti, riducendo il tempo di sviluppo necessario per scrivere e gestire gli script per ogni richiesta.

Per scoprire come creare job di operazioni batch di archiviazione, consulta Creare e gestire job di operazioni batch di archiviazione.

Panoramica

Le operazioni batch di archiviazione consentono di eseguire una delle quattro trasformazioni su più oggetti contemporaneamente: inserimento di un blocco oggetto, eliminazione di un oggetto, aggiornamento dei metadati dell'oggetto e riscrittura degli oggetti. Per utilizzare le operazioni batch di archiviazione, crea una configurazione del job che definisce quali trasformazioni devono essere applicate a quali oggetti.

La creazione di un'operazione batch restituisce un'operazione a lunga esecuzione (LRO) che indica lo stato della richiesta: se la trasformazione è stata applicata a tutti gli oggetti specificati nella richiesta.

Vantaggi

Scalabilità: esegui trasformazioni su milioni di oggetti con un unico job di operazioni batch di archiviazione.
Esecuzione serverless: esegui job batch in un ambiente serverless, eliminando la necessità di gestire l'infrastruttura.
Automazione: automatizza attività complesse e ripetitive, migliorando l'efficienza operativa.
Tempi di sviluppo ridotti: evita di scrivere e gestire script personalizzati complessi.
Rendimento: completa le operazioni urgenti entro il tempo richiesto. Con più job batch eseguiti contemporaneamente in un bucket, puoi elaborare fino a un miliardo di oggetti entro tre ore.
Nuovi tentativi automatici: nuovi tentativi automatici per le operazioni non riuscite.
Monitoraggio dei job: monitoraggio dettagliato dell'avanzamento per monitorare lo stato e il completamento di tutti i job.

Casi d'uso

Se utilizzate con i set di dati Storage Insights, le operazioni batch di archiviazione consentono di svolgere le seguenti attività:

Gestione della sicurezza:
- Imposta le chiavi di crittografia su più oggetti utilizzando il metodo rewrite object.
- Applica o rimuovi i blocchi oggetto per controllare l'immutabilità degli oggetti.
Conformità:
- Utilizza i blocchi degli oggetti per soddisfare i requisiti di conservazione dei dati per la conformità normativa.
- Elimina i dati tra intervalli di tempo specifici per soddisfare i requisiti di conformità all'azzeramento.
Trasformazione dei dati: esegui aggiornamenti collettivi ai metadati degli oggetti.
Ottimizzazione dei costi: elimina in blocco gli oggetti nei bucket Cloud Storage per ridurre i costi di archiviazione.

Configurazioni dei job

Per creare un job di operazioni batch di archiviazione, devi impostare le seguenti configurazioni del job. Le configurazioni dei job sono parametri che controllano la definizione del job per diversi requisiti di elaborazione.

Nome job: un nome univoco per identificare il job di operazioni batch di archiviazione. Viene utilizzato per il monitoraggio e il riferimento al job. I nomi dei job sono alfanumerici, ad esempio job-01.
Descrizione del lavoro (facoltativo): una breve descrizione dello scopo del lavoro. Ciò è utile per comprendere e documentare i dettagli del job. Ad esempio, Deletes all objects in a bucket.
Nome bucket: il nome del bucket di archiviazione contenente gli oggetti da elaborare. È essenziale per individuare i dati di input. Ad esempio: my-bucket. Puoi specificare un solo nome bucket per un job.
Selezione degli oggetti: i criteri di selezione che definiscono gli oggetti da elaborare. Puoi specificare i criteri utilizzando una delle seguenti opzioni:
- Manifest: crea un manifest e specifica la sua posizione quando crei il job di operazioni batch di archiviazione. Il manifest è un file CSV caricato su Google Cloudche contiene un oggetto o un elenco di oggetti che vuoi elaborare. Ogni riga del manifest deve includere bucket e name dell'oggetto. Facoltativamente, puoi specificare il generation dell'oggetto. Se non specifichi generation, viene utilizzata la versione corrente dell'oggetto.
  
  Il file deve includere una riga di intestazione nel seguente formato:
  
  bucket,name,generation
  
  Di seguito è riportato un esempio di manifest:
```
bucket,name,generation
bucket_1,object_1,generation_1
bucket_1,object_2,generation_2
bucket_1,object_3,generation_3
```
  Attenzione :assicurati che il manifest includa solo gli oggetti del bucket fornito nel job di operazioni batch di archiviazione. Le righe che fanno riferimento ad altri bucket vengono ignorate.
  
  Puoi anche creare un manifest utilizzando i set di dati Storage Insights. Per i dettagli, vedi Creare un manifest utilizzando i set di dati di Storage Insights.
- Prefissi degli oggetti: specifica un elenco di prefissi per filtrare gli oggetti all'interno del bucket. Vengono elaborati solo gli oggetti con questi prefissi. Se vuoto, vengono elaborati tutti gli oggetti nel bucket.
Tipo di job:le operazioni batch di archiviazione supportano i seguenti tipi di job, eseguendo un singolo job per operazione batch.
- Eliminazione di oggetti: puoi eliminare oggetti all'interno di un bucket. Ciò è fondamentale per l'ottimizzazione dei costi, la gestione del ciclo di vita dei dati e la conformità alle norme di eliminazione dei dati.
  
  Attenzione :per impostazione predefinita, Cloud Storage conserva gli oggetti eliminati temporaneamente per un periodo di sette giorni. Se hai eliminato accidentalmente gli oggetti, puoi ripristinarli durante questo periodo. Tuttavia, se hai disabilitato l'eliminazione temporanea per il bucket, non puoi recuperare gli oggetti eliminati.
- Aggiornamenti dei metadati: puoi modificare i metadati dell'oggetto. Ciò include l'aggiornamento dei metadati personalizzati, della classe di archiviazione e di altre proprietà dell'oggetto.
- Aggiornamenti dei blocchi oggetto: puoi attivare o disattivare i blocchi oggetto. I blocchi degli oggetti impediscono che vengano eliminati o modificati, il che è essenziale per la conformità e la conservazione dei dati.
- Aggiornamenti delle chiavi di crittografia degli oggetti: puoi gestire le chiavi di crittografia gestite dal cliente per uno o più oggetti. Ciò include l'applicazione o la modifica delle chiavi di crittografia utilizzando il metodo rewrite object.

Limitazioni

Le operazioni batch di archiviazione presentano le seguenti limitazioni:

I job di operazioni batch di Storage hanno una durata massima di 14 giorni. Qualsiasi lavoro in corso che non viene completato entro 14 giorni dalla sua creazione viene annullato automaticamente.
Non è consigliabile eseguire più di 20 job di operazioni batch simultanee sullo stesso bucket.
Le operazioni batch di archiviazione non sono supportate nei seguenti bucket:
- Bucket in cui è abilitata l'opzione Pagamenti a carico del richiedente.
- Bucket che si trovano nella regione us-west8.

Passaggi successivi

Creare e gestire job di operazioni batch di archiviazione