Questa architettura di riferimento descrive come importare di nuovo in Cloud Logging i log esportati in precedenza in Cloud Storage.
Questa architettura di riferimento è pensata per ingegneri e sviluppatori, inclusi DevOps, Site Reliability Engineer (SRE) e investigatori della sicurezza, che vogliono configurare ed eseguire il job di importazione dei log. Questo documento presuppone che tu sappia come eseguire i job Cloud Run e come utilizzare Cloud Storage e Cloud Logging.
Architettura
Il seguente diagramma mostra come vengono utilizzati i servizi Google Cloud in questa architettura di riferimento:
Questo flusso di lavoro include i seguenti componenti:
- Bucket Cloud Storage: contiene i log esportati in precedenza che vuoi importare di nuovo in Cloud Logging. Poiché questi log sono stati esportati in precedenza, sono organizzati nel formato di esportazione previsto.
- Job Cloud Run: esegue il processo di importazione dei log:
- Legge gli oggetti che archiviano le voci di log da Cloud Storage.
- Trova i log esportati per l'ID log specificato, nell'intervallo di tempo richiesto, in base all'organizzazione dei log esportati nel bucket Cloud Storage.
- Converte gli oggetti in strutture
LogEntry
dell'API Cloud Logging. Più struttureLogEntry
vengono aggregate in batch, per ridurre il consumo della quota dell'API Cloud Logging. L'architettura gestisce gli errori di quota quando necessario. - Scrive le voci di log convertite in Cloud Logging. Se esegui più volte lo stesso job, possono essere generate voci duplicate. Per saperne di più, vedi Eseguire il job di importazione.
- Cloud Logging: importa e archivia le voci di log convertite.
Le voci di log vengono elaborate come descritto nella
panoramica su routing e archiviazione.
- Si applicano le quote e i limiti di Logging, inclusi quelli dell'API Cloud Logging e un periodo di conservazione di 30 giorni. Questa architettura di riferimento è progettata per funzionare con le quote di scrittura predefinite, con un meccanismo di ripetizione di base. Se la quota di scrittura è inferiore a quella predefinita, l'implementazione potrebbe non riuscire.
- I log importati non sono inclusi nelle metriche basate sui log, perché i relativi timestamp sono nel passato. Tuttavia, se scegli di utilizzare un'etichetta, il timestamp registra l'ora di importazione e i log sono inclusi nei dati delle metriche.
- BigQuery: utilizza SQL per eseguire query analitiche sui log importati (facoltativo). Per importare i log di controllo da Cloud Storage, questa architettura modifica gli ID log; devi tenere conto di questa ridenominazione quando esegui query sui log importati.
Caso d'uso
Potresti scegliere di implementare questa architettura se la tua organizzazione richiede un'analisi aggiuntiva dei log per le indagini sugli incidenti o altri controlli degli eventi passati. Ad esempio, potresti voler analizzare le connessioni ai tuoi database per il primo trimestre dell'anno scorso, nell'ambito di un controllo dell'accesso al database.
Alternative di progettazione
Questa sezione descrive le alternative al design predefinito mostrato in questo documento sull'architettura di riferimento.
Periodo di conservazione e log importati
Cloud Logging richiede che le voci di log in entrata abbiano timestamp che non superino un periodo di conservazione di 30 giorni. Le voci di log importate con timestamp precedenti a 30 giorni dalla data di importazione non vengono archiviate.
Questa architettura convalida l'intervallo di date impostato nel job Cloud Run per evitare l'importazione di log più vecchi di 29 giorni, lasciando un margine di sicurezza di un giorno.
Per importare log precedenti a 29 giorni, devi apportare le seguenti modifiche al codice di implementazione, quindi creare una nuova immagine container da utilizzare nella configurazione del job Cloud Run.
- Rimuovere la convalida di 30 giorni dell'intervallo di date
- Aggiungi il timestamp originale come etichetta utente alla voce di log
- Reimposta l'etichetta del timestamp della voce di log per consentirne l'importazione con il timestamp corrente
Quando utilizzi questa modifica, devi utilizzare il
campo labels
anziché il
campo timestamp
nelle query di Log Analytics. Per ulteriori informazioni sulle query e sugli esempi di Log Analytics, consulta Query SQL di esempio.
Considerazioni sulla progettazione
Le seguenti linee guida possono aiutarti a sviluppare un'architettura che soddisfi i requisiti della tua organizzazione.
Ottimizzazione dei costi
Il costo dell'importazione dei log utilizzando questa architettura di riferimento ha più fattori che contribuiscono.
Utilizzi i seguenti componenti fatturabili di Google Cloud:
- Cloud Logging (si applicano i costi del periodo di conservazione dei log)
- Cloud Run
- API Cloud Storage
Prendi in considerazione i seguenti fattori che potrebbero aumentare i costi:
- Duplicazione dei log: per evitare costi aggiuntivi di archiviazione dei log, non eseguire il job di importazione con la stessa configurazione più volte.
- Archiviazione in destinazioni aggiuntive: per evitare costi aggiuntivi di archiviazione dei log, disattiva i criteri di routing nel progetto di destinazione per impedire l'archiviazione dei log in posizioni aggiuntive o l'inoltro dei log ad altre destinazioni, come Pub/Sub o BigQuery.
- CPU e memoria aggiuntive: se il job di importazione scade, potresti dover aumentare la CPU e la memoria del job di importazione nella configurazione del job di importazione. L'aumento di questi valori potrebbe aumentare i costi di Cloud Run sostenuti.
- Attività aggiuntive: se il numero previsto di log da importare ogni giorno nell'intervallo di tempo è elevato, potrebbe essere necessario aumentare il numero di attività nella configurazione del job di importazione. Il job suddividerà l'intervallo di tempo equamente tra le attività, in modo che ciascuna elabori contemporaneamente un numero simile di giorni dell'intervallo. L'aumento del numero di attività potrebbe aumentare i costi di Cloud Run sostenuti.
- Classe di archiviazione: se la classe di archiviazione del bucket Cloud Storage è diversa da Standard, ad esempio Nearline, Durable Reduced Availability (DRA) o Coldline, potresti incorrere in costi aggiuntivi.
- Traffico di dati tra località diverse: configura il job di importazione in modo che venga eseguito nella stessa località del bucket Cloud Storage da cui importi i log. In caso contrario, potrebbero essere addebitati costi per il traffico di rete in uscita.
Per generare una stima dei costi in base all'utilizzo previsto, inclusi i job Cloud Run, utilizza il Calcolatore prezzi.
Efficienza operativa
Questa sezione descrive le considerazioni per la gestione delle query analitiche dopo il deployment della soluzione.
Nomi e query dei log
I log vengono archiviati nel progetto definito nel
campo logName
della voce di log. Per importare i log nel progetto selezionato, questa architettura
modifica il campo logName
di ogni log importato. I log di importazione vengono archiviati nel bucket di log predefinito del progetto selezionato con l'ID log imported_logs
(a meno che il progetto non abbia una policy di routing dei log che modifichi la destinazione di archiviazione).
Il valore originale del campo logName
viene conservato nel
campo labels
con la chiave original_logName
.
Quando esegui query sui log importati, devi tenere conto della posizione del valore logName
originale. Per ulteriori informazioni sulle query e sugli esempi di Log Analytics,
consulta Query SQL di esempio.
Ottimizzazione delle prestazioni
Se il volume di log che stai importando supera i limiti di capacità di Cloud Run, il job potrebbe scadere prima del completamento dell'importazione. Per evitare un'importazione
incompleta dei dati, valuta la possibilità di aumentare il valore di tasks
nel
job di importazione. L'aumento delle risorse CPU e memoria può anche contribuire a migliorare le prestazioni delle attività quando aumenti il numero di attività.
Deployment
Per eseguire il deployment di questa architettura, consulta la pagina Esegui il deployment di un job per importare i log da Cloud Storage a Cloud Logging.
Passaggi successivi
- Esamina il codice di implementazione nel repository GitHub.
- Scopri come analizzare i log importati utilizzando Analisi dei log e SQL.
- Per ulteriori architetture di riferimento, diagrammi e best practice, esplora il Cloud Architecture Center.
Collaboratori
Autore: Leonid Yankulin | Developer Relations Engineer
Altri collaboratori:
- Summit Tuladhar | Senior Staff Software Engineer
- Wilton Wong | Enterprise Architect
- Xiang Shen | Solutions Architect