Ce document explique comment déployer l'architecture de référence décrite dans Importer des journaux de Cloud Storage vers Cloud Logging.
Ces instructions sont destinées aux ingénieurs et aux développeurs, y compris les DevOps, les ingénieurs en fiabilité des sites (SRE) et les enquêteurs de sécurité, qui souhaitent configurer et exécuter la tâche d'importation des journaux. Ce document suppose également que vous savez exécuter des tâches d'importation Cloud Run et que vous savez utiliser Cloud Storage et Cloud Logging.
Architecture
Le diagramme suivant montre comment les services Google Cloud sont utilisés dans cette architecture de référence:
Pour plus d'informations, consultez la section Importer des journaux depuis Cloud Storage vers Cloud Logging.
Objectifs
- Créer et configurer une tâche d'importation Cloud Run
- Créer un compte de service pour exécuter le pipeline
Coûts
Dans ce document, vous utilisez les composants facturables suivants de Google Cloud :
Obtenez une estimation des coûts en fonction de votre utilisation prévue à l'aide du simulateur de coût.
Avant de commencer
Assurez-vous que les journaux que vous souhaitez importer ont déjà été exportés vers Cloud Storage, ce qui signifie qu'ils sont déjà organisés dans le format d'exportation attendu.
In the Google Cloud console, activate Cloud Shell.
Create or select a Google Cloud project.
-
Create a Google Cloud project:
gcloud projects create PROJECT_ID
Replace
PROJECT_ID
with a name for the Google Cloud project you are creating. -
Select the Google Cloud project that you created:
gcloud config set project PROJECT_ID
Replace
PROJECT_ID
with your Google Cloud project name.
-
Assurez-vous que la facturation est activée pour votre projet Google Cloud .
Enable the Cloud Run and Identity and Access Management (IAM) APIs:
gcloud services enable run.googleapis.com
iam.googleapis.com
Remplacez PROJECT_ID par l'ID du projet de destination.
Rôles requis
Pour obtenir les autorisations nécessaires pour déployer cette solution, demandez à votre administrateur de vous accorder les rôles IAM suivants:
-
Pour accorder le rôle Écrivain de journaux au bucket de journaux :
Administrateur IAM de projet (
roles/resourcemanager.projectIamAdmin
) sur le projet de destination -
Pour attribuer le rôle "Lecteur des objets de l'espace de stockage" au bucket de stockage :
Storage Admin (
roles/storage.admin
) sur le projet où le bucket de stockage est hébergé. -
Pour créer un compte de service :
Créer des comptes de service (
roles/iam.serviceAccountCreator
) sur le projet de destination -
Pour activer les services dans le projet :
Administrateur de l'utilisation des services (
roles/serviceusage.serviceUsageAdmin
) sur le projet de destination -
Pour mettre à niveau le bucket de journaux et supprimer les journaux importés :
Administrateur de journalisation (
roles/logging.admin
) sur le projet de destination -
Pour créer, exécuter et modifier la tâche d'importation :
Développeur Cloud Run (
roles/run.developer
) sur le projet de destination
Pour en savoir plus sur l'attribution de rôles, consultez la page Gérer l'accès aux projets, aux dossiers et aux organisations.
Vous pouvez également obtenir les autorisations requises via des rôles personnalisés ou d'autres rôles prédéfinis.
Mettre à niveau un bucket de journaux pour utiliser l'Analyse de journaux
Nous vous recommandons d'utiliser le bucket de journaux par défaut et de le mettre à niveau pour utiliser Log Analytics. Toutefois, dans un environnement de production, vous pouvez utiliser votre propre bucket de journaux si le bucket par défaut ne répond pas à vos exigences. Si vous décidez d'utiliser votre propre bucket, vous devez acheminer les journaux ingérés vers le projet de destination vers ce bucket de journaux. Pour en savoir plus, consultez les pages Configurer des buckets de journaux et Créer un récepteur.
Lorsque vous mettez à niveau le bucket, vous pouvez utiliser SQL pour interroger et analyser vos journaux. La mise à niveau du bucket ou l'utilisation d'Log Analytics n'entraînent aucuns frais supplémentaires.
Pour mettre à niveau le bucket de journaux par défaut dans le projet de destination, procédez comme suit:
Mettez à niveau le bucket de journaux par défaut pour utiliser Log Analytics:
gcloud logging buckets update BUCKET_ID --location=LOCATION --enable-analytics
Remplacez les éléments suivants :
- BUCKET_ID: nom du bucket de journaux (par exemple,
_Default
) - LOCATION: région prise en charge (par exemple,
global
)
- BUCKET_ID: nom du bucket de journaux (par exemple,
Créer la tâche d'importation Cloud Run
Lorsque vous créez la tâche, vous pouvez utiliser l'image de conteneur précompilée fournie pour cette architecture de référence. Si vous devez modifier l'implémentation pour modifier le délai de conservation de 30 jours ou si vous avez d'autres exigences, vous pouvez créer votre propre image personnalisée.
Dans Cloud Shell, créez la tâche avec les configurations et les variables d'environnement:
gcloud run jobs create JOB_NAME \ --image=IMAGE_URL \ --region=REGION \ --tasks=TASKS \ --max-retries=0 \ --task-timeout=60m \ --cpu=CPU \ --memory=MEMORY \ --set-env-vars=END_DATE=END_DATE,LOG_ID=LOG_ID,\ START_DATE=START_DATE,STORAGE_BUCKET_NAME=STORAGE_BUCKET_NAME,\ PROJECT_ID=PROJECT_ID
Remplacez les éléments suivants :
- JOB_NAME : nom de votre job.
- IMAGE_URL: référence à l'image du conteneur. Utilisez
us-docker.pkg.dev/cloud-devrel-public-resources/samples/import-logs-solution
ou l'URL de l'image personnalisée, si vous en avez créé une en suivant les instructions sur GitHub. - REGION: région dans laquelle vous souhaitez que votre tâche se trouve. Pour éviter des coûts supplémentaires, nous vous recommandons de conserver la même région de tâche ou de la placer dans la même région multirégionale que celle du bucket Cloud Storage. Par exemple, si votre bucket est multirégional aux États-Unis, vous pouvez utiliser us-central1. Pour en savoir plus, consultez la section Optimisation des coûts.
- TASKS: nombre de tâches que la tâche doit exécuter.
La valeur par défaut est
1
. Vous pouvez augmenter le nombre de tâches en cas de délai avant expiration. - CPU: limite de processeurs, qui peut être de 1, 2, 4, 6 ou 8 processeurs.
La valeur par défaut est
2
. Vous pouvez augmenter ce nombre en cas de dépassement du délai avant expiration. Pour en savoir plus, consultez la section Configurer les limites de processeur. - MEMORY: limite de mémoire.
La valeur par défaut est
2Gi
. Vous pouvez augmenter ce nombre en cas de dépassement du délai avant expiration. Pour en savoir plus, consultez la section Configurer les limites de mémoire. - END_DATE: fin de la période au format JJ/MM/AAAA. Les journaux dont les codes temporels sont antérieurs ou égaux à cette date sont importés.
- LOG_ID: identifiant des journaux que vous souhaitez importer. L'ID de journal fait partie du champ
logName
de l'entrée de journal. Par exemple,cloudaudit.googleapis.com
. - START_DATE: début de la période au format JJ/MM/AAAA. Les journaux dont les codes temporels sont postérieurs ou égaux à cette date sont importés.
- STORAGE_BUCKET_NAME: nom du bucket Cloud Storage dans lequel les journaux sont stockés (sans le préfixe
gs://
).
L'option
max-retries
est définie sur zéro pour éviter les nouvelles tentatives pour les tâches ayant échoué, ce qui peut entraîner des entrées de journal en double.Si la tâche Cloud Run échoue en raison d'un délai avant expiration, une importation incomplète peut se produire. Pour éviter les importations incomplètes en raison de délais avant expiration, augmentez la valeur
tasks
, ainsi que les ressources de processeur et de mémoire.
Augmenter ces valeurs peut entraîner une augmentation des coûts. Pour en savoir plus sur les coûts, consultez la section Optimisation des coûts.
Créer un compte de service pour exécuter votre tâche Cloud Run
Dans Cloud Shell, créez le compte de service géré par l'utilisateur:
gcloud iam service-accounts create SA_NAME
Remplacez SA_NAME par le nom du compte de service.
Attribuez le rôle Lecteur des objets de l'espace de stockage au bucket de stockage:
gcloud storage buckets add-iam-policy-binding gs://STORAGE_BUCKET_NAME \ --member=serviceAccount:SA_NAME@PROJECT_ID.iam.gserviceaccount.com \ --role=roles/storage.objectViewer
Remplacez les éléments suivants :
- STORAGE_BUCKET_NAME: nom du bucket de stockage que vous avez utilisé dans la configuration de la tâche d'importation. Par exemple,
my-bucket
. - PROJECT_ID: ID du projet de destination.
- STORAGE_BUCKET_NAME: nom du bucket de stockage que vous avez utilisé dans la configuration de la tâche d'importation. Par exemple,
Attribuez le rôle Rédacteur de journaux au bucket de journaux:
gcloud projects add-iam-policy-binding PROJECT_ID \ --member=serviceAccount:SA_NAME@PROJECT_ID.iam.gserviceaccount.com \ --role=roles/logging.logWriter
Définissez le compte de service pour la tâche Cloud Run:
gcloud run jobs update JOB_NAME \ --region=REGION \ --service-account SA_NAME@PROJECT_ID.iam.gserviceaccount.com
Remplacez REGION par la même région que celle dans laquelle vous avez déployé la tâche d'importation Cloud Run.
Exécuter le job d'importation
Dans Cloud Shell, exécutez la tâche créée:
gcloud run jobs execute JOB_NAME \ --region=REGION
Pour en savoir plus, consultez les pages Exécuter des tâches et Gérer les exécutions de tâches.
Si vous devez réexécuter la tâche, supprimez les journaux précédemment importés pour éviter de créer des doublons. Pour en savoir plus, consultez la section Supprimer les journaux importés plus loin dans ce document.
Lorsque vous interrogez les journaux importés, les doublons n'apparaissent pas dans les résultats de la requête.
Cloud Logging supprime les doublons (entrées de journal du même projet, avec le même ID d'insertion et le même code temporel) des résultats de requête. Pour en savoir plus, consultez le champ insert_id
dans la documentation de référence de l'API Logging.
Vérifier les résultats
Pour vérifier que la tâche s'est bien terminée, vous pouvez interroger les résultats d'importation dans Cloud Shell:
gcloud logging read 'log_id("imported_logs") AND timestamp<=END_DATE'
Le résultat affiche les journaux importés. Si ce projet a été utilisé pour exécuter plusieurs tâches d'importation au cours de la période spécifiée, la sortie affiche également les journaux importés de ces tâches.
Pour plus d'options et d'informations sur l'interrogation des entrées de journal, consultez gcloud logging read
.
Supprimer les journaux importés
Si vous devez exécuter la même tâche plusieurs fois, supprimez les journaux précédemment importés pour éviter les doublons et les coûts supplémentaires.
Pour supprimer les journaux importés, dans Cloud Shell, exécutez la commande logs delete:
gcloud logging logs delete imported_logs
Sachez que la suppression des journaux importés purge toutes les entrées de journal qui ont été importées dans le projet de destination, et pas seulement les résultats de la dernière exécution de la tâche d'importation.
Étape suivante
- Examinez le code d'implémentation dans le dépôt GitHub.
- Découvrez comment analyser les journaux importés à l'aide de Log Analytics et SQL.
- Pour découvrir d'autres architectures de référence, schémas et bonnes pratiques, consultez le Centre d'architecture cloud.
Contributeurs
Auteur: Leonid Yankulin | Ingénieur en relations avec les développeurs
Autres contributeurs :
- Summit Tuladhar | Ingénieur logiciel senior
- Wilton Wong | Architecte d'entreprise
- Xiang Shen | Architecte de solutions