Introduction
Dataproc est un service entièrement géré et hautement évolutif permettant d'exécuter des plates-formes de traitement Open Source distribuées telles qu'Apache Hadoop, Apache Spark, Apache Flink et Trino. Vous pouvez utiliser les fichiers et les outils décrits dans les sections suivantes pour dépanner et surveiller vos clusters et tâches Dataproc.
Interfaces Web Open Source
De nombreux composants Open Source des clusters Dataproc, tels qu'Apache Hadoop et Apache Spark, fournissent des interfaces Web. Ces interfaces peuvent être utilisées pour surveiller les ressources du cluster et les performances des tâches. Par exemple, vous pouvez utiliser l'interface utilisateur du gestionnaire de ressources YARN pour afficher l'allocation des ressources de l'application YARN sur un cluster Dataproc.
Serveur d'historique persistant
Les interfaces Web Open Source exécutées sur un cluster sont disponibles lors de l'exécution du cluster, mais elles s'arrêtent lorsque vous supprimez le cluster. Pour afficher les données de cluster et de tâche après la suppression d'un cluster, vous pouvez créer un serveur d'historique persistant (PHS).
Exemple: Vous rencontrez une erreur ou un ralentissement de tâche que vous souhaitez analyser. Vous arrêtez ou supprimez le cluster de tâches, puis affichez et analysez les données d'historique des tâches à l'aide de votre PHS.
Après avoir créé un PHS, vous l'activez sur un cluster Dataproc ou une charge de travail par lot sans serveur Dataproc lorsque vous créez le cluster ou envoyez la charge de travail par lot. Un PHS peut accéder aux données de l'historique des tâches exécutées sur plusieurs clusters, ce qui vous permet de surveiller les tâches d'un projet au lieu de surveiller des interfaces utilisateur distinctes exécutées sur différents clusters.
Journaux Dataproc
Dataproc collecte les journaux générés par Apache Hadoop, Spark, Hive, Zookeeper et d'autres systèmes Open Source exécutés sur vos clusters, puis les envoie à Logging. Ces journaux sont regroupés en fonction de leur source, ce qui vous permet de sélectionner et d'afficher les journaux qui vous intéressent. Par exemple, les journaux YARN NodeManager et Spark Executor générés sur un cluster sont libellés séparément. Pour en savoir plus sur les contenus et les options des journaux Dataproc, consultez la page Journaux Dataproc.
Cloud Logging
Logging est un système de gestion des journaux entièrement géré et en temps réel. Il fournit un espace de stockage des journaux ingérés à partir des services et des outils Google Cloud pour la recherche, le filtrage et l'analyse des journaux à grande échelle. Les clusters Dataproc génèrent plusieurs journaux, y compris les journaux de l'agent de service Dataproc, les journaux de démarrage du cluster et les journaux des composants OSS, tels que les journaux YARN NodeManager.
La journalisation est activée par défaut sur les clusters Dataproc et les charges de travail par lot sans serveur Dataproc. Les journaux sont exportés régulièrement vers Logging, où ils sont conservés après la suppression du cluster ou de la fin de la charge de travail.
Métriques Dataproc
Les métriques de cluster et de tâche Dataproc, précédées de dataproc.googleapis.com/
, sont constituées de données de séries temporelles qui fournissent des insights sur les performances d'un cluster, telles que l'utilisation du processeur ou l'état de la tâche. Les métriques personnalisées Dataproc, précédées du préfixe custom.googleapis.com/
, incluent les métriques émises par les systèmes Open Source exécutés sur le cluster, telles que la métrique YARN running applications
. Les insights sur les métriques Dataproc peuvent vous aider à configurer efficacement vos clusters. La configuration d'alertes basées sur des métriques peut vous aider à identifier et à résoudre rapidement les problèmes.
Les métriques de cluster et de tâche Dataproc sont collectées par défaut. La collecte de métriques personnalisées est facturée aux clients. Vous pouvez activer la collecte de métriques personnalisées lorsque vous créez un cluster. La collecte de métriques Spark sans serveur est activée par défaut sur les charges de travail par lot Spark.
Cloud Monitoring
Monitoring utilise les métadonnées et les métriques d'un cluster, y compris HDFS, YARN, les tâches et les métriques d'opération, pour fournir une visibilité sur l'état, les performances et la disponibilité des clusters et des tâches Dataproc. Monitoring vous permet d'explorer les métriques, d'ajouter des graphiques, et de créer des tableaux de bord et des alertes.
Explorateur de métriques
Vous pouvez afficher les métriques Dataproc à l'aide de l'explorateur de métriques.
Les métriques Dataproc de cluster, de tâche et de lot sans serveur sont répertoriées sous les ressources Cloud Dataproc Cluster
, Cloud Dataproc Job
et Cloud Dataproc Batch
. Les métriques personnalisées Dataproc sont répertoriées sous la ressource VM Instances
, dans la catégorie Custom
.
Graphiques
Vous pouvez utiliser l'Explorateur de métriques pour créer des graphiques permettant de visualiser les métriques Dataproc.
Exemple: Vous créez un graphique pour afficher le nombre d'applications Yarn actives exécutées sur vos clusters, puis vous ajoutez un filtre pour sélectionner des métriques visualisées par nom ou région de cluster.
Tableaux de bord
Vous pouvez créer des tableaux de bord pour surveiller les clusters et les tâches Dataproc à l'aide des métriques de plusieurs projets et de différents produits Google Cloud. Vous pouvez créer des tableaux de bord dans la console Google Cloud à partir de la page Présentation des tableaux de bord. Pour ce faire, cliquez sur "Créer des tableaux de bord", puis créez un graphique sur la page Explorateur de métriques.
Alertes
Vous pouvez créer des alertes de métrique Dataproc pour recevoir des notifications en cas de problèmes de cluster ou de tâche.
Pour en savoir plus
Pour en savoir plus, consultez
- Résoudre les problèmes liés aux messages d'erreur Dataproc
- Diagnostiquer des clusters Dataproc
- Questions fréquentes sur Dataproc