Alat pemantauan dan pemecahan masalah Dataproc

Pengantar

Dataproc adalah layanan yang sangat skalabel dan terkelola sepenuhnya untuk menjalankan platform pemrosesan terdistribusi open source, seperti Apache Hadoop, Apache Spark, Apache Flink, dan Trino. Anda dapat menggunakan file dan alat yang dibahas di bagian berikut untuk memecahkan masalah dan memantau cluster dan tugas Dataproc Anda.

Antarmuka web open source

Banyak komponen open source cluster Dataproc, seperti Apache Hadoop dan Apache Spark, menyediakan antarmuka web. Antarmuka ini dapat digunakan untuk memantau resource cluster dan performa tugas. Misalnya, Anda dapat menggunakan UI YARN Resource Manager untuk melihat alokasi resource aplikasi YARN di cluster Dataproc.

Server Histori Persisten

Antarmuka web Open Source yang berjalan di cluster tersedia saat cluster berjalan, tetapi akan dihentikan saat Anda menghapus cluster. Untuk melihat cluster dan data tugas setelah cluster dihapus, Anda dapat membuat Persistent History Server (PHS).

Contoh: Anda menemukan kesalahan pekerjaan atau pelambatan yang ingin Anda analisis. Anda menghentikan atau menghapus cluster tugas, lalu melihat dan menganalisis data histori tugas menggunakan PHS.

Setelah membuat PHS, Anda dapat mengaktifkannya di cluster Dataproc atau workload batch Dataproc Serverless saat membuat cluster atau mengirimkan beban kerja batch. PHS dapat mengakses data histori untuk tugas yang dijalankan di beberapa cluster, sehingga Anda dapat memantau tugas di seluruh project, bukan memantau UI terpisah yang berjalan di cluster yang berbeda.

Log Dataproc

Dataproc mengumpulkan log yang dihasilkan oleh Apache Hadoop, Spark, Hive, Zookeeper, dan sistem open source lainnya yang berjalan pada cluster Anda, lalu mengirimkannya ke Logging. Log ini dikelompokkan berdasarkan sumber log, yang memungkinkan Anda memilih dan melihat log yang Anda minati: misalnya, log YARN NodeManager dan Spark Executor yang dihasilkan pada cluster diberi label secara terpisah. Lihat log Dataproc untuk informasi selengkapnya tentang konten dan opsi log Dataproc.

Cloud Logging

Logging adalah sistem pengelolaan log secara real-time dan terkelola sepenuhnya. Library ini menyediakan penyimpanan untuk log yang diserap dari layanan dan alat Google Cloud untuk menelusuri, memfilter, dan menganalisis log dalam skala besar. Cluster Dataproc menghasilkan beberapa log, termasuk log agen layanan Dataproc, log startup cluster, dan log komponen OSS, seperti log YARN NodeManager.

Logging diaktifkan secara default pada cluster Dataproc dan workload batch Dataproc Serverless. Log akan diekspor secara berkala ke Logging, dan tetap ada setelah cluster dihapus atau beban kerja selesai.

Metrik Dataproc

Cluster Dataproc dan metrik tugas, yang diawali dengan dataproc.googleapis.com/, terdiri dari data deret waktu yang memberikan insight tentang performa cluster, seperti pemakaian CPU atau status tugas. Metrik kustom Dataproc, yang diawali dengan custom.googleapis.com/, menyertakan metrik yang dikeluarkan oleh sistem open source yang berjalan di cluster, seperti metrik running applications YARN. Mendapatkan insight tentang metrik Dataproc dapat membantu mengonfigurasi cluster secara efisien. Menyiapkan pemberitahuan berbasis metrik dapat membantu Anda mengenali dan merespons masalah dengan cepat.

Cluster Dataproc dan metrik tugas dikumpulkan secara default tanpa biaya. Kumpulan metrik kustom dikenai biaya kepada pelanggan. Anda dapat mengaktifkan pengumpulan metrik kustom saat membuat cluster. Kumpulan metrik Spark Dataproc Serverless diaktifkan secara default pada workload batch Spark.

Cloud Monitoring

Monitoring menggunakan metadata dan metrik cluster, termasuk HDFS, YARN, tugas, dan metrik operasi, untuk memberikan visibilitas terkait kondisi, performa, dan ketersediaan cluster dan tugas Dataproc. Anda dapat menggunakan Monitoring untuk mempelajari metrik, menambahkan diagram, membuat dasbor, dan membuat pemberitahuan.

Metrics Explorer

Anda dapat menggunakan Metrics Explorer untuk melihat metrik Dataproc. Metrik batch, tugas, dan cluster Dataproc Dataproc dicantumkan di bagian resource Cloud Dataproc Cluster, Cloud Dataproc Job, dan Cloud Dataproc Batch. Metrik kustom Dataproc tercantum di bagian resource VM Instances, kategori Custom.

Diagram

Anda dapat menggunakan Metrics Explorer untuk membuat diagram yang memvisualisasikan metrik Dataproc.

Contoh: Anda membuat diagram untuk melihat jumlah aplikasi Yarn aktif yang berjalan di cluster Anda, lalu menambahkan filter untuk memilih metrik yang divisualisasikan menurut nama cluster atau region.

Dasbor

Anda dapat membuat dasbor untuk memantau cluster dan tugas Dataproc menggunakan metrik dari beberapa project dan berbagai produk Google Cloud. Anda dapat mem-build dasbor di Konsol Google Cloud dari halaman Ringkasan Dasbor dengan mengklik, membuat, lalu menyimpan diagram dari halaman Metrics Explorer.

Pemberitahuan

Anda dapat membuat pemberitahuan metrik Dataproc untuk menerima pemberitahuan tepat waktu tentang masalah cluster atau tugas.

Untuk informasi selengkapnya

Untuk panduan tambahan, lihat