Mengakses notifikasi software
Periksa alat berikut untuk mengetahui notifikasi saat masalah muncul di komponen software platform Anda:
- Dasbor software umum: Untuk notifikasi tentang informasi kesehatan sistem, seperti komponen, cluster, layanan, dan VM GKE Enterprise.
- Kotak surat Anda: Untuk notifikasi email yang menyertakan informasi dasar tentang masalah, seperti kode error.
Klik notifikasi untuk melihat halaman komponen yang bermasalah dan mengakses log yang relevan.
Mengonfigurasi penerima notifikasi
Konfigurasi saluran komunikasi berikut untuk menerima pemberitahuan, meskipun saluran tersebut terputus dari dasbor:
- Pesan SMS
- Notifikasi email
- PagerDuty
Atur jenis notifikasi dan peran penerima, seperti penagihan, software, dan hardware.
Memahami error software
Ikuti praktik ini untuk mengakses informasi yang relevan tentang error pada komponen software, menyelesaikan masalah, dan berinteraksi dengan Dukungan secara efektif:
- Temukan kode error setiap error.
- Gunakan kode error untuk menelusuri dokumentasi lokal dan online.
- Antarmuka pengguna memberikan cuplikan informasi terkait error tertentu. Arahkan kursor ke kode error untuk melihat cuplikan.
Membersihkan informasi pemecahan masalah software dari data sensitif
Menghapus informasi pemecahan masalah untuk komponen software, termasuk konfigurasi, log, status, dan metrik semua data sensitif, serta mematuhi persyaratan kedaulatan.
Google Distributed Cloud (GDC) dengan air gap menyediakan daftar kata kunci sensitif default untuk disamarkan dan dihapus. Ikuti langkah-langkah berikut untuk menyamarkan informasi pemecahan masalah:
- Sesuaikan daftar default dengan menambahkan dan menghapus kata kunci kustom.
- Menerima laporan semua kemunculan yang di-obfuscate.
- Menerima peringatan tentang potensi informasi sensitif yang tersisa.
Item penting yang perlu di-obfuscate meliputi:
- Nama Domain yang Sepenuhnya Memenuhi Syarat (FQDN)
- Alamat IP
- Nama pengguna
- Nama host
- Nama workload
- Hash
- Sertifikat
- Nama pelanggan
Membuat snapshot sistem software
Buat snapshot komponen software Anda untuk mengumpulkan semua informasi yang diperlukan guna memecahkan masalah dan menghubungi Dukungan secara efektif:
- Pilih komponen yang akan disertakan.
- Buat file tar dengan semua konfigurasi, log, status, dan metrik yang diperlukan.
- Tentukan komponen yang akan di-debug.
- Tentukan cara membersihkan data.
Membagikan informasi kepada Dukungan
Google menyediakan dukungan level 1 (L1) dan level 2 (L2) untuk GDC.
Menerapkan kebijakan pada berbagi snapshot
Ikuti praktik berikut untuk memastikan bahwa data snapshot yang Anda bagikan kepada Dukungan aman, terlindungi, dan tunduk pada kebijakan retensi data yang Anda kontrol:
- Tentukan dan terapkan kebijakan kontrol akses ke snapshot.
- Tentukan dan terapkan kebijakan retensi data untuk snapshot.
- Siapkan saluran aman untuk mengupload snapshot ke portal Dukungan.
Mengakses notifikasi hardware
Periksa notifikasi saat masalah muncul di komponen hardware platform Anda. Notifikasi muncul di Pengelola Sistem dengan informasi kesehatan sistem komponen hardware seperti rak, server, switch, dan penyimpanan.
Anda juga dapat menerima notifikasi email. Informasi tersebut mencakup informasi dasar tentang masalah, seperti kode error. Klik notifikasi untuk melihat halaman komponen yang bermasalah dan mengakses log yang relevan.
Meminta upgrade kapasitas
Pantau, perkirakan, dan minta kapasitas hardware tambahan untuk memastikan kesehatan dan skalabilitas workload Anda.
Memproses snapshot sistem
Sebelum memproses snapshot sistem, pastikan Anda memenuhi persyaratan berikut:
- Alat snapshot memiliki koneksi ke cluster yang sedang berjalan.
- Anda memiliki izin yang diperlukan berikut untuk membaca konfigurasi dan log di cluster:
- Operator Aplikasi memiliki kemampuan administratif.
- Administrator Platform memiliki izin akses yang dibatasi untuk informasi yang ditetapkan.
Untuk memproses snapshot sistem, pilih komponen sistem yang akan diambil snapshot-nya. Alat ini terhubung ke cluster Anda untuk menarik informasi untuk setiap komponen yang dipilih. Setelah pengambilan data, data akan melalui pemrosesan pasca-pemrosesan untuk memfilter data sensitif. Alat ini kemudian menggabungkan informasi ke dalam file zip.
Atau, Anda dapat memeriksa file ZIP dan kontennya untuk memastikan bahwa Anda tidak merekam data sensitif apa pun sebelum membagikannya kepada Dukungan.
Dokumentasi Access Support
Akses dokumentasi dan playbook berikut untuk membantu memecahkan masalah pelanggan yang sedang dihadapi:
- Playbook dukungan
- Dokumentasi publik, praktik terbaik, FAQ, dan pusat informasi
- Komunitas pengguna
Partner dapat memberikan dukungan L1 dan L2, sehingga artefak ini harus tersedia untuk publik.
Mengeskalasikan masalah software ke L3
Ikuti langkah-langkah berikut untuk mengeskalasikan masalah software ke Google untuk dukungan tingkat 3 (L3) atau dukungan lanjutan:
- Meminta izin untuk membagikan data snapshot kepada Google.
- Buka tiket dukungan dengan Google.
- Memberi Google akses ke snapshot Anda.
- Memantau dan memberikan visibilitas ke dalam operasi yang dilakukan Google pada snapshot.
Mengeskalasikan masalah hardware ke L3
Ikuti langkah-langkah berikut untuk melaporkan masalah yang disebabkan oleh kegagalan hardware kepada Google:
- Ekstrak dan bersihkan informasi minimal untuk memecahkan masalah komponen hardware:
- Log
- Status dan konfigurasi
- Metrik
- Informasi fisik seperti nomor rak, jenis komponen, nomor seri, dan lokasi fisik.
- Meminta izin untuk membagikan data snapshot kepada Google.
- Buka tiket dukungan dengan Google.
- Memberi Google akses ke snapshot Anda.
- Memantau dan memberikan visibilitas ke dalam operasi yang dilakukan Google pada snapshot.
Membuka kasus dukungan hardware
Google memiliki akses ke alat pemecahan masalah yang sama untuk mendiagnosis snapshot pelanggan. Buka kasus dukungan dengan partner hardware-as-a-service (HWaaS) untuk mendapatkan dukungan hardware melalui sistem tiket bersama.
Tiket dukungan memiliki tingkat prioritas berikut dengan perjanjian tingkat layanan (SLA) yang sesuai:
- Kritis
- Tinggi
- Sedang
Membagikan data pelanggan kepada partner HWaaS
Ikuti langkah-langkah berikut untuk membagikan data hardware sistem kepada partner hardware dan mengaktifkan pemecahan masalah hardware:
- Meminta izin untuk membagikan data snapshot kepada partner HWaaS.
- Pastikan Anda mematuhi persyaratan kedaulatan: kewarganegaraan dan lokasi agen Dukungan.
- Memberi partner HWaaS akses yang aman ke snapshot hardware pelanggan, termasuk nomor seri, lokasi fisik, log, metrik, dan file konfigurasi.
- Memberi tahu orang yang telah Anda beri akses.
- Menerapkan masa berlaku otomatis untuk hak istimewa akses.
- Mencatat semua aktivitas dan membagikannya kepada semua pihak yang terlibat.
Memberi tahu Google tentang hasil pemecahan masalah dan memperbaiki linimasa
Laporkan kembali kepada Google penyebab utama masalah tersebut dan tawarkan perbaikan bertahap sehingga Google dapat memberi tahu pelanggan akhir dan partner. Gunakan sistem tiket untuk memberikan detail tugas perbaikan yang diperlukan dan memberikan perkiraan jangka waktu penyelesaiannya.
Mengoordinasikan akses pusat data
Mengoordinasikan logistik dan izin untuk akses yang aman ke pusat data serta melakukan perbaikan hardware yang diperlukan.
Partner HWaaS memastikan kepatuhan terhadap persyaratan kedaulatan, seperti kewarganegaraan agen Dukungan. Mereka memerlukan informasi berikut:
- Detail titik kontak pusat data dan lokasi.
- Lokasi persis rak dan komponen yang bermasalah di pusat data.
- Proses untuk mendapatkan izin dan otorisasi untuk mengakses pusat data pada waktu yang telah disepakati.
- Proses untuk menjadwalkan intervensi di tempat di pusat data.
Mendapatkan dukungan hardware untuk SLO dan SLA
Google memberikan dukungan melalui partner produsen peralatan asli (OEM) hardware. Prosesnya adalah sebagai berikut:
- Google menegosiasikan dukungan hardware untuk tujuan tingkat layanan (SLO) dan perjanjian tingkat layanan (SLA) dengan partner HWaaS.
- SLO dan SLA bervariasi berdasarkan tingkat kekritisan insiden, yang dapat berupa kritis, tinggi, atau sedang.
- Partner HWaaS akan memperbarui tiket dengan status dan perkiraan waktu perbaikan.
- Partner HWaaS mengonfirmasi kapan masalah diselesaikan.
Mengupgrade kapasitas
Untuk merespons permintaan peningkatan kapasitas, gunakan kapasitas tambahan bawaan jika tersedia. Pergi ke lokasi dan upgrade kapasitas fisik jika tidak ada kapasitas tambahan yang tersedia di rak.
Menjadwalkan ulasan berulang dengan Google
Siapkan peninjauan berkala dengan partner HWaaS untuk memeriksa status deployment saat ini dan merencanakan intervensi terjadwal.
Lakukan tindakan berikut selama peninjauan berulang:
- Periksa update terjadwal yang diperlukan untuk sistem operasi, hardware, dan firmware.
- Tinjau status deployment yang ada.
- Rencanakan deployment baru.
Mengomunikasikan pemeliharaan dan upgrade terjadwal
Berkomunikasi dengan pelanggan lama terkait rencana pemeliharaan terjadwal mendatang. Lakukan tindakan berikut bersama mereka:
- Pilih resource yang akan diupgrade.
- Tentukan alasan upgrade akan berfungsi dalam kondisi saat ini.
- Tentukan siapa yang akan melakukan upgrade dan kapan, di mana, dan bagaimana caranya.
- Rencanakan kemungkinan dampak dan periode nonaktif.
Menetapkan pemeliharaan terjadwal
Jadwalkan pemeliharaan pencegahan secara rutin dan pastikan sistem selalu diupdate dan berfungsi dengan baik. HWaaS melaporkan penyelesaian pemeliharaan. Proses berikut diperlukan:
- Proses untuk mendapatkan izin mengakses pusat data.
- Proses untuk menjadwalkan intervensi di tempat di pusat data.