Tujuan dukungan utama Google adalah menyelesaikan insiden produksi secepat mungkin. Memahami konfigurasi Anda, menganalisis log dan metrik, serta berkolaborasi dengan partner membantu kami menyelesaikan insiden dengan cepat.
Google Cloud menawarkan berbagai paket dukungan untuk mengakomodasi kebutuhan dukungan Anda. Semua paket Dukungan Google Cloud menyertakan dukungan untuk edisi Enterprise Google Kubernetes Engine (GKE) dan Google Distributed Cloud. Jika sudah memiliki paket Dukungan Google Cloud, Anda sudah memiliki dukungan untuk GKE Enterprise dan Google Distributed Cloud.
Untuk mengetahui informasi selengkapnya, lihat dokumentasi Cloud Customer Care.
Persyaratan untuk dukungan Google Distributed Cloud
Untuk memecahkan masalah insiden yang penting bagi bisnis secara efektif:
- Pastikan lingkungan Anda sudah yang terbaru dan berada dalam jangka waktu akhir dukungan yang dipublikasikan. Lihat bagian Kebijakan Dukungan Versi untuk mengetahui informasi selengkapnya.
- Aktifkan Cloud Logging dan Cloud Monitoring untuk komponen sistem. Untuk mengetahui detailnya, lihat bagian Alat dukungan berikut.
Alat dukungan
Untuk memecahkan masalah insiden Google Distributed Cloud, Dukungan Google Cloud mengandalkan tiga informasi:
- Konfigurasi lingkungan Anda
- Log dari cluster Anda
- Metrik dari cluster Anda
Konfigurasi lingkungan Anda
Saat Anda membuka kasus dukungan, menjalankan perintah berikut akan memberikan informasi utama tentang penyiapan cluster Anda:
Untuk semua jenis cluster, jalankan perintah
bmctl check cluster --snapshot
untuk mengambil informasi tentang Kubernetes dan node Anda. Lampirkan file tar yang dihasilkan ke kasus dukungan.Untuk cluster admin, hybrid, dan mandiri, jalankan perintah
bmctl check cluster
untuk memeriksa status kesehatan cluster dan node. Lampirkan log yang dihasilkan ke kasus dukungan. File tersebut harus ada di direktoribmctl-workspace/[CLUSTER_NAME]/log/check-cluster-[TIMESTAMP]
.Untuk cluster pengguna, buat file YAML health check terlebih dahulu dengan nama dan namespace cluster, lalu terapkan file tersebut di cluster admin yang sesuai:
Buat file YAML dengan properti
healthcheck
berikut. Berikut adalah contoh konten untuk cluster bernamauser1
di namespacecluster-user1
:apiVersion: baremetal.cluster.gke.io/v1 kind: HealthCheck metadata: generateName: healthcheck- namespace: cluster-user1 spec: clusterName: user1
Setelah Anda membuat file YAML, terapkan resource kustom di cluster admin yang mengelola cluster pengguna dengan perintah
kubectl
. Berikut adalah contoh perintah yang menggunakan file YAML yang dibuat pada langkah sebelumnya. Dalam contoh, variabelADMIN_KUBECONFIG
menentukan jalur ke file kubeconfig cluster admin:kubectl --kubeconfig ADMIN_KUBECONFIG create -f healthcheck-user1.yaml
Perintah ini menampilkan respons berikut:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf created
Tunggu hingga tugas pemeriksaan kesehatan selesai dengan menguji apakah tugas pemeriksaan kesehatan telah selesai merekonsiliasi. Pada kasus contoh sebelumnya, nama tugas health check adalah
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf
. Berikut adalah contoh pengujian dengan perintahkubectl
yang menunggu selama 30 menit hingga tugas pemeriksaan kesehatan selesai:kubectl --kubeconfig ADMIN_KUBECONFIG wait healthcheck healthcheck-7c4qf \ -n cluster-user1 --for=condition=Reconciling=False --timeout=30m
Setelah selesai, perintah ini akan menampilkan:
healthcheck.baremetal.cluster.gke.io/healthcheck-7c4qf condition met
Anda dapat melihat hasil tugas pemeriksaan kesehatan dengan perintah berikut:
kubectl --kubeconfig ADMIN_KUBECONFIG get healthcheck healthcheck-7c4qf \ -n cluster-user1
Perintah ini menampilkan hasil berikut:
NAME PASS AGE healthcheck-7c4qf true 17m
Kumpulkan semua log pod tugas pemeriksaan kesehatan ke dalam file lokal dengan perintah
kubectl
. Berikut adalah contoh yang menggunakan contoh tugas pemeriksaan kesehatan sebelumnya:kubectl --kubeconfig ADMIN_KUBECONFIG logs -n cluster-user1 \ -l baremetal.cluster.gke.io/check-name=healthcheck-7c4qf --tail=-1 > \ healthcheck-7c4qf.log
Log cluster
Saat Anda membuat cluster Google Distributed Cloud baru, agen Cloud Logging diaktifkan secara default dan cakupannya hanya untuk komponen tingkat sistem. Tindakan ini akan mereplikasi log level sistem ke project Google Cloud yang terkait dengan cluster. Log tingkat sistem berasal dari pod Kubernetes di namespace berikut:
kube-system
gke-system
gke-connect
istio-system
config-management-system
gatekeeper-system
cnrm-system
knative-serving
Log dapat dikueri dari konsol Cloud Logging.
Untuk mengetahui detail selengkapnya, lihat Logging dan Pemantauan.
Google Cloud CLI dan akses cluster jarak jauh
Jika Anda membuka kasus dukungan, Cloud Customer Care dapat meminta akses hanya baca jarak jauh ke cluster Anda untuk membantu mendiagnosis dan menyelesaikan masalah secara lebih efektif. Agar tim dukungan memiliki akses yang memadai untuk memecahkan masalah cluster Anda dari jarak jauh, pastikan Anda telah menginstal dan mengupdate ke Google Cloud CLI versi terbaru. Google Cloud CLI harus menggunakan versi 401.0.0 atau yang lebih tinggi untuk memberi Cloud Customer Care izin yang diperlukan. Sebaiknya update Google Cloud CLI secara rutin untuk mendapatkan izin yang ditambahkan dan peningkatan lainnya.
Untuk menginstal komponen terbaru gcloud CLI, gunakan perintah gcloud
components update
. Untuk mengetahui informasi selengkapnya tentang cara memberi Cloud Customer Care akses hanya baca jarak jauh ke cluster Anda, lihat Dukungan Google Cloud untuk cluster terdaftar Anda.
Metrik cluster
Selain log, agen Cloud Monitoring juga merekam metrik. Tindakan ini akan mereplikasi metrik tingkat sistem ke project Google Cloud yang terkait dengan cluster. Metrik tingkat sistem berasal dari pod Kubernetes yang berjalan di namespace yang sama yang tercantum dalam Log.
Untuk mengetahui detail selengkapnya, lihat Logging dan Pemantauan.
Cara kami memecahkan masalah lingkungan Anda
Berikut adalah contoh insiden dukungan umum:
Administrator cluster membuka kasus dukungan di konsol Google Cloud atau Pusat Dukungan Google Cloud, dan memilih edisi Enterprise Google Kubernetes Engine (GKE) dan Google Distributed Cloud sebagai Kategori dan Komponen. Mereka memasukkan informasi yang diperlukan dan melampirkan output perintah
bmctl
yang relevan ke kasus.Kasus dukungan akan dialihkan ke Technical Support Engineer yang berspesialisasi dalam Google Distributed Cloud.
Engineer dukungan memeriksa konten snapshot untuk mendapatkan konteks lingkungan.
Engineer dukungan memeriksa log dan metrik di project Google Cloud, memasukkan ID kasus dukungan sebagai justifikasi bisnis, yang dicatat dalam log secara internal.
Engineer dukungan merespons kasus dengan penilaian dan rekomendasi. Engineer dukungan dan pengguna terus memecahkan masalah hingga mereka menemukan solusi.
Apa yang didukung Google?
Umumnya, tim Dukungan Cloud mendukung semua komponen software yang dikirim sebagai bagian dari Google Distributed Cloud dan Cloud Service Mesh, Policy Controller, Config Sync, dan Config Controller. Lihat tabel berikut untuk mengetahui daftar lengkap fitur yang didukung dan tidak didukung:
Didukung Google Cloud | Tidak didukung |
---|---|
Kubernetes dan runtime container | Pilihan pelanggan untuk load balancer (load balancing manual) |
Connect dan Connect Agent | Kode pelanggan (lihat Dukungan Developer) |
Operasi, Pemantauan, Logging, dan agen Google Cloud | Pilihan sistem operasi pelanggan |
Load balancer yang dipaketkan | Server, penyimpanan, dan jaringan fisik atau virtual |
Pengontrol ingress | Sistem DNS, DHCP, dan identitas eksternal |
GKE Identity Service | |
Mesh Layanan Cloud | |
Pengontrol Kebijakan | |
Config Sync | |
Pengontrol Konfigurasi |
Kebijakan Dukungan Versi
Dukungan untuk Google Distributed Cloud mengikuti Kebijakan Dukungan GKE Enterprise. Google mendukung setiap versi minor Google Distributed Cloud untuk salah satu dari:
- 12 bulan setelah rilis awal versi minor.
- Rilis versi minor ketiga berikutnya.
Untuk daftar versi Google Distributed Cloud yang didukung dan tidak didukung, lihat Pembuatan Versi.
Untuk informasi versi yang terkait dengan upgrade cluster, lihat Aturan versi untuk upgrade.
Model Tanggung Jawab Bersama
Menjalankan aplikasi produksi yang penting bagi bisnis di Google Distributed Cloud memerlukan banyak pihak untuk mengemban tanggung jawab yang berbeda-beda. Meskipun bukan daftar lengkap, bagian berikut mencantumkan peran dan tanggung jawab.
Tanggung jawab Google
- Pemeliharaan dan distribusi paket software Google Distributed Cloud.
- Memberi tahu pengguna tentang upgrade yang tersedia untuk Google Distributed Cloud, dan membuat skrip upgrade untuk versi sebelumnya; Google Distributed Cloud hanya mendukung upgrade berurutan (contoh: 1.2 → 1.3 → 1.4, bukan 1.2 → 1.4).
- Mengoperasikan layanan Connect dan Cloud Operations.
- Memecahkan masalah, memberikan solusi, dan memperbaiki akar masalah apa pun yang terkait dengan komponen yang disediakan Google
Tanggung jawab pengguna
- Administrasi sistem secara keseluruhan untuk cluster lokal.
- Mengelola beban kerja aplikasi apa pun yang di-deploy di cluster.
- Menjalankan, memelihara, dan menerapkan patch pada infrastruktur pusat data, termasuk jaringan, server, sistem operasi, penyimpanan, dan konektivitas ke Google Cloud.
- Menjalankan, memelihara, dan menerapkan patch pada load balancer jaringan jika opsi load balancer manual dipilih.
- Mengupgrade versi Google Distributed Cloud secara rutin.
- Pemantauan cluster dan aplikasi, serta respons terhadap insiden apa pun.
- Memastikan agen Cloud Operations di-deploy ke cluster.
- Memberikan detail lingkungan kepada Google untuk tujuan pemecahan masalah.
Dukungan Developer
Google tidak menyediakan dukungan khusus untuk beban kerja aplikasi Anda. Namun, kami memberikan dukungan developer sebisa mungkin untuk memastikan developer Anda dapat menjalankan aplikasi di Google Distributed Cloud. Kami yakin bahwa berinteraksi lebih awal selama pengembangan dapat mencegah insiden kritis di lain waktu dalam deployment.
Dukungan Developer upaya terbaik ini tersedia untuk pelanggan dengan paket dukungan berbayar dan diperlakukan sebagai prioritas P3 untuk masalah yang memblokir peluncuran, atau prioritas P4 untuk konsultasi umum. Dalam klasifikasi ini, tingkat prioritas 0 adalah prioritas tertinggi.