Tutorial: Mengelola layanan dengan GKE Enterprise


Anthos Service Mesh menyediakan alat bagi pengguna GKE Enterprise untuk memantau dan mengelola aplikasi berbasis microservice yang andal. Tutorial ini menggunakan deployment contoh Bank of Anthos di Google Cloud untuk memperkenalkan beberapa fitur pengelolaan layanan Anthos Service Mesh dengan menunjukkan cara menentukan tujuan tingkat layanan (SLO). Contoh ini men-deploy lingkungan interaktif GKE Enterprise yang nyata dengan cluster GKE, mesh layanan, dan aplikasi Bank of Anthos dengan beberapa microservice.

Apa itu SLO?

Menurut buku Site Reliability Engineering (SRE) Google:

Tidak mungkin mengelola layanan dengan benar, apalagi dengan baik, tanpa memahami perilaku mana yang benar-benar penting untuk layanan tersebut, serta cara mengukur dan mengevaluasi perilaku tersebut. Untuk mencapai tujuan ini, kami ingin mendefinisikan dan memberikan level layanan tertentu kepada pengguna kami, baik menggunakan API internal maupun produk publik.

Tim SRE Google menggunakan indikator tingkat layanan (SLI), tujuan tingkat layanan (SLO), dan perjanjian tingkat layanan (SLA) untuk menyusun dan memandu metrik yang mendasari pekerjaan mereka. SLI adalah ukuran kuantitatif dari beberapa aspek performa layanan Anda, seperti latensi atau ketersediaannya, sedangkan SLO adalah nilai target ("hal ini harus terjadi x% dari waktu tersebut") untuk tingkat layanan yang diukur dengan SLI. Anthos Service Mesh memudahkan penentuan dan peningkatan SLO untuk layanan Anda. Alat ini memberikan informasi yang diperlukan untuk mengidentifikasi SLI dan SLO yang sesuai, serta memberi tahu Anda saat layanan tidak memenuhi SLO-nya.

Untuk mengetahui lebih lanjut SLO dan SLI di Anthos Service Mesh, baca Ringkasan SLO dan Mendesain SLO.

Tujuan

Dalam tutorial ini, Anda diperkenalkan dengan cara mengelola layanan dengan Anthos Service Mesh di GKE Enterprise melalui tugas berikut:

  • Mengidentifikasi indikator tingkat layanan (SLI) untuk suatu layanan

  • Gunakan tujuan tingkat layanan (SLO) untuk memantau perilaku yang tidak terduga.

Biaya

Men-deploy aplikasi Bank of Anthos akan dikenai biaya bayar sesuai penggunaan untuk GKE Enterprise di Google Cloud seperti yang tercantum di halaman Harga kami, kecuali jika Anda telah membeli langganan.

Anda juga bertanggung jawab atas biaya Google Cloud lainnya yang timbul saat menjalankan aplikasi Bank of Anthos, seperti tagihan untuk VM Compute Engine dan load balancer.

Sebaiknya bersihkan setelah menyelesaikan tutorial atau menjelajahi deployment agar tidak dikenai biaya lebih lanjut.

Sebelum memulai

Tutorial ini adalah tindak lanjut dari tutorial Jelajahi GKE Enterprise. Sebelum memulai tutorial ini, ikuti petunjuk di halaman tersebut untuk menyiapkan project Anda dan men-deploy Bank of Anthos.

Mengidentifikasi SLI

Anthos Service Mesh menjadikan pengumpulan SLI dan penetapan SLO Anda sederhana dan mudah. Dalam contoh ini, Anda memutuskan untuk menentukan SLO terlebih dahulu untuk layanan ledgerwriter Bank of Anthos.

Pertama-tama, gunakan Anthos Service Mesh untuk menemukan informasi yang dapat Anda gunakan guna mengidentifikasi SLI untuk layanan.

  1. Buka halaman Anthos Service Mesh di project tempat Anda menginstal Bank of Anthos.

    Buka halaman Anthos Service Mesh

    Bagian atas tampilan ini menunjukkan status layanan aplikasi Anda saat ini beserta indikator untuk pemberitahuan dan SLO, termasuk jumlah layanan tanpa SLO; saat ini semua layanan berada dalam Tidak ada SLO yang ditetapkan. Selain itu, di kolom Status, semua layanan memiliki indikator lingkaran hitam. Jika Anda mengarahkan kursor ke indikator tersebut untuk layanan apa pun, Anda akan diberi tahu bahwa tidak ada SLO yang ditetapkan untuk layanan.

  2. Catat nilai dalam md untuk latensi 99% untuk ledgerwriter (Anda mungkin perlu men-scroll ke bawah dan melintasinya untuk melihatnya). Metrik ini berarti bahwa satu dari setiap 100 permintaan mengalami tingkat keterlambatan ini. Anda akan menggunakan nilai ini di bagian berikutnya.

Membuat SLO

Sekarang buat SLO terhadap SLI latensi untuk layanan. Untuk mengetahui apa yang terjadi jika layanan melebihi anggaran error-nya, tetapkan nilai minimum yang sengaja rendah, berdasarkan informasi yang Anda lihat di bagian sebelumnya. Untuk layanan produksi yang sebenarnya, sebaiknya cari nilai latensi minimum yang tidak lebih rendah dari yang diperlukan agar pengguna mendapatkan pengalaman yang baik dari aplikasi Anda.

  1. Di Table view Anthos Service Mesh, klik ledgerwriter untuk membuka halaman ringkasan layanan.

  2. Di bagian Service status, klik Create an SLO.

  3. Dalam daftar SLI Type, pilih Latency.

  4. Tetap gunakan metode evaluasi default Berbasis permintaan, lalu klik Lanjutkan.

  5. Tetapkan Latensi Threshold ke nilai rendah secara arbitrer, seperti 10 ms (ada yang jauh lebih rendah dari nilai latensi 99% yang Anda amati sebelumnya), lalu klik Continue lagi.

  6. Di Compliance Period, tetapkan Period Type ke Rolling, dan Period Length ke 1 Day.

  7. Di Sasaran SLO, tetapkan Target kepatuhan ke 90%. Anthos Service Mesh menggunakan nilai ini untuk menghitung anggaran error yang Anda miliki untuk SLO ini. Artinya, persentase maksimum permintaan yang harus melebihi batas latensi yang ditentukan. Pratinjau menunjukkan performa SLO Anda dalam periode satu hari terakhir. Klik Continue.

  8. Bagian Name your SLO menyarankan nama default untuk SLO baru Anda: Anda dapat menerima default yang direkomendasikan atau menentukan nama baru. Untuk membuat SLO dan membuka halaman Health untuk ledgerwriter, klik Create SLO.

Klik panah drop-down untuk melihat detail lebih lanjut tentang SLO Anda. Anda akan melihat bahwa SLO adalah Di Luar Anggaran Error berdasarkan setelan Anda. Anda juga dapat mengedit atau menghapus SLO dari tampilan ini.

Screenshot tampilan kondisi layanan Anthos Service Mesh

Memeriksa ulang SLO dan indikator pemberitahuan

  1. Di halaman ringkasan layanan, klik panah kembali untuk kembali ke tampilan tabel. Sekarang Anda dapat melihat bahwa jumlah layanan untuk Tidak ada SLO yang ditetapkan telah dikurangi satu dan SLO di luar anggaran error tidak lagi 0.

  2. Jika Anda men-scroll ke bawah ke ledgerwriter, perhatikan bahwa indikator yang berdekatan telah berubah menjadi segitiga peringatan berwarna oranye. Jika kursor diarahkan ke indikator tersebut, Anda akan diminta untuk menyelidiki keandalan layanan. Dengan mengklik indikator, Anda akan kembali ke halaman Kondisi layanan untuk meninjau detail SLO. Indikator yang sama juga muncul untuk layanan Anda dalam tampilan topologi.

Screenshot daftar layanan Anthos Service Mesh dengan peringatan SLO

Mempelajari deployment lebih lanjut

Masih banyak banyak hal yang dapat dilihat dan dilakukan di GKE Enterprise dengan deployment kami. Jangan ragu untuk mencoba tutorial lain atau lanjutkan mempelajari sendiri deployment Bank of Anthos di Google Cloud, sebelum mengikuti petunjuk pembersihan di bagian berikutnya.

Pembersihan

Setelah selesai menjelajahi aplikasi Bank of Anthos, Anda dapat membersihkan resource yang Anda buat di Google Cloud sehingga tidak menghabiskan kuota dan Anda tidak akan ditagih di masa mendatang.

  • Opsi 1. Anda dapat menghapus project. Namun, jika ingin mempertahankan project, Anda dapat menggunakan Opsi 2 untuk menghapus deployment.

  • Opsi 2. Jika ingin mempertahankan project saat ini, Anda dapat menggunakan terraform destroy untuk menghapus aplikasi contoh dan cluster.

Menghapus project (opsi 1)

Cara termudah untuk menghindari penagihan adalah dengan menghapus project yang Anda buat untuk tutorial ini.

  1. Di konsol Google Cloud, buka halaman Manage resource.

    Buka Manage resource

  2. Pada daftar project, pilih project yang ingin Anda hapus, lalu klik Delete.
  3. Pada dialog, ketik project ID, lalu klik Shut down untuk menghapus project.

Menghapus deployment (opsi 2)

Pendekatan ini menghapus aplikasi dan cluster Bank of Anthos, tetapi tidak menghapus project. Jalankan perintah berikut di Cloud Shell Anda:

  1. Ubah ke direktori yang menghosting skrip penginstalan:

    cd bank-of-anthos/iac/tf-anthos-gke
    
  2. Hapus sampel dan cluster:

    terraform destroy
    
  3. Masukkan project ID saat diminta.

Jika Anda berencana men-deploy ulang, pastikan semua persyaratan terpenuhi seperti yang dijelaskan di bagian Sebelum memulai.

Langkah selanjutnya

Masih banyak lagi yang dapat dijelajahi di dokumentasi GKE Enterprise kami.

Coba tutorial lainnya

Pelajari GKE Enterprise lebih lanjut