Pemeliharaan dan update cloud pribadi

Lingkungan cloud pribadi dirancang dengan cara berikut agar tidak memiliki titik kegagalan tunggal:

  • Cluster ESXi dikonfigurasi dengan ketersediaan tinggi (HA) vSphere. Ukuran cluster dibuat agar memiliki minimal satu node cadangan untuk ketahanan.
  • vSAN menyediakan penyimpanan utama redundan, yang memerlukan minimal tiga node untuk memberikan perlindungan terhadap satu kegagalan. Untuk cluster yang lebih besar, Anda dapat mengonfigurasi vSAN untuk memberikan ketahanan yang lebih tinggi.
  • Virtual machine (VM) vCenter, PSC, dan NSX Manager dikonfigurasi dengan penyimpanan RAID-10 untuk melindungi dari kegagalan penyimpanan. VM juga dilindungi dari kegagalan node dan jaringan oleh vSphere HA.
  • Host ESXi memiliki kipas dan NIC redundan.
  • Switch TOR dan spine dikonfigurasi dalam pasangan HA untuk memberikan ketahanan.

VMware Engine terus memantau waktu beroperasi, memantau ketersediaan, dan menyediakan SLA ketersediaan untuk jenis VM berikut:

  • Host ESXi
  • vCenter
  • PSC
  • NSX Manager

VMware Engine terus memantau hal-hal berikut untuk mendeteksi kegagalan:

  • Hard disk
  • Port NIC fisik
  • Server
  • Penggemar
  • Daya
  • Tombol
  • Port tombol

Jika disk atau node gagal, VMware Engine akan segera dan otomatis menambahkan node baru ke cluster VMware yang terpengaruh untuk memulihkan pengoperasian layanan.

Elemen VMware berikut di cloud pribadi dicadangkan, dikelola, dan diupdate:

  • ESXi
  • Pengontrol Layanan Platform vCenter
  • vSAN
  • NSX

Pencadangan dan pemulihan

Cadangan mencakup hal berikut:

  • Pencadangan inkremental harian untuk aturan vCenter, PSC, dan DVS.
  • API native vCenter untuk mencadangkan komponen di lapisan aplikasi.
  • Pencadangan otomatis sebelum update atau upgrade software manajemen VMware.

Pemeliharaan

Jenis pemeliharaan terencana berikut disertakan.

Pemeliharaan backend dan internal

Pemeliharaan backend dan internal biasanya melibatkan konfigurasi ulang aset fisik atau menginstal patch software. Hal ini tidak memengaruhi konsumsi normal aset yang sedang dilayani. Dengan NIC redundan yang terhubung ke setiap rak fisik, traffic jaringan normal dan operasi cloud pribadi tidak akan terpengaruh. Anda mungkin melihat dampak performa hanya jika organisasi Anda berencana menggunakan bandwidth redundan penuh selama interval pemeliharaan.

Pemeliharaan portal

Beberapa periode nonaktif layanan terbatas diperlukan saat infrastruktur atau bidang kontrol diupdate. Interval pemeliharaan dapat dilakukan sesering sekali per bulan, dan frekuensinya diperkirakan akan menurun seiring waktu. VMware Engine akan memberi tahu Anda tentang pemeliharaan portal yang akan datang dan berupaya untuk menjaga interval pemeliharaan sesingkat mungkin. Selama interval pemeliharaan portal, layanan berikut akan terus berfungsi tanpa dampak apa pun:

  • Aplikasi dan platform pengelolaan VMware
  • Akses vCenter
  • Semua jaringan dan penyimpanan

Pemeliharaan infrastruktur VMware

Terkadang perlu melakukan perubahan pada konfigurasi infrastruktur VMware. Interval ini dapat terjadi setiap satu hingga dua bulan, tetapi frekuensinya diperkirakan akan menurun seiring waktu. Jenis pemeliharaan ini biasanya dapat dilakukan tanpa mengganggu penggunaan cloud pribadi normal. Selama interval pemeliharaan VMware, layanan berikut akan terus berfungsi tanpa dampak apa pun:

  • Aplikasi dan platform pengelolaan VMware
  • Akses vCenter
  • Semua jaringan dan penyimpanan

Update dan upgrade

VMware Engine bertanggung jawab atas pengelolaan siklus proses software VMware (ESXi, vCenter, PSC, dan NSX) di cloud pribadi.

Update software mencakup hal berikut:

  • Patch: patch keamanan atau perbaikan bug yang dirilis oleh VMware
  • Update: perubahan versi minor pada komponen stack VMware
  • Upgrade: perubahan versi utama komponen stack VMware

VMware Engine menguji patch keamanan penting segera setelah tersedia dari VMware. Sesuai SLA, VMware Engine menargetkan peluncuran patch keamanan ke lingkungan cloud pribadi dalam waktu satu minggu sejak patch tersedia.

Saat software VMware versi utama baru tersedia, VMware Engine akan bekerja sama dengan pelanggan untuk mengoordinasikan periode pemeliharaan yang sesuai untuk menerapkan upgrade. VMware Engine menerapkan upgrade versi utama setidaknya enam bulan setelah versi utama dirilis dan memberi tahu pelanggan satu bulan sebelum menerapkan upgrade versi utama.

VMware Engine juga bekerja sama dengan vendor industri utama untuk memastikan bahwa mereka mendukung versi software VMware terbaru sebelum meluncurkan upgrade versi utama. Untuk informasi tentang dukungan untuk vendor tertentu, hubungi Cloud Customer Care.

Tanggung jawab pembaruan sertifikat

Pembaruan sertifikat adalah tanggung jawab Google. Jika Anda mendapatkan error update sertifikat, tidak ada tindakan yang diperlukan dan sertifikat akan diperpanjang sebelum masa berlakunya berakhir. Namun, jika LDAPS dikonfigurasi di cloud pribadi, Anda hanya bertanggung jawab atas sertifikat tertentu yang terkait dengan error tersebut.

Persiapan

Google merekomendasikan untuk melakukan persiapan berikut sebelum memulai update atau upgrade:

  • Periksa kapasitas penyimpanan: Pastikan penggunaan ruang penyimpanan cluster vSphere Anda lebih rendah dari 80% untuk mempertahankan SLA. Jika penggunaan lebih tinggi dari 80%, upgrade mungkin memerlukan waktu lebih lama dari biasanya atau gagal sepenuhnya. Jika penggunaan penyimpanan Anda lebih tinggi dari 70%, tambahkan node untuk memperluas cluster dan menghindari potensi downtime selama upgrade.
  • Mengubah kebijakan penyimpanan vSAN dengan FTT 0: Ubah VM yang dikonfigurasi dengan kebijakan penyimpanan vSAN untuk Kegagalan yang Dapat Ditoleransi (FTT) 0 menjadi kebijakan penyimpanan vSAN dengan FTT 1 untuk mempertahankan SLA.
  • Menghapus pemasangan CD VM: Hapus CD yang dipasang di VM workload Anda yang tidak kompatibel dengan vMotion.
  • Menyelesaikan penginstalan alat VMware: Selesaikan penginstalan atau upgrade alat VMware sebelum upgrade terjadwal dimulai.
  • Menghapus berbagi bus SCSI di VM: Menghapus berbagi bus SCSI di VM jika Anda tidak ingin VM dimatikan.
  • Menghapus VM dan datastore yang tidak dapat diakses: Hapus VM yang tidak digunakan dan tidak dapat diakses dari inventaris vCenter. Hapus datastore eksternal yang tidak dapat diakses.
  • Menonaktifkan aturan Distributed Resource Scheduler (DRS): Aturan DRS yang menyematkan VM ke host mencegah node memasuki mode pemeliharaan. Anda dapat menonaktifkan aturan DRS sebelum upgrade dan mengaktifkannya setelah upgrade selesai.
  • Update add-on VMware dan solusi pihak ketiga: Pastikan add-on VMware dan solusi pihak ketiga yang di-deploy di vCenter cloud pribadi Anda kompatibel dengan versi pasca-upgrade yang disebutkan sebelumnya. Contoh alat mencakup alat untuk pencadangan, pemantauan, orkestrasi disaster recovery, dan fungsi serupa lainnya. Hubungi vendor solusi dan update terlebih dahulu jika perlu untuk memastikan kompatibilitas setelah upgrade.

Konfigurasi yang mungkin memengaruhi proses pemeliharaan

VMware Engine memanfaatkan Mode Pemeliharaan VMware untuk melakukan upgrade, update, dan pemeliharaan node. Hal ini membantu memastikan operasi berkelanjutan workload Cloud Pribadi Anda. Namun, konfigurasi berikut mungkin memerlukan langkah tambahan sebelum node dapat memasuki Mode Pemeliharaan:

  • Aturan DRS: Aturan MUST yang memaksa VM untuk tetap berada di node tertentu.
  • Berbagi bus SCSI: VM yang dikonfigurasi untuk berbagi bus SCSI.
  • Pemasangan CD-ROM: VM dengan CD-ROM terpasang, terutama jika CD-ROM tersebut tidak dapat dipindahkan ke node lain menggunakan vMotion.
  • Koneksi port serial: VM yang menggunakan koneksi port serial yang mencegah VM tersebut dipindahkan ke node lain menggunakan vMotion.
  • Pemetaan perangkat mentah (RDM): VM yang langsung mengakses perangkat penyimpanan fisik.

Jika tindakan diperlukan

Jika salah satu konfigurasi ini ada di node, Cloud Customer Care akan memberi tahu Anda setidaknya 24 jam sebelum mengambil langkah perbaikan yang diperlukan untuk mempertahankan ketersediaan Cloud Pribadi Anda. Dalam beberapa kasus, langkah-langkah seperti mematikan VM dan memindahkannya dengan vMotion, lalu menyalakannya, atau melepas CD-ROM, mungkin akan mengganggu beban kerja Anda untuk sementara.

Langkah selanjutnya