Perencanaan kelangsungan bisnis dan pemulihan dari bencana (disaster recovery)

Halaman ini berlaku untuk Apigee dan Apigee Hybrid.

Baca dokumentasi Apigee Edge.

Apigee adalah platform multitenant, layanan mandiri, dan berbasis cloud yang berjalan dalam konfigurasi yang sepenuhnya redundan (live/live) di beberapa pusat data di beberapa region di dunia. Apigee menggunakan Google Cloud untuk platform berbasis cloud. Sebagai bagian dari layanan yang kami bangun di Google Cloud, kami menggunakan beberapa pusat data di setiap region dan melayani traffic langsung untuk pelanggan kami di beberapa pusat data ini. Kami tidak memiliki pusat data "aktif" dan pusat data "standby" (atau "sekunder" atau "failover"). Kami memiliki dua (atau lebih) pusat data yang secara konstan dan bersamaan melayani traffic pelanggan di setiap wilayah secara global.

Rencana BCP/DR

Perencanaan Kelangsungan Bisnis dan Pemulihan dari Bencana (BCP/DR) Apigee adalah rencana tingkat platform dan tidak berisi tugas mendetail untuk pelanggan perorangan. Sebaliknya, platform dikonfigurasi untuk memproses permintaan data pelanggan terlepas dari gangguan dan pemadaman layanan. Data akan terus mengalir meskipun seluruh pusat data sedang offline. Jika seluruh region offline, pelanggan dengan region tunggal dapat mengalami pemadaman layanan pemrosesan API. Bagi pelanggan yang mencari lebih dari sekadar layanan redundan "dalam region", Apigee tersedia di tingkat pusat data redundan global dengan traffic dapat dilayani di beberapa wilayah atau negara, sehingga jika seluruh region dihentikan secara offline, data akan tetap mengalir.

Layanan pelanggan satu region tidak otomatis ditransfer ke region lain karena adanya kemungkinan pembatasan geografis pada pemrosesan dan akses data. Layanan Apigee dihosting untuk pelanggan di wilayah yang diidentifikasi oleh pelanggan. Karena mungkin ada peraturan atau komitmen pelanggan tertentu kepada penggunanya di lokasi geografis data, layanan tidak akan otomatis berpindah ke region alternatif, karena hal ini berpotensi membahayakan komitmen Google terhadap pelanggannya atau komitmen pelanggan Google kepada pelanggan mereka.

Google tidak membagikan paket BCP/DR lengkap kepada setiap pelanggan, karena paket tersebut berisi informasi internal sensitif dan referensi untuk pelanggan kami. Kebijakan privasi kami tidak mengizinkan pembagian paket BCP/DR platform kepada masing-masing pelanggan yang berpotensi mengekspos nama pelanggan lainnya. Kami menawarkan tingkat privasi yang sama ini kepada setiap pelanggan.

Pengelolaan BCP/DR

Tim Keamanan Informasi Google bertanggung jawab atas pengawasan program Ketahanan Bisnis, sedangkan Komandan Insiden yang bergilir bertanggung jawab atas pengelolaan dan penyelesaian semua insiden. Komandan Insiden selalu menugaskan personel operasional dan teknik yang siap dihubungi beserta playbook untuk semua tindakan yang mungkin perlu dilakukan.

Pengujian BCP/DR

Google melakukan proses operasional yang mendukung pengujian BCP/DR platform dengan ritme yang lebih sering daripada pengujian BCP/DR tahunan penuh. Setiap bulan, kami melakukan perubahan beban dari lingkungan live/live sambil melakukan update pada sistem yang menjalankan layanan. Proses ini melibatkan penghentian seluruh sistem dari satu pusat data selagi beban ditangani oleh pusat data pembanding. Selama proses ini, setelah pembaruan apa pun dilakukan, pusat data pertama akan dikembalikan dan layanan dijalankan kembali secara langsung untuk memverifikasi bahwa tidak ada masalah yang muncul. Kemudian, pusat data pembanding dinonaktifkan untuk update yang sama, lalu dikembalikan lagi online ke internet. Google menggunakan alat dan teknik untuk menghabiskan traffic dan mengirim sebagian kecil traffic ke layanan yang baru saja diupdate untuk memeriksa masalah atau error sebelum kembali ke pemrosesan beban penuh.

Proses operasional yang konsisten ini melebihi "pengujian" ketahanan dua kali setahun standar industri kami dengan menjadikannya tugas operasional yang lebih sering terjadi.

Selain proses operasional yang dijelaskan di atas, Google juga melakukan latihan BCP/DR setidaknya sekali setiap tahun. Di sini, anggota tim engineering dan operasi menguji skenario bencana yang sebenarnya. Hal ini memberikan pelatihan dan pengalaman tambahan bagi personel kami dalam paket BCP/DR yang lebih besar untuk perusahaan secara keseluruhan selain layanan itu sendiri.

Pengujian BCP/DR yang dilakukan oleh Google tidak menggunakan "latihan failover" atau "lokasi sekunder" karena semua itu disertakan dalam sistem yang sedang berjalan.

Google mengelola Playbook untuk digunakan oleh semua tim operasional dan engineer. Playbook ini ditinjau dan diperbarui setidaknya setiap tahun dan digunakan di semua latihan pengujian dan pelatihan BCP/DR kami.

Laporan pengujian BCP/DR tahunan tersedia untuk pelanggan. Kami juga membagikan hasil tugas operasional dan laporan pengujian penerapan DR tahunan kami kepada auditor pihak ketiga, dan ini menjadi dasar peninjauan auditor terhadap kepatuhan kami terhadap PCI, HIPAA, ISO, kontraktual, dan persyaratan lainnya.

Pengujian BCP/DR pelanggan

Pelanggan didorong untuk memiliki paket DR sendiri yang menyertakan layanan Apigee. Pelanggan dapat dan sebaiknya mempertimbangkan bagaimana Apigee dapat mengalihkan traffic sesuai kebutuhan agar pelanggan dapat mempertahankan layanan pengguna akhir bahkan selama pemadaman pusat data pelanggan atau peristiwa bencana lainnya. Namun, tingkat pengujian ini berada di luar cakupan rencana DR Apigee. Kami mendorong pelanggan untuk melakukan pengujian BCP/DR pada aplikasi mereka sendiri dan menyertakan Apigee dalam pengujian.

RTO/RPO

Apigee tidak menawarkan titik pemulihan dan batas waktu pemulihan (RPO/RTO) untuk pelanggan atau dalam kontrak yang terkait dengan aktivitas BCP/DR. SLA adalah setara cloud dengan titik data RTO/RPO. Karena Apigee adalah layanan berbasis cloud redundan dengan layanan pengelolaan dan runtime yang dirancang dengan layanan live redundan, RTO dan RPO dapat dilihat sebagai 'real-time'. Pelanggan region tunggal menerima minimum layanan redundan di berbagai pusat data dalam region yang sama. Pelanggan yang menginginkan tingkat redundansi yang lebih tinggi dapat memilih layanan multi-region.

Rencana pandemi

Google menyertakan rencana pandemi sebagai bagian dari keseluruhan rencana dan proses BCP/DR. Untuk operasi bisnis seperti dukungan, Google mengoperasikan tim dukungan global 24/7 di beberapa kantor dan lokasi jarak jauh. Jika pandemi di suatu area di dunia berdampak pada salah satu lokasi dukungan kami, staf di kantor lain akan diberi tahu dan menangani shift yang biasanya ditangani oleh kantor yang terkena dampak. Untuk layanan bisnis lainnya seperti penjualan, tenaga kerja tersebar secara global. Semua tim di Google memiliki kemampuan untuk bekerja dari jarak jauh jika diperlukan. Alat yang digunakan berbasis cloud dan secara alami cocok untuk rencana respons pandemi.

Update

Google meninjau dan memperbarui rencana BCP/DR minimal setiap tahun. Informasi yang dikumpulkan dari insiden, perubahan produk, standar industri, aktivitas analisis risiko, dan pengujian BCP/DB digunakan untuk memperbarui rencana.

Analisis Dampak Bisnis dan Penilaian Risiko

Google melakukan analisis dampak bisnis dan penilaian Risiko setiap tahun. Hasil BIA dan RA diprioritaskan dan didokumentasikan dalam sistem pelacakan masalah.