Download laporan resmi baru tentang SRE untuk mempelajari konsep penting dan bagaimana Google Cloud dapat membantu dalam perjalanan SRE Anda
Langsung ke

Site Reliability Engineering (SRE)

SRE adalah sebuah fungsi kerja, pola pikir, dan rangkaian praktik engineering untuk menjalankan sistem produksi yang andal. Google Cloud membantu Anda menerapkan prinsip-prinsip SRE melalui alat, layanan profesional, dan sumber daya lainnya.
  • Sabre
  • Lowe’s
  • adeo
  • Zebra
  • Optiva
  • Procter & Gamble
  • TELUS
  • Ulta
  • Logo JCB

Manfaat

Mencapai keseimbangan antara kecepatan dan keandalan

Menikmati manfaat kecepatan

Otomatiskan proses secara end-to-end, mulai dari menulis kode hingga menjalankan layanan di produksi. Selaraskan praktik DevOps dengan berpijak pada sasaran bersama untuk melangkah lebih cepat. Terhubunglah ke alat yang Anda sukai, termasuk manajemen insiden, sebagai upaya meminimalkan toil.

Meningkatkan keandalan dengan prinsip-prinsip SRE yang telah terbukti

Manfaatkan prinsip-prinsip SRE yang dikembangkan di Google dan telah terbukti efektif dalam skala besar. Terapkan praktik terbaik SRE dengan mudah menggunakan Google Cloud Operations Suite untuk mempercepat penyelesaian masalah dan meningkatkan keandalan.

Kami mendampingi Anda di setiap langkah perjalanan SRE Anda

Dorong pengiriman software yang lebih tinggi, terlepas dari ukuran perusahaan dan jenis industri Anda, atau apakah Anda menggunakan VM, Kubernetes, atau serverless. Pilih antara alat gratis dan penawaran berbayar untuk memulai perjalanan SRE Anda.

Fitur utama

Alat dan resource SRE untuk memperlancar tugas tim SRE dan operasional Anda

Memantau kondisi layanan menggunakan prinsip-prinsip SRE

Pantau kondisi layanan Anda dan jalin kerja sama dengan developer dalam meningkatkan kecepatan perubahan menggunakan dukungan bawaan untuk pemantauan layanan. Pilih metrik SLI, tetapkan SLO, dan lacak anggaran error untuk memitigasi risiko terhadap layanan Anda. Gunakan dasbor yang canggih untuk menggabungkan metrik dan log, termasuk sinyal emas, guna mengurangi MTTR dan menjawab pertanyaan tentang kondisi layanan dengan cepat.

Integrasi siap pakai untuk meningkatkan otomatisasi dan mengurangi toil

Gunakan integrasi bawaan kami dengan alat-alat favorit Anda untuk memecahkan masalah insiden dengan cepat. Terapkan peluncuran yang progresif dan roll back perubahan dengan aman. Integrasi bawaan dengan Cloud Build tersedia sehingga Anda dapat membangun, menguji, dan men-deploy artefak ke Google Kubernetes Engine, App Engine, Cloud Functions, Firebase, dan Cloud Run sebagai bagian dari CI/CD Anda.

Satu tampilan terintegrasi untuk penyelesaian lebih cepat

Dapatkan satu tampilan terpadu untuk semua log, peristiwa, metrik, dan SLO. Dapatkan data kemampuan observasi sesuai konteks, langsung dari dalam konsol layanan Google Kubernetes Engine, Cloud Run, Compute Engine, Anthos, dan runtime lainnya. Kumpulkan metrik, trace, dan log tanpa perlu penyiapan apa pun. Latensi penyerapan subdetik dan tingkat penyerapan terabyte per detik memastikan Anda dapat menjalankan pengelolaan serta analisis log real-time dalam skala besar. 

Mendapatkan bantuan ekstra dari spesialis SRE Google Cloud

Jika Anda memerlukan bantuan langsung selama perjalanan SRE, tersedia layanan tambahan yang dapat Anda pertimbangkan, termasuk layanan konsultasi Google. Hubungi bagian penjualan kami untuk mengetahui opsi yang sesuai dengan kebutuhan organisasi Anda. Ambil pelajaran dari kisah sukses pelanggan dan dari tim CRE kami untuk mengetahui bagaimana alat dan praktik Google Cloud membantu perusahaan lain menerapkan SRE di organisasi mereka.

Mendorong kolaborasi SRE/developer untuk menguji kemampuan observasi sejak awal proses

Dengan paket OpenTelemetry (OT) dan Pengekspor Google, developer dapat melakukan instrumentasi dan mengekspor data trace ke Cloud Trace. Agen operasional baru dan terpadu kami (dalam versi pratinjau) mengumpulkan metrik dan log serta mendukung OpenTelemetry untuk mengambil dan mengangkut metrik. Kami terus berupaya untuk menerapkan library OT sebagai fitur siap pakai di banyak produk cloud kami. Cloud SQL Insights adalah salah satu contoh dari upaya ini.


Dokumentasi

Pelajari cara menerapkan SRE di organisasi Anda dengan referensi berikut

Praktik Terbaik
Site Reliability Engineering Google

Akses buku tentang SRE, dengarkan paparan dari spesialis SRE, dan pelajari cara kami menjalankan SRE di Google.

Dasar-Dasar Google Cloud
Membuat SLO

Untuk memantau layanan, Anda memerlukan setidaknya satu tujuan tingkat layanan (SLO). Pelajari langkah demi langkah cara membuat SLO pertama Anda di Cloud Monitoring.

Tutorial
Engineering untuk keandalan

Pelajari cara menetapkan dan mempertahankan SLO di Google Cloud Operations Suite serta cara meningkatkan kemampuan observasi aplikasi yang berjalan di Google Cloud.

Tutorial
SRE: Measuring and managing reliability

Kursus ini mengajarkan teori tujuan tingkat layanan (SLO), yakni cara pasti untuk menjelaskan dan mengukur keandalan yang diinginkan dari sebuah layanan.

Tutorial
Developing a Google SRE culture

Kursus ini memperkenalkan beberapa praktik utama SRE Google serta peran penting pimpinan IT dan bisnis dalam keberhasilan pengadopsian SRE di tingkat organisasi.

Yang baru

Yang baru di SRE Google Cloud

Daftar untuk berlangganan newsletter Google Cloud guna menerima berita terbaru terkait produk, informasi acara, penawaran spesial, dan sebagainya.