Praktik terbaik pengelolaan kuota

Halaman ini menjelaskan praktik terbaik untuk mengelola kuota Cloud Healthcare API. Gunakan halaman ini jika project Google Cloud Anda memiliki, atau mungkin memiliki, traffic dalam jumlah besar dan Anda memerlukan kuota lebih banyak daripada yang disediakan Cloud Healthcare API secara default.

Kuota default Cloud Healthcare API

Kuota Cloud Healthcare API default tidak dirancang untuk semua kasus penggunaan, terutama jika project Google Cloud Anda memiliki traffic dalam jumlah besar. Cloud Healthcare API tidak otomatis menambah kuota. Anda harus merencanakan dan memantau penggunaan kuota.

Praktik terbaik untuk memantau dan melihat kuota

Ada beberapa metode untuk melihat penggunaan kuota Anda. Saat memperkirakan dan melihat kuota untuk Cloud Healthcare API, sebaiknya Anda menggunakan Model Kuota Layanan. Model ini memungkinkan Anda menilai kuota yang tersedia secara akurat berdasarkan kriteria berikut:

  • Apakah penggantian admin ada. Akun utama yang diberi peran Quota Administrator dalam organisasi dapat menerapkan penggantian admin pada kuota di projectGoogle Cloud dalam organisasi. Penggantian admin menggantikan batas default dan penggantian produser.
  • Apakah ada pengabaian produsen. Pemilik layanan memberikan penggantian produsen kepada konsumen layanan. Google Cloud adalah pemilik layanan Cloud Healthcare API. Penggantian kuota apa pun yang disediakan oleh Google Cloud adalah penggantian produsen.

  • Apakah penggantian konsumen ada. Seseorang yang membuat permintaan ke Cloud Healthcare API adalah konsumen layanan Cloud Healthcare API. Anda dapat menerapkan penggantian konsumen untuk berbagai situasi, seperti membatasi kuota di project Google Cloud sebagai langkah pengontrolan biaya untuk mencegah melampaui anggaran Anda.

Jika salah satu penggantian ini berlaku, Anda dapat menghitung batas kuota konsumen untuk mendapatkan penilaian yang akurat tentang kuota yang tersedia.

Praktik terbaik untuk meminta kuota tambahan

Google Cloud memiliki prosedur untuk meminta kuota yang lebih tinggi. Untuk mempelajari cara permintaan penambahan kuota diproses, lihat Tentang permintaan penambahan kuota.

Sebelum meminta kuota tambahan, pastikan Anda telah menerapkan kedua hal berikut:

Penerapan ini dapat mengurangi jumlah kuota yang Anda perlukan karena alasan berikut:

  • Kedua implementasi ini menyebarkan lonjakan beban selama beberapa jam atau menit, bukan detik.
  • Kedua implementasi tersebut menggunakan kuota secara efisien selama periode 24 jam. Jika permintaan yang secara signifikan melebihi kuota default konsisten selama periode 24 jam, kumpulan resource yang lebih besar dapat dialokasikan ke layanan Cloud Healthcare API. Alokasi tambahan resource hanya berdasarkan permintaan dan ditentukan secara kasus per kasus.
  • Penggunaan resource yang konsisten mempermudah Google Cloud untuk memahami persyaratan kuota Anda dan memberi Anda kuota yang Anda butuhkan.

Untuk mengelola kapasitas dan kuota secara efektif, Anda perlu mengetahui persyaratan kapasitas organisasi Anda. Jika Anda merencanakan persyaratan kapasitas dan merasa bahwa Anda memerlukan penambahan kuota yang besar saat project Google Cloud Anda dalam produksi, minta penambahan dari Layanan Pelanggan Google Cloud. Layanan Pelanggan dapat membantu Anda mengalokasikan dan meningkatkan kuota selama fase pengujian dan peluncuran project Google Cloud .

Anda tidak harus memiliki layanan Layanan Pelanggan berbayar untuk meminta penambahan kuota. Beberapa permintaan penambahan kuota diselesaikan dalam waktu 2-3 hari kerja, tetapi sebaiknya Anda merencanakan waktu yang lebih lama. Jika penambahan kuota Anda besar, mungkin perlu waktu 10 hari kerja atau lebih agar permintaan penambahan kuota selesai. Bagian dari perencanaan Anda harus melibatkan alokasi waktu untuk merespons Layanan Pelanggan guna menyelesaikan pertanyaan atau masalah yang belum terselesaikan tentang permintaan tersebut. Jika Anda memastikan bahwa permintaan peningkatan kuota awal Anda cukup mendetail, Anda mungkin dapat mengurangi waktu yang dihabiskan untuk menunggu permintaan dipenuhi.

Praktik terbaik untuk mengantisipasi kebutuhan kuota

Sebelum project Google Cloud Anda memasuki tahap produksi, antisipasi dan rencanakan jumlah kuota yang akan Anda perlukan. Merencanakan persyaratan kuota akan mencegah pembatasan yang tidak terduga pada konsumsi resource Anda nanti.

Bagian berikut menjelaskan hal-hal yang perlu dipertimbangkan saat merencanakan kuota.

Mengantisipasi total penggunaan untuk semua penyimpanan dan klien data

Pahami total penggunaan Anda di semua penyimpanan data Cloud Healthcare API, dan pahami total penggunaan semua klien yang membuat permintaan ke project Google Cloud .

  • Beberapa project Google Cloud menerapkan beberapa kasus penggunaan Cloud Healthcare API. Misalnya, project Google Cloud Anda mungkin menggunakan beberapa set data Cloud Healthcare API dan penyimpanan data untuk berbagai jenis data, sehingga meningkatkan total penggunaan kuota Anda.
  • Kuota diterapkan berdasarkan projectGoogle Clouddan per region. Pastikan Anda memiliki pengukuran yang akurat tentang kuota yang diperlukan di beberapa region. Jika memiliki beberapa project Google Cloud , Anda mungkin memerlukan pengukuran yang lebih akurat di seluruh project. Untuk mengetahui informasi selengkapnya tentang perencanaan kuota per region, lihat artikel Mengantisipasi penggunaan per region.
  • Cloud Healthcare API tidak memuat kuota beban di seluruh klien, set data, atau penyimpanan data. Klien harus menentukan apakah akan menerapkan skema prioritas untuk memastikan bahwa traffic yang paling penting tidak mengalami error 429 RESOURCE_EXHAUSTED.

Mengantisipasi penggunaan per region

Cloud Healthcare API mengukur kuota berdasarkan projectGoogle Clouddan per region. Kuota biasanya diukur per menit, yang memungkinkan lonjakan kecil permintaan per detik untuk diseimbangkan pada skala per menit.

Jika project Google Cloud Anda menggunakan beberapa region, Anda dapat menetapkan kuota per region.

Jika set data Cloud Healthcare API Anda berada di lokasi multi-regional us, dan Anda ingin meminta kuota tambahan, nyatakan dalam permintaan kuota bahwa kuota tersebut untuk "US meta region". Lokasi multi-regional us terdiri dari subregion berikut:

  • us-central1
  • us-east1
  • us-west1

Jika Anda sudah memiliki traffic Cloud Healthcare API yang menggunakan kuota di salah satu sub-region us-, pastikan Anda memperhitungkan traffic yang ada di sub-region tersebut saat membuat permintaan peningkatan kuota untuk multi-region us. Misalnya, jika Anda memiliki set data di us-central1 dan us, dan Anda meminta penambahan kuota di us, tentukan dalam permintaan Anda bahwa Anda memiliki set data di us-central1.

Memilih transaksi bervolume rendah secara konsisten

Skenario berikut menjelaskan pentingnya mengirim traffic dalam jumlah yang lebih kecil secara konsisten, bukan mengirim transaksi bervolume tinggi dengan interval yang lebih lama di antara transaksi.

Volume traffic dihitung menggunakan formula request payload * time = traffic volume. Transaksi bervolume tinggi adalah satu atau beberapa permintaan ke Cloud Healthcare API dalam interval singkat yang berisi payload besar. Serangkaian permintaan juga dapat dianggap bervolume tinggi jika ada banyak permintaan yang dikirim dalam interval singkat, terlepas dari ukuran payload-nya.

Misalkan klien mengumpulkan transaksi bervolume tinggi dan mengirim transaksi tersebut ke Cloud Healthcare API dalam burst setiap lima menit. Hal berikut akan terjadi:

  1. Lonjakan traffic awal akan menghabiskan kuota pada menit pertama (bergantung pada rollover menit) hingga semua kuota habis.
  2. Traffic burst yang tersisa akan menerima error 429 RESOURCE_EXHAUSTED. Jika dikonfigurasi, semua permintaan yang terpengaruh akan mengalami backoff eksponensial.
  3. Beberapa persentase permintaan yang mengalami backoff eksponensial awal akan dijadwalkan ulang untuk dicoba lagi dalam menit berikutnya. Beberapa permintaan dicoba beberapa kali dalam satu menit, lalu dicoba lagi pada menit berikutnya.
  4. Jika volume permintaan cukup tinggi, permintaan yang dicoba ulang mungkin mengalami error 429 RESOURCE_EXHAUSTED dan backoff eksponensial lagi. Lonjakan traffic tertentu mungkin mengalami backoff eksponensial pada waktu yang berbeda, dan upaya untuk mengirim traffic lagi mungkin akan terjadi pada menit yang sama di masa mendatang.
  5. Jika volume permintaan masih tinggi, beberapa traffic akan dicoba lagi saat traffic berikutnya dimulai. Masalah ini diperburuk karena lebih banyak traffic ditambahkan ke antrean permintaan yang ada. Aplikasi Anda mungkin kesulitan mempertahankan backlog permintaan dan mengirimkannya secara konsisten ke Cloud Healthcare API.

Skenario ini menunjukkan pentingnya mengetahui volume traffic Anda per menit. Terapkan volume traffic dan backoff untuk mencegah kemacetan jaringan dan memastikan aplikasi Anda tidak mengalami banyak kegagalan yang memerlukan percobaan ulang.

Meninjau kuota DICOM dan FHIR

Untuk melihat kuota Cloud Healthcare API yang terkait dengan penyimpanan dan operasi FHIR dan DICOM, lihat Batas kuota.