Praktik terbaik pengelolaan kuota

Halaman ini menjelaskan praktik terbaik untuk mengelola kuota Cloud Healthcare API. Gunakan halaman ini jika project Google Cloud Anda memiliki, atau mungkin memiliki, traffic dalam jumlah besar dan Anda memerlukan kuota lebih banyak daripada yang disediakan Cloud Healthcare API secara default.

Kuota default Cloud Healthcare API

Kuota Cloud Healthcare API default tidak dirancang untuk semua kasus penggunaan, terutama jika project Google Cloud Anda memiliki traffic dalam jumlah besar. Cloud Healthcare API tidak meningkatkan kuota secara otomatis. Anda harus merencanakan dan memantau penggunaan kuota.

Praktik terbaik untuk memantau dan melihat kuota

Ada beberapa metode untuk melihat penggunaan kuota Anda. Saat memperkirakan dan melihat kuota untuk Cloud Healthcare API, sebaiknya gunakan Model Kuota Layanan. Model ini memungkinkan Anda menilai kuota yang tersedia yang Anda miliki secara akurat berdasarkan kriteria berikut:

  • Apakah ada penggantian admin. Akun utama yang diberi peran Quota Administrator di organisasi dapat menerapkan penggantian admin ke kuota di project Google Cloud dalam organisasi. Penggantian admin menggantikan batas default dan penggantian produsen.
  • Apakah ada penggantian produsen. Pemilik layanan memberikan penggantian produsen kepada konsumen layanan. Google Cloud adalah pemilik layanan dari layanan Cloud Healthcare API. Penggantian kuota apa pun yang disediakan Google Cloud merupakan penggantian produsen.

  • Apakah ada penggantian konsumen. Seseorang yang membuat permintaan ke Cloud Healthcare API adalah konsumen layanan Cloud Healthcare API. Anda dapat menerapkan penggantian konsumen untuk berbagai situasi, seperti membatasi kuota di project Google Cloud sebagai tindakan kontrol biaya agar tidak melampaui anggaran Anda.

Jika salah satu penggantian ini diterapkan, Anda dapat menghitung batas kuota konsumen untuk mendapatkan penilaian akurat tentang kuota yang tersedia.

Praktik terbaik untuk meminta kuota tambahan

Google Cloud memiliki prosedur untuk meminta kuota yang lebih tinggi. Untuk mempelajari cara memproses permintaan penambahan kuota, lihat artikel Tentang permintaan penambahan kuota.

Sebelum meminta kuota tambahan, pastikan Anda telah menerapkan kedua hal berikut:

Implementasi ini dapat mengurangi jumlah kuota yang diperlukan karena alasan berikut:

  • Kedua implementasi menyebarkan lonjakan beban selama beberapa jam atau menit, bukan detik.
  • Kedua implementasi membuat penggunaan kuota secara efisien selama periode 24 jam. Jika permintaan yang secara signifikan melebihi kuota default konsisten selama periode 24 jam, kumpulan resource yang lebih besar dapat dialokasikan ke layanan Cloud Healthcare API. Alokasi tambahan resource hanya berdasarkan permintaan dan ditentukan berdasarkan kasus per kasus.
  • Penggunaan resource yang konsisten memudahkan Google Cloud untuk memahami persyaratan kuota dan memberi Anda kuota yang diperlukan.

Untuk mengelola kapasitas dan kuota secara efektif, Anda perlu mengetahui persyaratan kapasitas organisasi Anda. Jika Anda merencanakan persyaratan kapasitas dan merasa akan memerlukan peningkatan kuota yang besar saat project Google Cloud Anda sedang dalam tahap produksi, mintalah peningkatan dari Google Cloud Customer Care. Customer Care dapat membantu Anda mengalokasikan dan meningkatkan kuota selama fase pengujian dan peluncuran project Google Cloud Anda.

Anda tidak harus memiliki layanan Layanan Pelanggan berbayar untuk meminta penambahan kuota. Sebagian permintaan penambahan kuota akan selesai dalam waktu 2-3 hari kerja, tetapi sebaiknya Anda merencanakan lebih lama. Jika penambahan kuota Anda besar, perlu waktu 10 hari kerja atau lebih untuk menyelesaikan permintaan penambahan kuota. Sebagai bagian dari perencanaan Anda, Anda harus mengalokasikan waktu untuk merespons Layanan Pelanggan guna menyelesaikan pertanyaan atau membuka masalah terkait permintaan tersebut. Jika Anda memastikan bahwa permintaan penambahan kuota awal cukup mendetail, Anda mungkin dapat mengurangi waktu yang dihabiskan untuk menunggu permintaan terpenuhi.

Praktik terbaik untuk mengantisipasi kebutuhan kuota

Sebelum project Google Cloud Anda mulai diproduksi, antisipasi dan rencanakan jumlah kuota yang akan Anda perlukan. Merencanakan persyaratan kuota akan mencegah pembatasan yang tidak terduga pada konsumsi resource Anda nantinya.

Bagian berikut menjelaskan hal-hal yang perlu dipertimbangkan saat merencanakan kuota.

Antisipasi total penggunaan untuk semua penyimpanan data dan klien

Memahami total penggunaan Anda di semua penyimpanan data Cloud Healthcare API, dan memahami total penggunaan semua klien yang membuat permintaan ke project Google Cloud Anda.

  • Beberapa project Google Cloud menerapkan beberapa kasus penggunaan Cloud Healthcare API. Misalnya, project Google Cloud Anda mungkin menggunakan beberapa set data Cloud Healthcare API dan penyimpanan data untuk berbagai jenis data, sehingga meningkatkan total penggunaan kuota Anda.
  • Kuota diterapkan per project Google Cloud dan per region. Pastikan Anda memiliki pengukuran akurat atas kuota yang diperlukan di beberapa region. Jika memiliki beberapa project Google Cloud, Anda mungkin memerlukan pengukuran yang lebih akurat di seluruh project. Untuk mengetahui informasi selengkapnya tentang perencanaan kuota per region, lihat Antisipasi penggunaan per region.
  • Cloud Healthcare API tidak melakukan load balancing kuota di seluruh klien, set data, atau penyimpanan data. Klien harus menentukan apakah akan mengimplementasikan skema prioritas untuk memastikan bahwa traffic yang paling penting tidak mengalami error 429 RESOURCE_EXHAUSTED.

Antisipasi penggunaan per region

Cloud Healthcare API mengukur kuota per project Google Cloud dan per region. Kuota biasanya diukur per menit, sehingga terjadi lonjakan kecil pada permintaan per detik untuk menyeimbangkannya dalam skala per menit.

Jika project Google Cloud Anda menggunakan beberapa region, Anda dapat menetapkan kuota per region.

Jika set data Cloud Healthcare API Anda berada di lokasi multi-regional us, dan Anda ingin meminta kuota tambahan, cantumkan dalam permintaan kuota bahwa kuota tersebut adalah untuk "region meta AS". Lokasi multi-regional us terdiri dari sub-region berikut:

  • us-central1
  • us-east1
  • us-west1

Jika Anda sudah memiliki traffic Cloud Healthcare API yang menggunakan kuota di salah satu sub-region us-, pastikan Anda mempertimbangkan traffic yang ada di sub-region tersebut saat membuat permintaan penambahan kuota untuk multi-region us. Misalnya, jika Anda memiliki set data di us-central1 dan us, lalu meminta penambahan kuota di us, tentukan dalam permintaan bahwa Anda memiliki set data di us-central1.

Mendukung transaksi bervolume rendah secara konsisten

Skenario berikut menjelaskan pentingnya mengirim traffic dalam jumlah yang lebih kecil secara konsisten, bukan mengirim transaksi bervolume tinggi dengan interval yang lebih panjang di antara transaksi.

Volume traffic dihitung menggunakan rumus request payload * time = traffic volume. Transaksi volume tinggi adalah satu atau beberapa permintaan ke Cloud Healthcare API dalam interval singkat yang berisi payload besar. Serangkaian permintaan juga dapat dianggap volume tinggi jika ada banyak permintaan yang dikirim dalam interval singkat, terlepas dari ukuran payload.

Misalkan klien mengumpulkan transaksi bervolume tinggi dan mengirimkan transaksi ke Cloud Healthcare API dalam burst setiap lima menit. Hal berikut akan terjadi:

  1. burst traffic awal menggunakan kuota pada menit pertama (bergantung pada rotasi menit) hingga semua kuota habis.
  2. Semua traffic burst yang tersisa akan menerima 429 RESOURCE_EXHAUSTED error. Jika dikonfigurasi, semua permintaan yang terpengaruh akan mengalami backoff eksponensial.
  3. Beberapa persentase permintaan yang mengalami backoff eksponensial awal dijadwalkan ulang untuk dicoba lagi pada menit berikutnya. Beberapa permintaan dicoba beberapa kali dalam satu menit, kemudian dicoba lagi pada menit berikutnya.
  4. Jika volume permintaan cukup tinggi, permintaan yang dicoba lagi mungkin mengalami error 429 RESOURCE_EXHAUSTED dan backoff eksponensial lagi. Letupan traffic tertentu mungkin mengalami backoff eksponensial pada waktu yang berbeda, dan upaya untuk mengirim traffic lagi dapat dikonvergensi pada menit yang sama di masa mendatang.
  5. Jika volume permintaan masih tinggi, beberapa traffic akan dicoba ulang saat burst traffic berikutnya dimulai. Masalah ini diperburuk karena lebih banyak traffic yang ditambahkan ke backlog permintaan yang ada. Aplikasi Anda mungkin mengalami kesulitan dalam mengelola backlog permintaan dan mengirimkannya secara konsisten ke Cloud Healthcare API.

Skenario ini menunjukkan pentingnya mengetahui volume traffic per menit. Terapkan volume traffic dan backoff untuk mencegah kemacetan jaringan dan pastikan aplikasi Anda tidak mengalami banyak kegagalan yang memerlukan percobaan ulang.

Meninjau kuota DICOM dan FHIR

Untuk melihat kuota Cloud Healthcare API yang terkait dengan penyimpanan dan operasi FHIR dan DICOM, lihat Batas kuota.

Resource pengelolaan kuota

Untuk mengetahui informasi lebih lanjut mengenai perencanaan dan pengelolaan kuota, lihat Mengelola kapasitas dan kuota.