配額管理最佳做法

本頁說明管理 Cloud Healthcare API 配額的最佳做法。如果您的專案有大量流量,或可能出現大量流量,且您需要的配額超出 Cloud Healthcare API 的預設配額,請參閱本頁內容。 Google Cloud

Cloud Healthcare API 預設配額

預設的 Cloud Healthcare API 配額並非適用於所有用途,如果 Google Cloud 專案的流量很大,就更是如此。Cloud Healthcare API 不會自動增加配額。您必須規劃及監控配額用量。

監控及查看配額的最佳做法

您可以透過幾種方法查看配額用量。 估算及查看 Cloud Healthcare API 配額時,建議使用服務配額模型。您可以根據下列條件,準確評估可用的配額:

  • 是否有管理員覆寫。在機構中獲派「配額管理員」角色的主體,可以對機構內Google Cloud 專案的配額套用管理員覆寫。管理員覆寫設定會取代預設限制和生產端覆寫設定。
  • 是否有製作人覆寫。服務擁有者會將生產者覆寫權授予服務消費者。 Google Cloud 是 Cloud Healthcare API 服務的服務擁有者。您提供的任何配額覆寫 Google Cloud 都是生產端覆寫。

  • 是否有消費者覆寫設定。向 Cloud Healthcare API 發出要求的人,就是 Cloud Healthcare API 服務的消費者。您可以針對各種情況套用消費者覆寫,例如在Google Cloud 專案中限制配額,做為控管費用的措施,避免超出預算。

如果目前有任何這類覆寫生效,您可以計算消費者配額上限,準確評估可用配額。

申請額外配額的最佳做法

Google Cloud 有申請提高配額值的程序。如要瞭解配額調整要求處理程序,請參閱「關於配額調整」。

申請額外配額前,請務必導入下列兩項功能:

這些實作方式可能會減少您需要的配額,原因如下:

  • 這兩種實作方式都會將負載尖峰分散到數小時或數分鐘,而不是數秒。
  • 這兩種實作方式都能在 24 小時內有效運用配額。如果要求在 24 小時內持續大幅超出預設配額,系統可能會為 Cloud Healthcare API 服務分配更多資源。如要申請額外資源,請提出要求,我們會依個案情況決定是否核准。
  • 資源用量一致, Google Cloud 就能更輕鬆瞭解您的配額需求,並提供您所需的配額。

如要有效管理容量和配額,您必須瞭解貴機構的容量需求。如果您正在規劃容量需求,並認為專案進入正式環境後需要大幅增加配額,請向Google Cloud 客戶服務申請調高配額。 Google Cloud 在 Google Cloud 專案的測試和推出階段,客戶服務團隊可協助您分配及提高配額。

您不需要付費訂閱 Customer Care 服務,即可要求提高配額。部分配額增加要求會在 2 到 3 個工作天內完成,但我們建議您預留較長的時間。如果配額增加幅度較大,配額增加要求可能需要 10 個工作天以上才能完成。規劃時,請務必預留時間回覆客戶服務團隊,解決有關要求的任何問題或未解決的問題。如果確保初始配額增加要求包含足夠詳細的資訊,或許就能縮短等待要求完成的時間。

預估配額需求的最佳做法

在 Google Cloud 專案進入製作階段前,請先預估並規劃所需配額。規劃配額需求可避免日後資源用量受到非預期的限制。

以下各節說明規劃配額時應考量的因素。

預估所有資料儲存空間和用戶端的總用量

瞭解所有 Cloud Healthcare API 資料儲存庫的總用量,以及向Google Cloud 專案提出要求的所有用戶端的總用量。

  • 部分 Google Cloud 專案會實作多個 Cloud Healthcare API 用途。 舉例來說,您的專案可能會使用多個 Cloud Healthcare API 資料集和資料儲存庫來儲存不同類型的資料,因此會增加總配額用量。 Google Cloud
  • 配額是按Google Cloud專案和區域強制執行。請確保您已準確評估多個區域的必要配額。如果您有多個 Google Cloud 專案,可能需要更準確地測量各專案的成效。如要進一步瞭解如何規劃各區域的配額,請參閱預估各區域的用量
  • Cloud Healthcare API 不會在用戶端、資料集或資料儲存庫之間進行配額負載平衡。客戶必須決定是否要實作優先順序配置,確保最重要的流量不會遇到 429 RESOURCE_EXHAUSTED 錯誤。

預測各區域的用量

Cloud Healthcare API 會根據每個專案和每個區域計算配額。Google Cloud配額通常以每分鐘為單位計算,因此每秒要求數的小幅尖峰可在一分鐘內達到平衡。

如果 Google Cloud 專案使用多個區域,您可以設定各區域的配額。

如果您的 Cloud Healthcare API 資料集位於us多地區位置,且您想申請額外配額,請在配額要求中說明配額適用於「美國中繼區域」。us 多區域位置包含下列子區域:

  • us-central1
  • us-east1
  • us-west1

如果您已在任何us-子區域使用配額,請務必在為us多區域申請調高配額時,將這些子區域的現有流量納入考量。舉例來說,如果您在 us-central1us 中都有資料集,並要求提高 us 的配額,請在要求中說明您在 us-central1 中有資料集。

持續偏好低交易量

以下情境說明持續傳送少量流量的重要性,而非傳送大量交易,但交易間隔時間較長。

流量是使用公式 request payload * time = traffic volume 計算而得。 大量交易是指在短時間內向 Cloud Healthcare API 發出的一或多個要求,其中包含大量酬載。如果短時間內傳送大量要求,即使酬載大小不大,也可能被視為大量要求

假設用戶端每五分鐘會收集大量交易,並以突發流量的形式將交易傳送至 Cloud Healthcare API。系統會執行下列操作:

  1. 在配額用盡前,流量爆增初期會消耗配額 (視分鐘數結轉而定)。
  2. 任何剩餘的突發流量都會收到 429 RESOURCE_EXHAUSTED 錯誤。如果已設定,所有受影響的要求都會遇到指數輪詢。
  3. 系統會將部分遇到初始指數輪詢的要求重新排定時間,在下一分鐘重試。系統會在同一分鐘內多次嘗試部分要求,然後在下一分鐘重試。
  4. 如果要求量夠高,重試要求可能會再次遇到 429 RESOURCE_EXHAUSTED 錯誤和指數輪詢。某些流量爆量情況可能會在不同時間遇到指數輪詢,而日後嘗試再次傳送流量時,可能會在同一分鐘內發生。
  5. 如果要求量仍高,系統會在下一波流量開始時重試部分流量。由於現有的待處理要求會增加更多流量,因此問題會更加嚴重。您的應用程式可能難以維護待處理要求,並持續將要求傳送至 Cloud Healthcare API。

這個情境顯示瞭解每分鐘流量的重要性。實作流量和輪詢策略,避免網路壅塞,並確保應用程式不會發生太多需要重試的錯誤。

查看 DICOM 和 FHIR 配額

如要查看與 FHIR 和 DICOM 存放區及作業相關的 Cloud Healthcare API 配額,請參閱「配額限制」。