容量と割り当てを管理する

Last reviewed 2023-08-21 UTC

Google Cloud アーキテクチャ フレームワークのこのドキュメントでは、クラウドの容量と割り当てを評価して計画する方法について説明します。

従来のデータセンターでは、通常、四半期ごとに、現在のリソース要件を検討し、将来のリソース要件を予測します。物理関連、ロジスティクス関連、人材関連の問題を検討する必要があります。ラックスペース、冷却、電力、帯域幅、ケーブル配線、調達時間、出荷時間、新しい機器の設置に使用できるエンジニアの数などに関する懸念事項を検討する必要があります。また、容量とワークロードの分散を積極的に管理して、Hadoop パイプラインなど、リソースを大量に使用するジョブにより、高可用の必要があるウェブサーバーなどのサービスが妨げられないようにする必要があります。

一方、Google Cloud を使用すると、ほとんどのキャパシティ プランニングが Google に任せられます。クラウドを使用すると、アイドル状態のリソースを不要時にプロビジョニングして維持する必要がなくなります。たとえば、必要に応じて VM インスタンスを作成、スケールアップ、スケールダウンできます。料金は使用した分だけ請求されるため、トラフィックのピーク時にのみ必要となる過剰な容量など、費用を最適化できます。Compute Engine では、使用率の低い VM インスタンスがあり、そのサイズ変更や削除が可能であることが検出された場合に、節約のために推奨マシンタイプを提示します。

クラウドの容量に関する要件を評価する

容量を効果的に管理するには、組織の容量に関する要件を把握する必要があります。

容量の要件を評価するには、まず上位のクラウド ワークロードを特定します。これらのワークロードの平均使用率とピーク時使用率、現在と将来の容量のニーズを評価します。

これらの上位ワークロードを使用するチームを特定します。それらのチームと協力して、社内の需要計画プロセスを確立します。このプロセスを使用して、現在のクラウド リソースと予想されるクラウド リソースのニーズを把握します。

負荷パターンと呼び出しの分布を分析します。分析では、過去 30 日間のピーク、1 時間あたりのピーク、1 分あたりのピークなどの要素を使用します。

Cloud Monitoring を使用して、アプリケーションとインフラストラクチャのパフォーマンス、稼働時間、全体的な動作状況を可視化することを検討します。

インフラストラクチャの使用率の指標を表示する

キャパシティ プランニングを容易にするために、自組織によるクラウド リソースの使用状況に関する履歴データを収集して保存します。

インフラストラクチャ使用率の指標を可視化します。たとえば、上位のワークロードについては、次の内容を評価します。

  • 平均使用率とピーク時使用率
  • 使用率の急上昇に関するパターン
  • 小売業者にとっての休暇期間など、ビジネス要件に基づく季節的な急増
  • ピーク時のイベントに備え、潜在的なトラフィックの急増にすばやく対応するために必要なオーバー プロビジョニングの量

割り当てと容量の上限に近づいたときに自動的に通知されるように、組織でアラートを設定していることを確認します。

Google のモニタリング ツールを使用して、アプリケーションの使用状況と容量に関する分析情報を取得します。たとえば、Monitoring でカスタム指標を定義できます。これらのカスタム指標を使用して、アラートの傾向を定義します。Monitoring の柔軟なダッシュボードと豊富な可視化ツールにより、問題の兆候を発見できます。

キャパシティ プランニングのプロセスを作成する

キャパシティ プランニングのプロセスを確立し、このプランを文書化します。

このプランを作成するときに、次の操作を行います。

  1. リソースの量が一定であるという前提で、負荷テストを実行し、システムがレイテンシ目標を満たしながら処理できる負荷量を決定します。負荷テストでは、実際のユーザーの本番環境トラフィック プロファイルと一致するリクエスト タイプを組み合わせて使用する必要があります。均一またはランダムな組み合わせのオペレーションは使用しないでください。トラフィック プロファイルに使用率の急増を含めます。
  2. 容量モデルを作成します。容量モデルは、負荷テストによって決定された、サービス負荷の単位増加ごとに必要な増分リソースを計算するための一連の数式です。
  3. 将来のトラフィックを予測し、増加を説明します。Google がトラフィック予測を作成する方法の概要については、将来の負荷の測定をご覧ください。
  4. 容量モデルを予測に適用して、将来のリソースのニーズを求めます。
  5. 組織に必要なリソースの費用を見積もります。次に、財務部門から予算の承認を取得します。幅広いプロダクトにわたってコストとリスクのトレードオフを選択できるため、このステップは重要な業務です。これらのトレードオフは、ビジネスの優先順位に基づいて、特定の製品の予測ニーズよりも低いまたは高い容量を取得することを意味します。
  6. クラウド プロバイダと協力して、割り当てと予約を使用して、適切な量のリソースを適切なタイミングで取得します。インフラストラクチャ チームがキャパシティ プランニングに関わり、運用担当者が信頼区間のある容量計画を作成するようにします。
  7. 四半期か半期ごとに上記の手順を繰り返します。

リソースの使用量を最適化しながら、キャパシティ プランニングを行うプロセスの詳細なガイダンスについては、キャパシティ プランニングをご覧ください。

割り当てが容量の要件と一致することを確認する

Google Cloud では、割り当てを使用して、使用できる特定の共有 Google Cloud リソースの量を制限しています。各割り当ては、特定のサービスへの API 呼び出し、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数など、特定のカウント可能なリソースを表します。たとえば、割り当てにより、少数のユーザーやプロジェクトが特定のリージョンやゾーンの CPU コアを占有しないように制限します。

割り当てを確認する際は、次の点を検討してください。

  • リソースの使用が予期せず制限されないように、プロジェクトの容量要件を事前に計画しておく必要があります。
  • 割り当てと容量は、リージョン全体での障害に対応できるように設定します。
  • 割り当ては、特定リソースの使用量を制限するために使用します。たとえば、1 つのプロジェクトが BigQuery を過剰に使用しないように、BigQuery API の最大の 1 日あたりのクエリ使用量の割り当てを設定できます。
  • 使用量の急増に備えて計画を立て、これらの急増を割り当て計画の一部として含めます。使用量の急増は、1 日を通して予想される変動、予期しないピーク トラフィックになるイベント、既知のピーク トラフィックとリリース イベントなどがあります。ピーク トラフィックとリリース イベントを計画する方法については、オペレーション エクセレンスの次のセクションのピーク トラフィックとリリース イベントを計画するをご覧ください。

現在の割り当てが不十分な場合は、Google Cloud コンソールを使用して割り当てを管理できます。大容量が必要な場合は、Google Cloud のセールスチームにお問い合わせください。ただし、多くのサービスには、割り当てシステムとは無関係の制限も存在します。詳細については、割り当ての操作をご覧ください。

割り当てを定期的に確認してください。必要になる前に割り当てリクエストを送信してください。割り当てリクエストの評価方法とリクエストの承認または拒否方法については、割り当ての操作をご覧ください。

Google Cloud の割り当てを表示して管理するには、いくつかの方法があります。

次のステップ