Google Cloud アーキテクチャフレームワーク: パフォーマンスの最適化

Last reviewed 2021-10-08 UTC

Google Cloud アーキテクチャフレームワークのこのドキュメントでは、Google Cloud のワークロードのパフォーマンスを最適化するためのベストプラクティスについて説明します。

戦略

パフォーマンス要件を評価する。アプリケーションの優先度と、それらのアプリケーションに必要な最小パフォーマンスを決めます。

スケーラブルな設計パターンを使用する。自動スケーリング、コンピューティングの選択、ストレージ構成により、スケーラビリティとパフォーマンスを向上させます。

自動スケーリングとデータ処理を使用する

負荷が増加または減少したときに、自動スケーリングを使用して一致するリソースの追加または解放を行います。

Compute Engine の自動スケーリング

マネージドインスタンスグループ（MIG）を使用すると、複数の同一 VM でステートレスアプリをスケールできます。これにより、インスタンステンプレートに基づいて Compute Engine リソースのグループが起動します。CPU 使用率、負荷分散能力、Cloud Monitoring の指標、スケジュールに基づいてグループのスケーリングを行う自動スケーリングポリシーを構成できます。ゾーン MIG の場合は、Pub/Sub などのキューベースのワークロードごとに構成できます。

Google Kubernetes Engine の自動スケーリング

Google Kubernetes Engine（GKE）のクラスタオートスケーラー機能を使用すると、ワークロードのさまざまな需要に基づいてクラスタのノードプールを管理できます。クラスタオートスケーラーは、実際のリソース使用率ではなく、ノードプールのノードで実行されている Pod のリソース要求数に基づいて、ノードプールのサイズを自動的に調整します。

サーバーレス自動スケーリング

サーバーレスコンピューティングのオプションとしては、Cloud Run、App Engine、Cloud Functions があり、それぞれ自動スケーリング機能を備えています。これらのサーバーレスオプションを使用して、マイクロサービスまたはファンクションをスケーリングします。

データ処理

Dataproc と Dataflow には、データパイプラインとデータ処理をスケーリングする自動スケーリングオプションが用意されています。これらのオプションを使用すると、処理負荷に応じて、パイプラインでより多くのコンピューティングリソースにアクセスできるようになります。

設計に関する質問

変動するユーザー負荷や処理要件があるアプリケーションはどれか。
変動するデータ要件があるデータ処理パイプラインはどれか。

推奨事項

Google Cloud ロードバランサを使用して、グローバルエンドポイントを提供します。
Compute Engine でマネージドインスタンスグループを使用して自動的にスケーリングします。
GKE のクラスタオートスケーラーを使用して、クラスタを自動的にスケーリングします。
App Engine を使用して、PaaS（Platform-as-a-Service）アプリケーションを自動スケーリングします。
Cloud Run または Cloud Functions を使用して、ファンクションまたはマイクロサービスを自動スケーリングします。

主なサービス

GPU と TPU を使用してパフォーマンスを向上させる

Google Cloud には、ワークロードのパフォーマンスを高速化するオプションが用意されています。これらの専用ハードウェアプラットフォームを使用して、アプリケーションとデータ処理のパフォーマンスを向上させることができます。

GPU（グラフィックプロセッシングユニット）

Compute Engine は、仮想マシンインスタンスに追加できる GPU を備えています。これらの GPU を使用して、機械学習やデータ処理などの特定のワークロードをインスタンス上で高速化できます。

TPU（Tensor Processing Unit）

TPU は、機械学習ワークロード用の Google のマトリックスプロセッサとして設計されています。TPU は、大規模なパイプラインを使用した大規模な行列演算に最適で、メモリアクセスが大幅に減少します。

調整するアプリを特定する

アプリケーションパフォーマンス管理（APM）には、レイテンシとコストの低減に役立つツールが用意されており、アプリケーションをより効率的に実行できます。Cloud Trace、Cloud Debugger、Cloud Profiler を使用すると、コードとサービスの機能を分析し、必要に応じてトラブルシューティングを行うことができます。

インストルメンテーション

レイテンシは、ユーザーエクスペリエンスを左右する重要な要素です。アプリケーションのバックエンドが複雑な場合や、マイクロサービスアーキテクチャの採用を始めている場合、サービス間の通信の遅延やボトルネックの特定が難しくなります。Cloud Traceと OpenTelemetry ツールを使用すると、デプロイからレイテンシデータを収集して迅速に分析できます。

デバッグ

Cloud Debugger は本番環境のコードの動作をリアルタイムで検査し、分析できます。パフォーマンスへの影響や速度低下が生じることはありません。

プロファイリング

パフォーマンスの悪いコードはレイテンシを増大させ、アプリケーションやウェブサービスのコストにも影響を及ぼします。Cloud Profiler を使用すると、アプリケーション全体で実行され、CPU やメモリを大量に消費する関数のパフォーマンスを継続的に分析できます。

推奨事項

Cloud Trace を使用して、アプリケーションをインストルメントします。
Cloud Debugger を使用して、本番環境のリアルタイムのデバッグ機能を提供します。
Cloud Profiler を使用して、アプリケーションの動作パフォーマンスを分析します。

次のステップ

Google Cloud アーキテクチャフレームワークの他のカテゴリを確認する。

Google Cloud アーキテクチャフレームワーク: パフォーマンスの最適化

戦略

おすすめの方法

自動スケーリングとデータ処理を使用する

Compute Engine の自動スケーリング

Google Kubernetes Engine の自動スケーリング

サーバーレス自動スケーリング

データ処理

設計に関する質問

推奨事項

主なサービス

関連情報

GPU と TPU を使用してパフォーマンスを向上させる

GPU（グラフィックプロセッシングユニット）

TPU（Tensor Processing Unit）

関連情報

調整するアプリを特定する

インストルメンテーション

デバッグ

プロファイリング

推奨事項

次のステップ

Google Cloud アーキテクチャ フレームワーク: パフォーマンスの最適化

戦略

おすすめの方法

自動スケーリングとデータ処理を使用する

Compute Engine の自動スケーリング

Google Kubernetes Engine の自動スケーリング

サーバーレス自動スケーリング

データ処理

設計に関する質問

推奨事項

主なサービス

関連情報

GPU と TPU を使用してパフォーマンスを向上させる

GPU（グラフィック プロセッシング ユニット）

TPU（Tensor Processing Unit）

関連情報

調整するアプリを特定する

インストルメンテーション

デバッグ

プロファイリング

推奨事項

次のステップ

Google Cloud アーキテクチャフレームワーク: パフォーマンスの最適化

GPU（グラフィックプロセッシングユニット）