Google がデータセンターの物理論理空間を保護する仕組み

このコンテンツの最終更新日は 2024 年 5 月で、作成時点の状況を表しています。お客様の保護の継続的な改善のために、Google のセキュリティポリシーとシステムは変更される場合があります。

Google の各データセンターは、マシン、ネットワークデバイス、制御システムからなる大規模で多様な環境です。データセンターは産業用の複合施設として設計されており、管理、メンテナンス、運用に幅広い役割とスキルが必要になります。

このような複雑な環境では、お客様のデータのセキュリティが最優先事項です。Google は、マシン自体に 6 層の物理コントロール（動画を参照）と多くの論理コントロールを実装しています。また、特定のコントロールが失敗したり、適用されない脅威シナリオを継続的にモデル化しています。

一部の脅威シナリオでは、インサイダーリスクをモデル化し、攻撃者がすでにデータセンターへの正規のアクセス権を取得していることを前提としています。これらのシナリオにより、物理コントロールと論理コントロールの間で多層防御が必要となる空間が明らかになります。この空間は、ラック内のマシンからマシンのランタイム環境までの一定の距離として定義され、物理論理空間と呼ばれています。

物理論理空間は、スマートフォンの周囲の物理環境に似ています。たとえば、スマートフォンがロックされていても、アクセスする正当な理由のある人物には物理的なアクセスを許可するでしょう。Google では、データを保持するマシンに対して、これと同じ考え方を採用しています。

物理論理空間のコントロールの概要

Google では、物理論理空間内に次の 3 つのコントロールを併用しています。

ハードウェアハードニング: 次のような方法で、各マシンに対する物理的なアクセス経路（攻撃対象領域）を減らしています。
- ポートなどの物理的なアクセスベクトルを最小限に抑える。
- 基本入出力システム（BIOS）、管理コントローラ、周辺機器など、ファームウェアレベルで残りのパスをロックダウンする。
異常イベントの検出: 物理論理空間のコントロールが異常なイベントを検出したときにアラートを生成します。
システムの自己防御: 物理環境の変化を認識し、防御アクションで脅威に対応します。

これらのコントロールにより、物理論理空間でセキュリティイベントが発生するたびに、多層防御のレスポンスが返されます。次の図は、セキュアラックエンクロージャでアクティブになっている 3 つのコントロールをすべて示しています。

セキュアラックエンクロージャでアクティブになっている 3 つのコントロール。

ハードウェアハードニング

ハードウェアハードニングにより、物理的な攻撃対象領域が減少し、残存リスクを最小限に抑えることができます。

従来の企業のデータセンターでは、オープンなフロアにラックの列が設置され、データセンターのフロアに出入りする人物とフロントパネルとの間に物理的な障壁はなにもありません。このようなデータセンターには USB-A、Micro-USB、RJ-45 などの外部ポートを備えたマシンが数多く存在し、攻撃を受けるリスクは高くなります。データセンターのフロアへの立ち入りが許可されたユーザーは、リムーバブルストレージにすばやく簡単にアクセスできます。また、マルウェアを含む USB スティックを、露出したフロントパネルポートに簡単に差し込むことができます。Google データセンターでは、これらのリスクを軽減するため、基本的なセキュリティ対策としてハードウェアのハードニングを実施しています。

ハードウェアのハードニングは、ラックとそのマシンに対する一連の予防策であり、物理的な攻撃対象領域を可能な限り減らすことができます。マシンのハードニングには、次のようなものがあります。

露出しているポートを取り外すか、無効化し、残りのポートをファームウェアレベルでロックします。
忠実度の高い改ざん検出シグナルを使用して、ストレージメディアをモニタリングします。
データ保存時の暗号化を実施します。
ハードウェアが対応している場合は、デバイス証明書を使用して、未承認のデバイスがランタイム環境にデプロイされないようにします。

特定のシナリオでは、マシンに物理的にアクセスできないようにするために、Google は改ざんを防止または抑制するためのセキュアラックエンクロージャを設置しています。セキュアラックエンクロージャでは通行者との間に物理的な障壁が存在します。また、セキュリティ担当者へのアラームや通知をトリガーすることもできます。エンクロージャは、前述のマシンの修正と組み合わせて、物理論理空間に強力な保護レイヤを提供します。

次の図は、完全にオープンなラックから完全なハードウェアハードニングを実施したセキュアラックエンクロージャへの移行を示しています。

次の画像は、ハードウェアハードニングを行っていないラックを示しています。
次の画像は、ハードウェアハードニングを実施したラックを示しています。
次の画像は、完全なハードウェアハードニングを実施したラックの前面と背面を示しています。

異常なイベントの検出

異常なイベントの検出により、セキュリティスタッフはマシンで予期しないイベントの発生をすぐに認識できます。

業界全体では、組織でセキュリティ侵害が発見されるまでに数か月から数年かかることがあり、多くの場合、侵害が見つかるのは重大な損害や損失が発生した後のことになります。数百万台の本番環境マシンから収集した大量のロギングデータやテレメトリーデータから重要なセキュリティ侵害インジケーター（IoC）が失われる可能性があります。Google では、複数のデータストリームを使用しているため、物理論理空間での潜在的なセキュリティイベントをリアルタイムで特定できます。このコントロールは「異常イベントの検出」と呼ばれます。

最新のマシンは、物理的な状態だけでなく、物理論理空間で発生するイベントもモニタリングして記録します。マシンは、常駐する自動化システムソフトウェアを通じて、この情報を受け取ります。このソフトウェアは、ベースボード管理コントローラ（BMC）と呼ばれるマシン内のミニコンピュータで実行することも、オペレーティングシステムデーモンの一部として実行することもできます。このソフトウェアは、ログイン試行などの重要なイベントや、物理デバイスの挿入、エンクロージャセンサーなどのセンサーアラームを報告します。

ハードウェアのルートオブトラストを備えたマシンでは、異常なイベント検出シグナルがさらに強くなります。ハードウェアのルートオブトラストを使用すると、BMC ファームウェアなどのシステムソフトウェアが安全に起動されたことを証明できます。これにより、報告されたイベントの有効性に対する Google の検出システムの信頼度が高くなります。独立したルートオブトラストの詳細については、分離されたマシンのリモート証明をご覧ください。

システムの自己防御

システムの自己防御により、セキュリティ侵害に対する潜在的な対策を即時に実施できます。

一部の脅威シナリオでは、物理論理空間内の攻撃者がハードウェアハードニングで説明した物理的なアクセス対策を破る可能性があることを想定しています。このような攻撃者は、マシン上で処理されているユーザーデータや機密情報を標的としている可能性があります。

このリスクを回避するため、Google ではシステムの自己防御を実装しています。これは、セキュリティ侵害が発生した場合に迅速かつ決定的なレスポンスを行うコントロールです。このコントロールは、物理環境からのテレメトリーを使用して論理環境内で動作します。

ほとんどの大規模な本番環境では、1 つのラックに複数の物理マシンが格納されています。各物理マシンは、仮想マシン（VM）や Kubernetes コンテナなど、複数のワークロードを実行します。各 VM は、専用のメモリとストレージを使用して独自のオペレーティングシステムを実行します。

セキュリティイベントにさらされているワークロードを特定するため、Google は、ハードウェアハードニングコントロールと異常イベントの検出からテレメトリーデータを集計します。次に、データを関連付け、リスクが高く早急な対応が必要な少数のイベントを生成します。たとえば、セキュアラックのドアアラームとマシンシャーシ開口のシグナルの組み合わせは、高リスクのイベントになる可能性があります。

Google では、これらのイベントを検出するとすぐに次の処理を行います。

影響を受けているワークロードで機密性の高いサービスを直ちに終了し、機密データを消去できます。
ネットワークファブリックによって、影響を受けたラックを隔離できます。
影響を受けるワークロードは、状況に応じて他のマシンやデータセンターで再スケジュールできます。

システムの自己防御コントロールにより、攻撃者がマシンへの物理的アクセスに成功しても、データを抽出することはできず、環境内での横展開もできません。

次のステップ

物理コントロールの詳細については、データセンターのセキュリティをご覧ください。
論理コントロールの詳細については、Google インフラストラクチャのセキュリティ設計の概要をご覧ください。
Google のセキュリティ文化については、安全で信頼できるシステムの構築（O'Reilly 書籍）をご覧ください。