Model Armor は、LLM アプリケーションのプロンプトとレスポンスをスクリーニングします。モニタリング ダッシュボードには、このスクリーニング プロセスから生成されたデータ、指標、可視化が表示されます。これらの分析情報を使用して、Model Armor が AI アプリケーションを保護し、プロンプト挿入の試みやその他の悪意のあるアクティビティを特定する方法を理解します。
始める前に
必要な権限
モニタリング ダッシュボードにアクセスするために必要な権限を取得するには、プロジェクトに対する IAM ロールを付与するよう管理者に依頼してください。ロールの付与については、プロジェクト、フォルダ、組織へのアクセス権の管理をご覧ください。
この事前定義ロールには、モニタリング ダッシュボードにアクセスするために必要な権限が含まれています。必要とされる正確な権限については、「必要な権限」セクションを開いてご確認ください。
必要な権限
モニタリング ダッシュボードにアクセスするには、次の権限が必要です。
-
monitoring.monitoredResourceDescriptors.list
-
monitoring.metricDescriptors.list
カスタムロールや他の事前定義ロールを使用して、これらの権限を取得することもできます。
モニタリング ダッシュボードにアクセスする
Google Cloud コンソールで、[Model Armor] ページに移動します。
Model Armor を有効にしたプロジェクトが表示されていることを確認します。
[Monitoring] タブに移動します。
このページでは、次のことができます。
- 選択した日時におけるインタラクションを表示します。
- 関連付けられたテンプレートまたはフロア設定、場所、統合ポイント、入力タイプに基づいてインタラクションをフィルタします。
- データを PNG ファイルまたは CSV ファイルにダウンロードします。
- 違反の推移をトレンド グラフで追跡します。
- プロジェクト全体で使用されているテンプレートを表示します。
関連するログを調べて、選択した日時のログを確認します。これを行うには、> [関連するログを検査] をクリックします。
[その他のグラフ オプション]関連するログを検査するには、テンプレートとフロア設定でロギングを有効にする必要があります。また、ログを表示する IAM 権限も必要です。
主な指標
モニタリング ダッシュボードの主な指標は次のとおりです。
- スキャンされたインタラクションの合計数: Model Armor によって分析されたプロンプトとレスポンスの合計量。
- フラグ付きのインタラクション: Model Armor テンプレートまたはフロア設定で構成されたポリシーを 1 つ以上違反したインタラクションの数。
- ブロックされたインタラクション: ブロックされたインタラクションの数(検査とブロックモードで Model Armor を構成した場合)。
- カテゴリ別の違反:
- すべての検出器: すべての検出器で違反が検出されたコンテンツ。
- 機密データの違反: 個人を特定できる情報(PII)、財務データ、またはユーザーが定義したカスタム データ型の存在。
- 責任ある AI: ヘイトスピーチ、危険なコンテンツ、ハラスメント、性的描写が露骨なコンテンツなど、安全性フィルタに違反するコンテンツ。
次のステップ
- Model Armor について確認する。
- Model Armor テンプレートについて確認する。
- Model Armor のフロア設定について確認する。
- Model Armor エンドポイントについて確認する。
- プロンプトとレスポンスをサニタイズする。
- Model Armor の監査ロギングについて確認する。
- Model Armor のロギングを構成する
- Model Armor に関する問題のトラブルシューティングを行う。