責任ある AI

Vertex AI Agent Builder を使用すると、デベロッパーは Google の基盤モデル、検索技術、会話型 AI テクノロジーの力を活用して、Vertex AI エージェントと Vertex AI Search を通じてエンタープライズ グレードの生成 AI アプリケーションを作成できます。AI は初期段階の技術であるため、その進化する機能の適用方法や利用方法を誤ると、意図しない結果や予期せぬ結果を招く可能性があります。たとえば、Vertex AI Agent Builder では、不適切なテキスト、配慮に欠けるテキスト、事実と異なるテキストなど、予期しない出力が生成される可能性があります。

こうしたリスクと複雑さを考慮して、Vertex AI Agent Builder は Google の AI に関する原則を念頭に置いて設計されています。ただし、安全かつ責任を持ってデプロイするには、デベロッパーがモデルを理解してテストすることが重要です。デベロッパーを支援するため、Vertex AI Agent Builder には、お客様がユースケース内で有害な可能性がある出力をブロックできるように、安全フィルタが組み込まれています。詳細については、Vertex AI Search の安全性設定をご覧ください。

Vertex AI Agent Builder をお客様固有のユースケースやコンテキストに統合する場合は、責任ある AI に関する追加の考慮事項とモデルの制限を考慮することが必要になる場合があります。お客様には、公平性、解釈可能性、プライバシー、セキュリティの推奨プラクティスを取り入れることをおすすめします。

Vertex AI Search には、露骨な表現を含むウェブサイトの検索結果を除外するセーフサーチ フィルタがあります。露骨な表現を含むコンテンツには、ポルノ、暴力、流血などが含まれます。非公開コンテンツにはセーフサーチ フィルタリングは適用されません。

要約(ウェブサイト検索と非公開コンテンツの両方)では、中傷、性的描写が露骨な情報、有害な情報、暴力的な情報などのレスポンスが除外されます。また、要約レスポンスには、安全性属性が含まれます。これには、「有害なカテゴリ」や機密情報とみなされるトピックが含まれます。

ウェブサイト検索

セーフサーチは、Vertex AI Search によってインデックスに登録された公開コンテンツ(ウェブサイトなど)に適用できます。セーフサーチをオンにすると、Vertex AI Search は、画像、動画、ウェブサイトのすべてのクエリについて、お客様の Vertex AI Search の検索結果から露骨な表現を含むコンテンツを除外します。これらのフィルタは 100% の精度ではありませんが、YouTube はフィルタリング機能を継続的に評価し、更新しています。

特定のコンテキストやユースケースでは、Vertex AI Search から包括的な分析情報と結果を収集するために、露骨なコンテンツが含まれている場合でも、幅広い情報にアクセスすることが必要になる場合があります。safe_search を「true」または「false」に設定することで、API を使用してセーフティ フィルタを有効または無効にできます。

Vertex AI Search でセーフサーチを有効にするには、次の API 呼び出しを使用します。

curl -X POST\
 -H "Authorization: Bearer $(gcloud auth application-default print-access-token)"
 -H "Content-Type: application/json"\
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/servingConfigs/default_config:search"
     -d '{
      "query": { "input": "FREE_TEXT"},
  "serving_config": "SERVING_CONFIG_ID",
  "safe_search": "true",
}'

Vertex AI Search でフォローアップ付き検索の SafeSearch を有効にするには、次の API 呼び出しを使用します。

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/conversations/CONVERSATION_ID:converse" \
-d '{
  "query": { "input": "FREE_TEXT"},
  "serving_config": "SERVING_CONFIG_ID",
  "safe_search": "true",
}'

safe_search 設定は、検索結果と、要約(検索結果に基づく)などの Vertex AI Search の出力に適用されます。

要約などの Vertex AI Search の出力は、安全性属性のリストと照らし合わせて評価されます。このリストは、safe_search がオフの場合でも、有害な可能性のあるコンテンツをフィルタします。

非公開コンテンツとウェブサイト検索の要約

要約などの Vertex AI Search の出力は、安全性属性のリストと照らし合わせて評価されます。これにより、ウェブサイト検索の safe_search がオフの場合でも、中傷、性的露骨、有害、暴力的な情報など、有害な可能性のあるコンテンツがフィルタされます。また、Vertex AI Search API レスポンスで safetyAttributes を使用すると、「有害なカテゴリ」や機密情報とみなされるトピックを含む回答を除外できます。

フォールバック レスポンス

要約モデルがリクエストに対して空の文字列または汎用レスポンスを返す場合、入力または出力のいずれかによって安全フィルタがトリガーされています。Vertex AI Search API レスポンスで、ポリシー違反の可能性が検出された場合は、SummarySkippedReasonBLOCKED_DUE_TO_POTENTIAL_POLICY_VIOLATION に設定されます。

安全フィルタが不適切にトリガーされていると思われる場合は、Google Cloud コンソールからこの問題を報告してください。

Vertex AI エージェントの安全性設定

Chat では、ユーザーのクエリとエージェントの回答の両方でさまざまな安全フィルタリング メカニズムを使用しています。フィルタリングには、中傷、露骨な性的表現、有害、暴力的な情報などのカテゴリが含まれます。これにより、安全でないクエリに対してチャットが適切に返信し、返信が一般的に安全であることを確認できます。また、望ましくないコンテンツに追加のフィルタを指定し、そのフィルタが適用されたときに Dialogflow コンソールでフォールバック レスポンスを定義することもできます。安全フィルタが不適切にトリガーされていると思われる場合は、Google Cloud コンソールからこの問題を報告してください。

責任ある AI のベスト プラクティス

Vertex AI エージェントを利用する場合は、次の責任ある AI のベスト プラクティスをおすすめしました。

  • エンドユーザーに、bot とやり取りしていることを通知します

  • 必要に応じて、回答が録音されるかどうか、録音される場合はいつ録音されるかをお客様に伝えます。

  • 有害な回答に報告する方法を提供

制限事項

Vertex AI エージェントは、中傷、露骨な性的表現、有害、暴力的な情報などのカテゴリに対する安全フィルタなど、さまざまな方法で責任を組み込んでいます。ただし、前述のように、これらの安全フィルタは 100% 正確ではありません。Google はフィルタリング機能の評価と更新を継続的に進めています。お客様には、モデルに関するフィードバックの提供、社会的な利益につながるユースケースの検討、安全性上重要なコンテキストでの Vertex AI エージェントの使用の回避をおすすめします。

Vertex AI エージェントは、分野の専門家に情報を提供できる複数のツールの 1 つであり、人間による監督なしで意思決定のコンテキストで使用されることを目的としたものではありません。安全フィルタが有効になっていない非構造化の機密データを組み込む場合は、使用前にモデル評価と人間による検証を重視することをおすすめします。

参考情報