Vertex Explainable AI の概要

多くの場合、機械学習モデルは「ブラック ボックス」といわれます。その設計者でさえ、モデルが特定の予測を行った方法やその理由を説明することができません。Vertex Explainable AI では、特徴ベースの説明と例ベースの説明が用意されており、モデルの意思決定について深く理解できます。

モデルの動作とトレーニング データセットがモデルに及ぼす影響を理解することで、ML の新機能を構築または使用するユーザーは、モデルを改善し、予測の信頼性を高め、問題が発生するタイミングと理由を把握できます。

例ベースの説明

例ベースの説明では、Vertex AI は最近傍探索を使用して、入力に最も類似した例(通常はトレーニング セットから)のリストを返します。通常は同様の入力によって同様の予測が得られると予想されるため、この説明を使用してモデルの動作を調査、説明できます。

例に基づく説明は、次のような複数のシナリオで役立ちます。

  • データまたはモデルを改善する: 例に基づく説明の主要なユースケースの 1 つは、モデルが予測で特定の間違いを犯した理由を把握できるようにし、それらの分析情報を使用してデータやモデルを改善することです。まず、関心のあるテストデータを選択します。これは、ビジネスニーズ、またはモデルに最も重大な誤りがあるデータなどのヒューリスティックスによって引き起こされる可能性があります。

    たとえば、画像を鳥または飛行機のいずれかとして分類するモデルがあり、そのモデルが高い信頼度で次の鳥を飛行機として誤って分類しているとします。例に基づく説明を使用して、トレーニング セットから類似画像を取得し、何が起きているかを把握できます。

    説明はすべて飛行機のクラスの暗いシルエットであるため、これは鳥のシルエットを増やすというシグナルです。

    しかし、説明が主に鳥のクラスからのものである場合、データが豊富な場合でもモデルは関係を学習できないというシグナルであるため、モデルの複雑度を上げることを検討する必要があります(例: レイヤの追加)。

  • 新しいデータの解釈: モデルは鳥と飛行機を分類するようトレーニングされたものの、現実にはモデルは凧、ドローン、ヘリコプターの画像にも遭遇します。最近傍データセットに、凧、ドローン、ヘリコプターのラベル付き画像が含まれている場合、例ベースの説明を使用して、最近傍に最も頻繁に出現するラベルを適用して新しい画像を分類できます。これが可能なのは、凧の潜在表現が、鳥や飛行機の潜在表現とは異なり、最近傍データセット内のラベル付き凧により類似していると予想されるためです。

  • 異常を検出: 直感的には、インスタンスがトレーニング セット内のすべてのデータからかけ離れている場合、外れ値である可能性があります。ニューラル ネットワークでは、誤りに対して過信があることがわかっているため、エラーが隠されます。例に基づく説明を使用してモデルをモニタリングすると、最も大きな外れ値を特定できます。

  • 能動的学習: 例に基づく説明により、ヒューマン ラベリングが役立つ可能性のあるインスタンスを特定できます。これは、ラベル付けが遅い場合やコストがかかる場合に特に有用で、制限付きのラベル付けリソースから可能な限り多くのデータセットを取得できます。

    たとえば、医療患者を風邪またはインフルエンザのいずれかに分類するモデルがあるとします。患者がインフルエンザにかかっていると分類され、すべての例に基づく説明がインフルエンザのクラスからのものである場合、医師は詳しく見なくても、モデルの予測に信頼を置くことができます。ただし、一部の説明がインフルエンザのクラスから来ており、その他の説明が風邪のクラスからのものである場合は、医師の意見を取り入れる価値があります。これは、難しいインスタンスにより多くのラベルが付けられているデータセットにつながります。これにより、ダウンストリーム モデルが複雑な関係を簡単に学習できるようになります。

例に基づく説明をサポートするモデルを作成するには、例に基づく説明の構成をご覧ください。

サポートされているモデルタイプ

入力用の埋め込み(潜在表現)を提供できるすべての TensorFlow モデルがサポートされています。ディシジョン ツリーなどのツリーベース モデルはサポートされていません。PyTorch や XGBoost などの他のフレームワークのモデルは、まだサポートされていません。

ディープ ニューラル ネットワークの場合、上位レイヤ(出力レイヤに近い)は「意味のある」ことを学習済みであると通常は想定されるため、埋め込みには最後から 2 番目のレイヤが選択されることがよくあります。いくつかの異なるレイヤを試して、得られる例を調査し、定量的(クラス一致)または定性的(妥当な形)の測定値に基づいていずれかを選択できます。

TensorFlow モデルから埋め込みを抽出して最近傍探索を実行する方法のデモについては、例に基づく説明のノートブックをご覧ください。

特徴ベースの説明

Vertex Explainable AI は特徴アトリビューションを Vertex AI に統合します。このセクションでは、Vertex AI で使用可能な特徴アトリビューション方式の概念的な概要を簡単に説明します。

特徴アトリビューションは、モデル内の各特徴が各インスタンスの予測にどの程度影響を及ぼしたかを示します。予測をリクエストすると、モデルに適した予測値を得られます。説明をリクエストすると、予測に加えて、特徴アトリビューションの情報を得られます。

特徴アトリビューションは表形式のデータで機能します。また、画像データ用の可視化機能が組み込まれています。以下の例を考えてみましょう。

  • 気象データと以前の共有データに基づいて、自転車の走行時間が予測されるようにトレーニングされているディープ ニューラル ネットワークがあるとします。このモデルについて予測のみをリクエストすると、自転車の予測走行時間を分単位で返されます。説明をリクエストすると、自転車の予測走行時間に加えて、説明のリクエストに基づき、特徴ごとのアトリビューション スコアが返されます。アトリビューション スコアは、指定したベースライン値と比較して、その特徴が予測値の変化にどの程度影響を及ぼしたかを示します。モデルに適した有意義なベースラインを選択します。この場合は、自転車の平均走行時間を選択します。特徴アトリビューション スコアをプロットして、予測結果に最も影響を及ぼした特徴を確認できます。

    予測自転車走行時間の特徴アトリビューションの図

  • 指定された画像にイヌとネコのどちらが含まれているかを予測するようにトレーニングされている画像分類モデルがあるとします。新しい画像セットでこのモデルから予測をリクエストすると、画像ごとに予測(「dog」または「cat」)を受け取ります。説明をリクエストすると、予測されたクラスに加えて、予測結果に最も強く影響を及ぼした画像内の部分を示す画像のオーバーレイが返されます。

    特徴アトリビューション オーバーレイを含むネコの写真
    特徴アトリビューション オーバーレイを含むネコの写真
    特徴アトリビューション オーバーレイを含むイヌの写真
    特徴アトリビューション オーバーレイを含むイヌの写真
  • 画像分類モデルは、画像に含まれる花の種類を予測するようにトレーニングされます。このモデルから新しい画像セットの予測をリクエストすると、各画像(「デイジー」または「タンポポ」)の予測を受け取ります。説明をリクエストすると、予測されたクラスに加えて、予測結果に最も強く影響を及ぼした画像内の部分を示す領域のオーバーレイが返されます。

    特徴アトリビューション オーバーレイを含むデイジーの写真
    特徴アトリビューション オーバーレイを含むデイジーの写真

サポートされているモデルタイプ

特徴アトリビューションは、すべてのタイプのモデル(AutoML とカスタム トレーニングの両方)、フレームワーク(TensorFlow、scikit、XGBoost)、BigQuery ML モデル、モダリティ(画像、テキスト、表形式、動画)でサポートされています。

特徴アトリビューションを使用するには、モデルを Vertex AI Model Registry にアップロードまたは登録するときに、特徴アトリビューション用のモデルを構成します。

また、次のタイプの AutoML モデルでは、特徴アトリビューションが Google Cloud コンソールに統合されています。

  • AutoML 画像モデル(分類モデルのみ)
  • AutoML 表形式モデル(分類モデルと回帰モデルのみ)

統合されている AutoML モデルタイプの場合、トレーニング中に Google Cloud コンソールで特徴アトリビューションを有効にし、モデル全体のモデル特徴量の重要度と、オンライン予測とバッチ予測の両方のローカル特徴量の重要度を表示できます。

統合されていない AutoML モデルタイプの場合、モデル アーティファクトを Vertex AI Model Registry にアップロードするときに、モデル アーティファクトをエクスポートして特徴アトリビューションを構成することで、特徴アトリビューションを引き続き有効にできます。

利点

特定のインスタンスを調べて、トレーニング データセット全体で特徴アトリビューションを集計することで、モデルの仕組みをより詳しく分析できます。次の点を考慮してください。

  • モデルのデバッグ: 特徴アトリビューションは、標準的なモデル評価技法では見落としてしまうことが多いデータ内の問題を検出するのに役立ちます。

    たとえば、胸部 X 線画像のテスト データセットにおいて、画像病理モデルによって得られた結果の信頼性があまり高くない場合があります。特徴アトリビューションにより、モデルの精度の高さが、放射線科医が画像内に記したマークによって左右されることが明らかになりました。この例の詳細については、AI Explanations のホワイトペーパーをご覧ください。

  • モデルの最適化: 重要度の低い特徴を特定して削除し、より効率的なモデルを作成できます。

特徴アトリビューション方式

いずれの特徴アトリビューション方式も、特定の結果に対してゲーム内の各プレーヤーにクレジットを割り当てる協力ゲーム理論アルゴリズムである Shapley 値に基づいています。機械学習モデルに適用されます。つまり、各モデル特徴がゲームの「プレーヤー」として扱われます。Vertex AI Explanations は特定の予測結果を得るために、各特徴に比例クレジットを割り当てます。

Shapley 値サンプリング方式

Shapley 値サンプリング方式では、正確な Shapley 値のサンプリング近似が提供されます。AutoML 表形式モデルでは、Shapley 値サンプリング方式を使用して特徴量の重要度を求めます。Shapley 値サンプリング方式は、ツリーとニューラル ネットワークを使用したメタ アンサンブル学習を行うこのモデルでよく機能します。

Shapley 値サンプリング方式の詳しい仕組みについては、サンプリング ベースの推論エラーの予測方法をご覧ください。

統合勾配方式

統合勾配方式では、予測結果の勾配が、入力値の特徴に対して積分経路に沿って計算されます。

  1. 勾配は、スケーリング パラメータのさまざまな間隔で計算されます各間隔のサイズはガウス求積法で計算されます(画像データでは、このスケーリング パラメータは画像内のすべてのピクセルを黒にスケーリングする「スライダー」であると仮定されます)。
  2. 勾配は次のように統合されます。
    1. 積分は、加重平均を使用して近似されます。
    2. 平均勾配と元の入力値の要素別の積が計算されます。

画像に適用されるこのプロセスのわかりやすい説明については、ブログ投稿「Attributing a deep network's prediction to its input features」をご覧ください。統合勾配に関する元の論文(Axiomatic Attribution for Deep Networks)の著者は、以前のブログ投稿で、プロセスの各ステップで画像がどのように見えるかを示しています。

XRAI 方式

XRAI 方式は、統合勾配方式に追加ステップを組み合わせて、画像のどの領域が特定のクラス予測に最も大きく貢献するかを決定します。

  1. ピクセルレベルのアトリビューション: XRAI は、入力画像に対してピクセルレベルのアトリビューションを実行します。このステップでは、XRAI は統合勾配方式を採用し、黒のベースラインと白のベースラインを使用します。
  2. オーバーセグメント化: XRAI は、ピクセルレベルのアトリビューションから独立して画像をオーバーセグメント化し、小さな領域のパッチワークを作成します。XRAI は Felzenswalb のグラフベースの方式を使用して、画像セグメントを作成します。
  3. リージョンの選択: XRAI は各セグメント内のピクセルレベルのアトリビューションを集計して、アトリビューションの密度を決定します。これらの値を使用して、XRAI は各セグメントをランク付けし、正のアトリビューション値が高い順に並べます。これにより、画像のどの領域が最も顕著か、または特定のクラス予測に最も大きく貢献するかが決まります。

XRAI アルゴリズムのステップを示す画像

特徴アトリビューション方式の比較

Vertex Explainable AI には、サンプリングされた Shapley、統合勾配、XRAI という特徴アトリビューションに使用できる 3 つの方式があります。

メソッド 基本的な説明 推奨モデルタイプ サンプル ユースケース 対応する Vertex AI の Model リソース
サンプリングされた Shapley 各特徴に結果のクレジットを割り当て、特徴のさまざまな置換を検討します。この方式では、正確な Shapley 値のサンプリング近似が提供されます。 微分不可能なモデル(ツリーとニュートラル ネットワークの集合体など)
  • 表データの分類と回帰
  • 任意のカスタム トレーニング モデル(任意の予測コンテナで実行)
  • AutoML 表形式のモデル
統合勾配 Shapley 値と同じ公理プロパティを使用して、特徴アトリビューションを効率的に計算する勾配ベースの方式。 微分可能なモデル(ニューラル ネットワークなど)。特に、特徴スペースが大きいモデルにおすすめします。
X 線などのコントラストの低い画像に適しています。
  • 表形式データの分類と回帰
  • 画像データの分類
XRAI(eXplanation with Ranked Area Integrals) XRAI は統合勾配方式に基づいて画像の重複領域を評価し、ピクセルではなく画像の関連領域をハイライト表示する顕著性マップを作成します。 画像入力を受け取るモデル。複数のオブジェクトを含む実世界の光景など、自然な画像に特に適しています。
  • 画像データの分類

アトリビューション方式の詳細な比較については、AI Explanations のホワイトペーパーをご覧ください。

微分可能モデルと微分不可能モデル

微分可能モデルでは、TensorFlow グラフのすべての演算の導関数を計算できます。このプロパティは、そのようなモデルで誤差逆伝播を行えるようにするのに役立ちます。たとえば、ニューラル ネットワークは微分可能です。微分可能なモデルの特徴アトリビューションを取得するには、統合勾配方式を使用します。

統合勾配方式は、微分不可能方式では機能しません。統合勾配方式で処理するための微分不可能な入力値のエンコードについて学習してください。

微分不可能モデルには、デコードや丸め処理を実行するオペレーションなど、TensorFlow グラフでの微分不可能オペレーションが含まれます。たとえば、ツリーとニューラル ネットワークの集合体として構築されたモデルは微分不可能です。微分不可能なモデルの特徴アトリビューションを取得するには、サンプリングされた Shapley 方式を使用します。サンプリングされた Shapley は微分可能なモデルにも対応していますが、その場合、必要以上に計算コストがかかります。

概念上の制限

特徴アトリビューションには、次の制限があります。

  • AutoML のローカル特徴量の重要度など、特徴アトリビューションは個々の予測に固有のものです。 個々の予測の特徴アトリビューションを調べることで詳細な洞察を得ることができますが、それらの個々のインスタンスのクラス全体やモデル全体にその洞察を当てはめることができない場合があります。

    AutoML モデルについて、より一般的な洞察を入手するには、モデル特徴量の重要度を参照してください。他のモデルの一般的な洞察を得るには、データセットのサブセット、またはデータセット全体でアトリビューションを集約します。

  • 特徴アトリビューションはモデルのデバッグに役立ちますが、ある問題が特定のモデルから発生しているのか、モデルをトレーニングしたデータから発生しているのかを必ずしも明確に示すものではありません。最良の判断を下し、共通のデータ問題を診断することで、原因を特定してください。

  • 複雑なモデルでは、特徴アトリビューションは予測と類似する敵対的攻撃を受けます。

制限の詳細については、制限の概要リストAI Explanations のホワイトペーパーをご覧ください。

リファレンス

特徴アトリビューションの場合、サンプリングされた Shapley、統合勾配、XRAI の実装は、それぞれ以下の参照に基づいています。

Vertex Explainable AI の実装について詳しくは、AI Explanations に関するホワイトペーパーをご覧ください。

Notebooks

Vertex Explainable AI の使用を開始するには、次のノートブックを使用します。

ノートブック 説明可能性のメソッド ML フレームワーク モダリティ タスク
GitHub のリンク 例ベースの説明 TensorFlow イメージ 指定された入力画像のクラスを予測する分類モデルをトレーニングし、オンライン説明を取得する
GitHub のリンク 特徴ベース AutoML tabular 銀行の顧客が定期預金を契約するかどうかを予測するバイナリ分類モデルをトレーニングし、バッチ説明を取得する
GitHub のリンク 特徴ベース AutoML tabular アヤメの種の種類を予測する分類モデルをトレーニングし、オンライン説明を取得する
GitHub のリンク 特徴ベース(サンプリングされた Shapley) scikit-learn tabular タクシー料金を予測する線形回帰モデルをトレーニングし、オンライン説明を取得する
GitHub のリンク 特徴ベース(統合勾配) TensorFlow イメージ 指定された入力画像のクラスを予測する分類モデルをトレーニングし、バッチ説明を取得する
GitHub のリンク 特徴ベース(統合勾配) TensorFlow イメージ 指定された入力画像のクラスを予測する分類モデルをトレーニングし、オンライン説明を取得する
GitHub のリンク 特徴ベース(統合勾配) TensorFlow tabular 住宅価格の中央値を予測する回帰モデルをトレーニングし、バッチ説明を取得する
GitHub のリンク 特徴ベース(統合勾配) TensorFlow tabular 住宅価格の中央値を予測する回帰モデルをトレーニングし、オンライン説明を取得する
GitHub のリンク 特徴ベース(統合勾配) TensorFlow イメージ トレーニング済みの分類モデルである Inception_v3 を使用して、バッチおよびオンラインの説明を取得する
GitHub のリンク 特徴ベース(サンプリングされた Shapley) TensorFlow 指定しています 映画のレビューをレビューの文章を使用してポジティブとネガティブに分類する LSTM モデルをトレーニングし、オンライン説明を取得する

教育リソース

次のリソースから、さらに役立つ教材を得ることができます。

次のステップ