ML.FEATURE_IMPORTANCE 関数

ML.FEATURE_IMPORTANCE 関数

ML.FEATURE_IMPORTANCE 関数を使用すると、特徴の重要度スコアを確認できます。このスコアは、トレーニングでブーストツリー モデルを構築する際の各特徴の有効性や重要度を表します。詳しくは、XGBoost ライブラリの特徴量の重要度をご覧ください。

ML.FEATURE_IMPORTANCE は、次の列を返します。

  • feature: トレーニングの入力データの特徴列の名前。
  • importance_weight: 特徴を使用してデータをツリーに分割した回数。
  • importance_gain: 特徴が使用されているすべてのスプリットの平均ゲイン。
  • importance_cover: 特徴が使用されているすべてのスプリットの平均カバレッジ。

model を作成する CREATE MODEL ステートメントに TRANSFORM 句がある場合、ML.FEATURE_IMPORTANCEquery_statement から事前変換列の情報を出力します。

ML.FEATURE_IMPORTANCE の権限

ML.FEATURE_IMPORTANCE を実行するには、bigquery.models.createbigquery.models.getData の両方が必要です。

ML.FEATURE_IMPORTANCE の構文

ML.FEATURE_IMPORTANCE(MODEL `project_id.dataset.model`)

ここで

  • project_id はプロジェクト ID です。
  • dataset は、モデルを含む BigQuery データセットです。
  • model はモデルの名前です。

ML.FEATURE_IMPORTANCE の例

次の例では、mydatasetmymodel から特徴の重要度を取得します。このデータセットはデフォルト プロジェクトにあります。

SELECT
  *
FROM
  ML.FEATURE_IMPORTANCE(MODEL `mydataset.mymodel`)

ML.FEATURE_IMPORTANCE の制限

ML.FEATURE_IMPORTANCE 関数には、次の制限があります。