貢献度分析の概要
貢献度分析(主要因分析)を使用すると、多次元データの主な指標の変化について分析情報を生成できます。たとえば、貢献度分析を使用して、2 つの四半期にわたる収益額の変化を確認したり、2 つのトレーニング データセットを比較して ML モデルのパフォーマンスの変化を把握したりできます。BigQuery で貢献度分析モデルを作成するには、CREATE MODEL
ステートメントを使用します。
貢献度分析は拡張分析の一種です。拡張分析とは、人工知能(AI)を使用してデータの分析と理解を強化し、自動化することです。貢献度分析は、拡張分析の主要な目標の 1 つであるデータ内のパターンの検出を支援します。
貢献度分析モデルは、テスト用のデータセットと対照用のデータセットを比較し、時系列全体で指標に統計的有意性のある変化がみとめられるデータのセグメントを検出します。これにより、時間、場所、顧客セグメント、その他の重要な指標の全体でデータの変化を確認できます。たとえば、2023 年末に取得したテーブル スナップショットと 2022 年末に取得したテーブル スナップショットを比較して、2 年間全体のデータの相違を確認できます。
指標は、貢献度分析モデルがテスト用データと対照用データ間での変化を測定して比較するために使用する数値です。貢献度分析モデルでは、合計可能な指標または合計可能な比率指標のいずれかを指定できます。
セグメントは、項目値の特定の組み合わせで識別されるデータのスライスです。たとえば、store_number
、customer_id
、day
の項目に基づく貢献度分析モデルの場合、これらの項目値の一意の組み合わせは、すべてセグメントを表します。次の表では、各行が異なるセグメントを表しています。
store_number |
customer_id |
day |
店舗 1 | ||
店舗 1 | 顧客 1 | |
店舗 1 | 顧客 1 | 月曜日 |
店舗 1 | 顧客 1 | 火曜日 |
店舗 1 | 顧客 2 | |
店舗 2 |
最も大きく、そのために最も関連性の高いセグメントのみをモデル化する場合は、小さなセグメントをモデルで使用しないようにする apriori のサポートしきい値を指定します。これにより、モデルの作成時間も短縮されます。
貢献度分析モデルを作成した後に、ML.GET_INSIGHTS
関数を使用して、モデルで計算された指標の情報を取得できます。