予測分析とは
予測分析は、「次に何が起こるか」という疑問を解決しようとする高度な形式のデータ分析です。ビジネス向けのデータ サイエンスの一分野として、予測分析と拡張分析の成長は、ビッグデータ システムの成長と一致しています。ビッグデータ システムでは、より大規模で幅広いデータ プールにより、データ マイニング アクティビティが増加し、予測的な洞察が得られます。また、ビッグデータ機械学習の進歩により、予測分析機能を拡張できるようになりました。
予測分析と拡張分析の成長は、ビッグ データ システムの成長と一致しています。ビッグ データ システムでは、より広範なデータ プールによってデータ マイニング アクティビティが増加し、予測的な洞察が得られます。また、ビッグデータ機械学習の進歩により、予測分析機能を拡張できるようになりました。
Google Cloud のデータ分析、機械学習、人工知能ソリューションによって予測分析を行うことで、業務をよりスムーズに、より速く実施する方法をご覧ください。
予測分析の定義
予測分析とは、データを使用して将来の結果を予測するプロセスです。このプロセスでは、データ分析、機械学習、人工知能、統計モデルを使用して、将来の行動を予測するパターンを見つけます。組織は、過去のデータと現在のデータを使用して、数秒後、数日後、数年後のトレンドや行動を高い精度で予測できます。
予測分析の仕組み
データ サイエンティストは、予測モデルを使用して、選択したデータセット内の各要素間の相関を特定します。データ収集が完了すると、統計モデルが数式化された後、トレーニングされ、修正されて正確な予測が生成されます。
予測分析フレームワークを構築するためのワークフローは、次の 5 つの基本的なステップに従います。
- 問題を定義する: 予測は適切な理論と一連の要件から始まります。たとえば、予測分析モデルで不正行為を検出できますか?年末商戦に向けて最適な在庫レベルを判断するには?悪天候による洪水レベルの可能性を特定していますか?解決すべき明確な問題は、どの予測分析手法を使用するかを決定するのに役立ちます。
- データの取得と整理: 組織が数十年分のデータを活用したり、顧客とのやり取りによって継続的にデータが殺到したりすることがあります。予測分析モデルを開発する前に、データフローを特定する必要があります。その後、データセットを BigQuery のようなデータ ウェアハウスなどのリポジトリに整理できます。
- データの前処理: 元データは、名目上単独で有用です。予測分析モデル用のデータを準備するには、入力エラーや測定エラーが原因の可能性がある異常、欠落しているデータポイント、極端な外れ値を取り除くためにデータをクリーニングする必要があります。
- 予測モデルを開発する: データ サイエンティストは、解決すべき問題とデータセットの性質に応じて、さまざまなツールと手法を用いて予測モデルを開発しています。機械学習、回帰モデル、ディシジョン ツリーは、最も一般的な種類の予測モデルです。
- 結果の検証とデプロイ: モデルの精度を確認し、それに応じて調整します。信頼できる結果が得られたら、それをアプリ、ウェブサイト、データ ダッシュボードを介して関係者が利用できるようにします。
予測分析手法とは
通常、予測分析モデルには、分類モデルと回帰モデルの 2 つのタイプがあります。分類モデルは、データ オブジェクト(顧客や結果の可能性など)を、あるカテゴリまたは別のカテゴリに分類しようとします。たとえば、小売業者がさまざまなタイプの顧客について大量のデータを持っている場合、どのような種類の顧客が市場のメールを受け取るかを予測する場合があります。回帰モデルは、顧客が企業との関係から得られる収益額などの継続的なデータを予測しようとします。
予測分析は、主に次の 3 種類の手法で実施される傾向があります。
回帰分析
回帰は、変数間の関係を推定する統計分析の手法です。回帰は、大規模なデータセットのパターンを決定して、入力間の相関関係を判断するのに役立ちます。これは、既知の分布に従う連続データに最適です。 回帰は多くの場合、価格の上昇が商品の販売にどのように影響するかなど、1 つ以上の独立した変数が別の変数に及ぼす影響を判断するために使用されます。
ディシジョン ツリー
ディシジョン ツリーは個別の変数に基づいてデータをさまざまなカテゴリに分類する分類モデルです。この方法は、個人の判断を理解する場合に最適です。モデルはツリーのように見えます。各ブランチは潜在的な選択肢を表し、ブランチのリーフは意思決定の結果を表します。 ディシジョン ツリーは一般に、データセットに欠けている変数がいくつかあると理解しやすく、うまく機能します。
ニューラル ネットワーク
ニューラル ネットワークは、非常に複雑な関係をモデル化する際に予測分析に役立つ機械学習方法です。基本的には、高性能なパターン認識エンジンです。ニューラル ネットワークは、特にデータを分析するための既知の数式が存在しない場合に、データセット内の非線形関係を判断するのに最適です。ニューラル ネットワークを使用して、ディシジョン ツリーと回帰モデルの結果を検証できます。
予測分析の使用と例
不正行為の検出
予測分析では、会社のネットワーク上でのすべてのアクションをリアルタイムで検査し、不正行為やその他の脆弱性を示す異常を特定します。
コンバージョンと購入の予測
企業は、コンバージョンや購入意向の可能性が高いと予測されるデータを使用して、訪問者に対するオンライン広告のリターゲティングなどの行動を起こすことができます。
リスクの軽減
クレジット スコア、保険請求、債権回収では、すべて予測分析を使用して将来のデフォルトの可能性を評価し、決定します。
オペレーションの改善
企業は、予測分析モデルを使用して在庫を予測し、リソースを管理し、運用をより効率的にします。
顧客セグメント
顧客ベースを特定のグループに分割することで、マーケティング担当者は予測分析を通じて今後を見据えた決断を行うことができ、コンテンツを個々のオーディエンスに合わせて調整できます。
メンテナンス予測
組織は、データを使用して機器の定期メンテナンスが必要なタイミングを予測し、問題や誤動作が発生する前にスケジュール設定できます。