教師あり学習と教師なし学習は、AI と ML の 2 つの主要なアプローチです。教師あり学習と教師なし学習を区別する最も簡単な方法は、モデルのトレーニング方法とアルゴリズムで使用するトレーニング データの種類です。
ただし、教師あり学習と教師なし学習には他にも違いがいくつかあります。どちらの学習も、組織が具体的な目標やビジネスの目標を達成するのに適した信頼できる手法です。
ここでは、教師あり ML と教師なし ML の主な違いについて説明し、どのアプローチがニーズに最も適しているかを理解できるようにします。
新規のお客様には、Vertex AI やその他の Google Cloud プロダクトをお試しいただける無料クレジット最大 $300 分を差し上げます。
教師あり機械学習と教師なし機械学習の最大の違いは、使用されるデータの種類です。教師あり学習ではラベル付きのトレーニング データが使用されますが、教師なし学習では使用されません。
簡単に言うと、教師あり学習モデルは、正しい出力値が何であるかの基本を理解しています。
教師あり学習では、アルゴリズムがサンプル データセットを使用して自動的に予測を行うようトレーニングを行い、繰り返し調整して誤差を最小化します。これらのデータセットにはコンテキストのラベルが付けられており、モデルが「正しい」答えを出せるように望ましい出力値を提供します。
一方、教師なし学習アルゴリズムは独立して機能し、具体的なガイダンスや指示がなくてもデータの固有の構造を学習します。ラベルのない入力データを提供し、アルゴリズムにデータセット内で自然に発生するパターンを識別させるだけです。
データの種類はこの 2 つのアプローチを区別する最も簡単な方法ですが、それぞれに異なる目標や用途があり、それによっても互いに区別されます。
教師あり学習モデルでは、入力データと出力データの関係を学習することに重点が置かれます。たとえば、教師ありモデルを使用して、天候、空港の交通量、ピーク時のフライト時間などの特定のパラメータに基づいてフライト時間を予測できます。
一方、教師なし学習は、ラベルのない元のデータから新しいパターンや関係を発見する場合に有用です。たとえば、教師なし学習モデルは、関連商品を一緒に購入する購入者グループを識別し、同様のお客様におすすめする他のアイテムを提案するために使用できます。
その結果、さまざまな種類の問題を解決するために、教師あり ML と教師なし ML が導入されます。教師あり ML は、天気予報、価格変更、感情分析、スパム検出などの分類タスクと回帰タスクに適しています。一方、教師なし学習は、異常検出、ビッグデータの可視化、顧客セグメンテーションなどの探索的データ分析やクラスタリング タスクによく使用されます。
教師あり学習と教師なし学習の違いを理解したところで、今度はどちらのアプローチが適しているのかについて学びます。
適切なアプローチの選択は、全体的な目標と要件、解決したいユースケース、データの分析、処理、管理に対するチームの全体的なアプローチによって変わります。
一般的に、組織にとって最適なオプションを決定する際は、次の点を考慮する必要があります。
教師あり学習と教師なし学習のどちらを選ぶかは、解決したい具体的な問題、利用できるデータ、モデルを構築して管理するためのツールと経験があるかどうかによって決まります。
これらのオプションが適しているかどうかわからない場合は、3 つ目のアプローチである半教師あり学習もご検討いただけます。
半教師あり学習は、教師あり学習と教師なし学習の両方の側面を組み合わせたものです。このカテゴリに分類される ML 手法では、ラベル付きデータとラベルなしデータの両方を使用して予測モデルのトレーニングを行います。
半教師あり学習では、少量のラベル付きデータを使用して初期モデルをトレーニングします。この初期モデルは、多量のラベルなしデータに対するラベルの予測に使用できます。このモデルは、最初からラベル付けされているデータと予測ラベル(疑似ラベル)を持つデータの両方に繰り返し適用されます。その後、最も正確な予測をラベル付きデータセットに追加し、モデルのパフォーマンスを継続的に改善していくためにこのプロセスを繰り返します。