AI は、相互に関連する多くの用語や概念を含む広範な分野であり、あらゆる種類のスマート マシンを指す汎用的な言葉として使われることがよくあります。実際には、AI、ML、ディープ ラーニングは、微妙な違いを持つ別々の用語です。
AI と ML がビジネスにどのように役立つかについて詳しくは、こちらのGoogle Cloud の AI と ML のプロダクトとソリューションをご覧ください。
新規のお客様には、Vertex AI やその他の Google Cloud プロダクトをお試しいただける無料クレジット最大 $300 分を差し上げます。
AI、ディープ ラーニング、ML の関係について詳しくは、以下をお読みください。
ディープ ラーニングは ML の一種で、人工ニューラル ネットワークを使用して情報の処理と分析を行います。ニューラル ネットワークは、ディープ ラーニング アルゴリズム内で階層化された計算ノードで構成されています。各レイヤには、入力レイヤ、出力レイヤ、隠れレイヤが含まれています。ニューラル ネットワークにはトレーニング データが提供され、アルゴリズムが学習して精度を向上させられるようにします。ニューラル ネットワークに入力層と出力層に加えて複数の隠れ層が含まれている場合、そのネットワークはディープ ニューラル ネットワークと見なされ、ディープ ラーニングの基盤となります。
ディープラーニング アルゴリズムは、人間の脳の働きにヒントを得ており、特に大量の非構造化データを分析するのに優れています。ディープ ラーニングは、画像認識や音声認識、オブジェクト検出、自然言語処理など、今日私たちが AI と捉えている多くのタスクで使用されています。ディープ ラーニングは、データセット内の非線形かつ複雑な相関関係を把握できますが、ML よりも多くのトレーニング データとコンピューティング リソースが必要です。
ディープ ラーニングに使用される一般的なニューラル ネットワークには、次のようなものがあります。
MLは AI の一種であり、明示的にプログラムされなくてもシステムが自律的に学習して改善できるようにします。ML アルゴリズムは、新しいデータがシステムに入力されたときにパターンとデータを認識し、予測を行うことで機能します。
ML では、通常、次のようなさまざまなモデルが使用されます。
教師あり学習は、ラベル付けされたトレーニング データ(構造化データ)を使用して特定の入力を出力にマッピングする ML モデルです。教師あり学習では、出力が既知(リンゴの写真の認識など)で、既知の出力のデータに基づいてモデルがトレーニングされます。簡単に言うと、リンゴの画像を認識するようアルゴリズムをトレーニングするには、リンゴのラベルが付いた画像をアルゴリズムに入力します。
現在使用されている最も一般的な教師あり学習アルゴリズムには次のようなものがあります。
教師なし学習は、ラベルなしデータ(非構造化データ)を使用してパターンを学習する ML モデルです。教師あり学習とは異なり、出力は事前にはわかりません。そうではなく、アルゴリズムが人間によるインプットなし(したがって教師なし)のデータから学習し、属性に基づいてデータをグループに分類します。
現在使用されている最も一般的な教師なし学習アルゴリズムには次のようなものがあります。
半教師あり学習と呼ばれる混合アプローチの ML もよく使用され、そこでは一部のデータにのみラベル付けが行われます。半教師あり学習では、既知の結果を得るために、データを整理、構造化する方法をアルゴリズムが見つけ出す必要があります。たとえば、ML モはデルに最終結果がリンゴであると伝えられますが、リンゴとラベル付けされるのはトレーニング データの一部だけです。
強化学習は、一連の試行錯誤テストを通じて「実践しながら学ぶ」と言える ML モデルです。「エージェント」は、パフォーマンスが望ましい範囲内になるまで、フィードバック ループを通じて定義されたタスクの実行を学習します。エージェントは、タスクのパフォーマンスが高い場合はポジティブな強化が行われ、パフォーマンスが低い場合はネガティブな強化が行われます。
AI は、通常であれば人間の知性を必要とするような方法、あるいは人間が分析できない規模のデータを使用する方法で推論、学習、行動を行えるコンピュータとマシンの構築に関する科学分野です。AI は、コンピュータ サイエンス、データと分析、ソフトウェア エンジニアリング、さらには哲学など、多くの領域を含む大きな分野です。
ビジネスレベルでは、AI はデータ分析、予測と予報、自然言語処理、おすすめ、マシンの自動化、インテリジェントなデータ取得など、多くのユースケースがある一連のテクノロジーです。
これらの用語は関連していますが、明確な階層があります。ディープ ラーニングは ML の特殊なタイプであり、ML はより広範な AI の分野内の中核的な領域です。主な違いは、機能、複雑さ、特徴量エンジニアリングです。
機能 | 人工知能 | 機械学習 | ディープ ラーニング |
範囲と定義 | 最も広範なコンセプト。通常は人間の知能を必要とするタスク(例: 推論、問題解決、学習、認識)を実行できるシステムや機械の作成に特化した分野。 | AI のサブセット あらゆるシナリオに対して明示的にプログラミングしなくても、データから学習して意思決定を行えるシステムを開発することに重点を置く。 | ML のサブセット。多層の人工ニューラル ネットワーク(ANN)を使用して、大量の元データから複雑なパターンと階層表現を直接学習します。 |
目標 | 機械で人間の知能をシミュレートまたは再現します。 | 機械がデータから学習して特定のタスクを正確に実行できるようにします。 | ディープ ニューラル ネットワークを使用してデータから特徴を自動的に学習することで、精度を高め、より複雑なパターン(特に非構造化データ)を処理します。 |
方法 | さまざまな手法を使用できます。ロジック、ルールベースのシステム、検索アルゴリズム、最適化、そしておそらく最も重要なものとして、ML とディープ ラーニングがあります。 | アルゴリズム(例: 線形回帰、SVM、ディシジョン ツリー、ランダム フォレスト)を使用してデータを解析し、データから学習して、情報に基づいた意思決定や予測を行う。 | 人間の脳の構造にヒントを得た、多数のパラメータを持つ複雑な多層人工ニューラル ネットワークを使用。 |
データ要件 | 大きく異なります。ルールベースの AI は少量のデータで済む場合がありますが、ML/DL に依存する AI は大量のデータを必要とします。 | アルゴリズムを効果的にトレーニングするには、大量の構造化データまたはラベル付きデータが必要です。一般的に、データが多いほどパフォーマンスが向上します。 | ディープ ネットワークを効果的にトレーニングするには、非常に大規模なデータセット(多くの場合、数百万のデータポイント)が必要です。パフォーマンスはデータ規模に大きく依存する。 |
ハードウェア要件 | 場合によって異なる。 シンプルな AI は基本的なハードウェアで実行できます。 | 多くの場合、標準の CPU で実行できますが、複雑なモデルではコンピューティング能力が高い方がメリットが得られます。 | 通常、大規模な並列計算のため、効率的なトレーニングにはハイ パフォーマンス コンピューティング、特に GPU または TPU が必要です。 |
特徴量エンジニアリング | 使用する方法によって異なります。 | 多くの場合、膨大な手動による特徴量エンジニアリングが必要になります。アルゴリズムが学習できるように、人間が元データから関連する入力特徴量を選択、変換、作成する必要があります。 | 自動特徴抽出を実行します。ネットワークは、そのレイヤを通して関連する特徴量を階層的に学習し、元データから直接抽出するため、手動による特徴量エンジニアリングの必要性が軽減されます。 |
トレーニング時間 | 学習なし AI には該当しません。ML/DL ベースの AI の場合は大きく異なります。 | 数秒から数時間までさまざま。ML が適しているタスクでは、一般的に DL より高速。 | 大規模なデータセットと複雑なネットワーク アーキテクチャのため、多くの場合、トレーニングに非常に長い時間(数時間、数日、数週間)を要します。 |
解釈可能性 | 場合によって異なる。 ルールベース システムは非常に解釈しやすい可能性があります。複雑な ML/DL を使用する AI は、解釈が難しい可能性があります。 | 場合によって異なる。 単純なモデル(例: ディシジョン ツリー、線形回帰)は比較的解釈しやすいです。複雑なモデル(例: アンサンブル法)では、解釈が難しくなる場合があります。 | 透明性が欠けている場合がよくあります。ディープ ラーニング モデルが特定の意思決定を行った理由を理解することは、パラメータの複雑さと量のために困難になる場合があります。 |
主なユースケースと例 | エキスパート システム、チェス プログラム、汎用問題解決プログラム、仮想アシスタントや自動運転車の包括的なコンセプト。 | e コマースやストリーミング サービスのレコメンデーション システム、迷惑メールフィルタ、予測メンテナンス、構造化データからの医療診断、顧客離脱予測。 | 画像認識(写真のタグ付け)、自然言語処理(翻訳、感情分析)、音声認識(音声アシスタント)、自律走行車の認識システム、高度な医療画像分析。 |
機能
人工知能
機械学習
ディープ ラーニング
範囲と定義
最も広範なコンセプト。通常は人間の知能を必要とするタスク(例: 推論、問題解決、学習、認識)を実行できるシステムや機械の作成に特化した分野。
AI のサブセット あらゆるシナリオに対して明示的にプログラミングしなくても、データから学習して意思決定を行えるシステムを開発することに重点を置く。
ML のサブセット。多層の人工ニューラル ネットワーク(ANN)を使用して、大量の元データから複雑なパターンと階層表現を直接学習します。
目標
機械で人間の知能をシミュレートまたは再現します。
機械がデータから学習して特定のタスクを正確に実行できるようにします。
ディープ ニューラル ネットワークを使用してデータから特徴を自動的に学習することで、精度を高め、より複雑なパターン(特に非構造化データ)を処理します。
方法
さまざまな手法を使用できます。ロジック、ルールベースのシステム、検索アルゴリズム、最適化、そしておそらく最も重要なものとして、ML とディープ ラーニングがあります。
アルゴリズム(例: 線形回帰、SVM、ディシジョン ツリー、ランダム フォレスト)を使用してデータを解析し、データから学習して、情報に基づいた意思決定や予測を行う。
人間の脳の構造にヒントを得た、多数のパラメータを持つ複雑な多層人工ニューラル ネットワークを使用。
データ要件
大きく異なります。ルールベースの AI は少量のデータで済む場合がありますが、ML/DL に依存する AI は大量のデータを必要とします。
アルゴリズムを効果的にトレーニングするには、大量の構造化データまたはラベル付きデータが必要です。一般的に、データが多いほどパフォーマンスが向上します。
ディープ ネットワークを効果的にトレーニングするには、非常に大規模なデータセット(多くの場合、数百万のデータポイント)が必要です。パフォーマンスはデータ規模に大きく依存する。
ハードウェア要件
場合によって異なる。 シンプルな AI は基本的なハードウェアで実行できます。
多くの場合、標準の CPU で実行できますが、複雑なモデルではコンピューティング能力が高い方がメリットが得られます。
通常、大規模な並列計算のため、効率的なトレーニングにはハイ パフォーマンス コンピューティング、特に GPU または TPU が必要です。
特徴量エンジニアリング
使用する方法によって異なります。
多くの場合、膨大な手動による特徴量エンジニアリングが必要になります。アルゴリズムが学習できるように、人間が元データから関連する入力特徴量を選択、変換、作成する必要があります。
自動特徴抽出を実行します。ネットワークは、そのレイヤを通して関連する特徴量を階層的に学習し、元データから直接抽出するため、手動による特徴量エンジニアリングの必要性が軽減されます。
トレーニング時間
学習なし AI には該当しません。ML/DL ベースの AI の場合は大きく異なります。
数秒から数時間までさまざま。ML が適しているタスクでは、一般的に DL より高速。
大規模なデータセットと複雑なネットワーク アーキテクチャのため、多くの場合、トレーニングに非常に長い時間(数時間、数日、数週間)を要します。
解釈可能性
場合によって異なる。 ルールベース システムは非常に解釈しやすい可能性があります。複雑な ML/DL を使用する AI は、解釈が難しい可能性があります。
場合によって異なる。 単純なモデル(例: ディシジョン ツリー、線形回帰)は比較的解釈しやすいです。複雑なモデル(例: アンサンブル法)では、解釈が難しくなる場合があります。
透明性が欠けている場合がよくあります。ディープ ラーニング モデルが特定の意思決定を行った理由を理解することは、パラメータの複雑さと量のために困難になる場合があります。
主なユースケースと例
エキスパート システム、チェス プログラム、汎用問題解決プログラム、仮想アシスタントや自動運転車の包括的なコンセプト。
e コマースやストリーミング サービスのレコメンデーション システム、迷惑メールフィルタ、予測メンテナンス、構造化データからの医療診断、顧客離脱予測。
画像認識(写真のタグ付け)、自然言語処理(翻訳、感情分析)、音声認識(音声アシスタント)、自律走行車の認識システム、高度な医療画像分析。