機械学習(ML)とは

現代の企業にはデータが溢れており、データを理解することで、企業はより適切な意思決定を行うことができます。しかし、膨大なデータに複雑さが組み合わさると、従来のツールでの分析が難しくなります。データのパターンや分析情報を特定するための分析モデルの構築、テスト、反復、デプロイは、スケーリングが複雑になることで従業員の多くの時間を奪います。ML により、組織はデータのスケーリングに合わせて分析情報を迅速に引き出すことができます。

新規のお客様には、Vertex AI やその他の Google Cloud プロダクトをお試しいただける無料クレジット最大 $300 分を差し上げます。

Google Cloud における ML

機械学習の定義

ML は AI のサブセットであり、明示的にプログラムされなくても、大量のデータを与えられることで、ニューラル ネットワークとディープ ラーニングを使用して自律的に学習しながら改善していくシステムを実現します。

ML により、コンピュータ システムを「エクスペリエンス」の蓄積に伴って継続的に調整、拡張できます。そのため、より大きく、多様な処理対象のデータセットを提供することで、これらのシステムのパフォーマンスを向上させることができます。

ML の重要性

データの生成速度は加速しており、かつてないほど多くのデータが生成されています。ML を利用することで、この膨大なデータを分析して価値を見出すことができます。 そのため、人間がコンピュータなどの機械を使ってできることは、ML によってまったく新しい領域へと広がっています。ML は、不正行為の検出、セキュリティ上の脅威の特定、パーソナライズと推奨事項、chatbot による自動カスタマー サービス、音声文字変換と翻訳、データ分析などの重要な機能で企業を支援します。また、ML は、自動走行車、ドローン、飛行機、拡張現実、バーチャル リアリティ、ロボット工学など、未来の革新的な技術を推進しています。

ML、AI、ディープ ラーニングの違いは何ですか。

AI と ML は同義語として使用されることがよくありますが、同じ意味の言葉ではありません

AI は、人間の知能に似た方法で推論、学習、行動できるコンピュータやマシン、または人間が分析できる規模を超えるデータを使用するシステムの構築に関するコンピュータ サイエンスの分野です。この分野には、データ アナリティクス、統計、ハードウェアおよびソフトウェア エンジニアリング、神経科学、さらには哲学など、さまざまな領域が含まれます。

AI はコンピュータ サイエンスの広いカテゴリであるのに対し、ML は AI の応用であり、特別にプログラミングされていなくてもタスクを実行するためのトレーニング マシンが含まれます。ML は、ニューラル ネットワーク、教師あり学習と教師なし学習、ディシジョン ツリー、線形回帰などの手法を使用してデータから知識を抽出する手段として、より明示的に使用されています。

ML が AI のサブセットであるように、ディープ ラーニングは ML のサブセットです。ディープ ラーニングでは、ニューラル ネットワークをデータセットでトレーニングします。ニューラル ネットワークは、データを分類、分析するのに使用される計算ノードである人工ニューロンのシステムを使用したモデルです。データは、ニューラル ネットワークの第 1 層に供給され、各ノードが決定を行ったのち、その情報を次の層の複数のノードに渡します。3 層を超えるトレーニング モデルは、「ディープ ニューラル ネットワーク」または「ディープ ラーニング」と呼ばれます。最新のニューラル ネットワークの中には、数百から数千のレイヤを持つものもあります。

機械学習の仕組みは?

ML では、パターンの特定やオブジェクトの認識など、期待される成果を達成するためにデータセットでアルゴリズムをトレーニングします。ML は、トレーニング データのサンプルに基づいて正しい回答を予測できるようにモデルを最適化するプロセスです。

トレーニング データが高品質であれば、ML アルゴリズムが受け取るトレーニング サンプルが多いほど、モデルの精度は高くなります。アルゴリズムは、トレーニング中に「適合プロセス」と呼ばれるプロセスでモデルをデータに適合させます。このプロセスでは、損失関数を使用してモデルのエラーを測定し、勾配降下などの最適化手法を使用してモデルのパラメータを調整し、エラーを最小限に抑えます。結果が期待を満たさない場合、正確な回答が出力されるまで、アルゴリズムが何度も再トレーニングされます。基本的に、アルゴリズムはデータから学習し、入力と回答がライン、クラスタ、またはその他の統計的相関性に適合するかどうかに基づいて結果に到達します。

ML の種類

ML の種類の違いは、実際には使用されるトレーニング モデルの違いです。大まかに言うと、ML では次の 4 種類のモデルが使用されます。

教師あり学習は、ラベル付けされたトレーニング データ(構造化データ)を使用して特定の機能をラベルにマッピングする ML モデルです教師あり学習では、出力が既知(リンゴの写真の認識など)で、既知の出力のデータに基づいてモデルがトレーニングされます。簡単に言うと、リンゴの画像を認識するようアルゴリズムをトレーニングするには、リンゴのラベルが付いた画像をアルゴリズムに入力します。 現在使用されている最も一般的な教師あり学習アルゴリズムには次のようなものがあります。

  • 線形回帰
  • 多項式回帰
  • K 近傍法
  • 単純ベイズ
  • ディシジョン ツリー

教師なし学習は、ラベルなしデータ(非構造化データ)を使用してパターンを学習する ML モデルです。教師あり学習とは異なり、出力の「正しさ」は事前にはわかりません。むしろ、アルゴリズムは人間による入力なし(つまり教師なし)のデータから学習し、属性に基づいてデータをグループに分類します。たとえば、リンゴとバナナの画像が与えられた場合、アルゴリズムはどの画像がリンゴで、どの画像がバナナかを自動的に分類します。教師なし学習は、記述的モデリングとパターン マッチングに適しています。 現在使用されている最も一般的な教師なし学習アルゴリズムには次のようなものがあります。

  • ファジィ平均法
  • K 平均法クラスタリング
  • 階層型クラスタリング
  • 部分的最小二乗

ML には、一部のデータのみがラベル付けされる半教師あり学習と呼ばれる混合アプローチもあります。半教師あり学習では、既知の結果を得るために、データを整理、構造化する方法をアルゴリズムが見つけ出す必要があります。たとえば、ML モデルには結果が洋ナシと伝えられますが、洋ナシとラベル付けされるのはトレーニング データの一部だけです。

強化学習は、一連の試行錯誤テストを通じて「実践しながら学ぶ」と言える ML モデルです。「エージェント」は、パフォーマンスが望ましい範囲内になるまで、フィードバック ループを通じて定義されたタスクの実行を学習します。エージェントは、タスクのパフォーマンスが高い場合はポジティブな強化が行われ、パフォーマンスが低い場合はネガティブな強化が行われます。強化学習の一例として、Google の研究者が囲碁ゲームをプレイするための強化学習アルゴリズムを教えたときがあります。このモデルは囲碁のルールについて事前知識を持っていませんでしたが、単に駒をランダムに動かし、最善の手を「学習」しました。このアルゴリズムは、game.four で ML モデルがゲームで人間のプレーヤーに勝つことができるまで、正と負の強化によってトレーニングされました。

ML のメリット

パターン認識

ML アルゴリズムで使用されるデータが多いほど、そのデータ内の傾向やパターンを見つけやすくなります。たとえば、e コマース ウェブサイトでは ML を利用して、サイト上での消費者の購入行動を把握し、その情報を使用してより的確なおすすめ情報を提示したり、新しい商品の販売機会につながるトレンドデータを見つけたりできます。

自動化

ML と AI により、人間の労働者の退屈で単調な仕事の多くをなくすことができます。ロボットによるプロセス自動化のようなユーティリティは、煩雑なビジネスタスクの一部を実行できるため、ユーザーがより有意義な作業を行うのを妨げる場合があります。コンピュータ ビジョンとオブジェクト検出アルゴリズムは、ロボットが組み立てラインの商品をピックアップして梱包する際に役立ちます。不正行為の常時検出と脅威評価の ML により、セキュリティ上の欠陥を問題になる前に見つけることができます。

継続的な改善

適切な種類のデータがあれば、ML アルゴリズムは改善され続け、スピードと精度が向上します。この改善は、新しいデータでの保持や、ユーザーからの実際のフィードバックの取得など、いくつかの重要な方法で実現できます。

ML の潜在的な課題

バイアスの可能性

ML の品質は、供給されるデータで決まります。ML アルゴリズムにバイアスのあるデータセットが供給されると、バイアスのある結果が返されます。

データ取得

ML は、有用になるまでに大量のデータを必要とする場合があります。ML のユースケースの多くは教師あり学習に基づいているため、アルゴリズムをトレーニングするための構造化データの取得とクリーニングが重要な最初のステップとなりますが、組織内のサイロ化されたさまざまな場所にデータが存在している場合はそれが困難な場合があります。

必要な技術的専門知識

ML や AI、クラウドのベンダーは、ML アルゴリズムの設定と実行を可能な限り簡単にするよう努めていますが、多くの場合、組織はトレーニング アルゴリズムとその結果を理解して活用するために、プログラマーやデータ サイエンティストを必要としています。

リソースを大量に消費

ML には時間がかかる場合があり、データ処理を開始して成果を達成するには、多くのコンピューティング リソースと従業員の時間が消費されます。

Google Cloud でビジネスの課題を解決する

新規のお客様には、Google Cloud で使用できる無料クレジット $300 分を差し上げます。
お客様独自の課題については、Google Cloud のセールス スペシャリストまで詳しくご相談ください。

ML の用途

一般的な ML のユースケースには、次のようなものがあります。

ロボティック プロセス オートメーション(RPA)

RPA を機械学習と組み合わせることで、住宅ローン申請の処理などの複雑なタスクを自動化できるインテリジェントな自動化が実現されます。Google Cloud では、API 管理用の Apigee、ローコード開発用の AppSheet、ML ワークフロー用の Vertex AI など、RPA で使用できるプロダクトをいくつか提供しています。

販売の最適化

顧客データは、顧客感情分析、販売予測分析、顧客解約予測のための機械学習アルゴリズムをトレーニングできます。 データ ウェアハウジング用の BigQuery、データ可視化用の Looker、ML モデルの構築とデプロイ用の Vertex AI などのツールは、販売プロセスの最適化に役立ちます。

カスタマー サービス

機械学習アプリケーションには、チャットボットや自動仮想アシスタントなどが挙げられます。これは、定期的なカスタマー サービスタスクを自動化し、問題解決にかかる時間を短縮するためのものです。Dialogflow は、ウェブサイト、モバイルアプリ、デバイス向けの会話型インターフェースの作成を支援します。Contact Center AI は、カスタマー サービス業務の強化にも使用できます。

セキュリティ

機械学習により、企業は脅威分析機能ならびにサイバー攻撃、ハッカー、マルウェアに対処する方法を改善できます。 Google Cloud Security Command Center(SCC)は、Google Cloud リソース全体のセキュリティとリスクを統合的に表示します。Google Cloud Armor はウェブ アプリケーションを脅威から保護し、Chronicle SIEM は脅威の検出と調査を支援します。

デジタル マーケティング

機械学習により、マーケティング担当者は新しい顧客を特定し、適切なタイミングで適切なユーザーに適切なマーケティング資料を提供できます。 BigQuery ML や Vertex AI など、Google 広告や Google アナリティクス 360 と統合するマーケティング分析ソリューションを使用すると、パーソナライズされたマーケティングのためのカスタム ML モデルを構築できます。

不正の防止

機械学習は、クレジット カード会社と銀行が大量の取引データを確認して、不審な操作をリアルタイムで特定するのに役立ちます。reCAPTCHA Enterprise は、不正行為からウェブサイトとモバイルアプリを保護します。また、Google Cloud は Swift と提携して、高度な AI とフェデレーション ラーニングを活用した不正対策技術を開発しています。

次のステップ

$300 分の無料クレジットと 20 以上の Always Free プロダクトを活用して、Google Cloud で構築を開始しましょう。

  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud