機械学習(ML)とは

昨今、企業は大量のデータに翻弄されています。事業を改善するためには、データをよく理解する必要があります。しかし、膨大なデータに複雑さが組み合わさると、従来のツールでの分析が難しくなります。データのパターンや分析情報を特定するための分析モデルの構築、テスト、反復、デプロイは、スケーリングが複雑になることで従業員の多くの時間を奪います。ML により、組織はデータのスケーリングに合わせて分析情報を迅速に引き出すことができます。

新規のお客様には、Vertex AI やその他の Google Cloud プロダクトをお試しいただける無料クレジット最大 $300 分を差し上げます。

MLOps によるモデルの迅速なデプロイ

機械学習の定義

ML は AI のサブセットであり、明示的にプログラムされなくても、大量のデータを与えられることで、ニューラル ネットワークとディープ ラーニングを使用して自律的に学習しながら改善していくシステムを実現します。

ML により、コンピュータ システムを「エクスペリエンス」の蓄積に伴って継続的に調整、拡張できます。そのため、より大きく、多様な処理対象のデータセットを提供することで、これらのシステムのパフォーマンスを向上させることができます。

ユースケースの範囲

ML は、ほぼすべての業界やビジネス活動で使用されています。機械学習は、物流業界が出荷と配送ルートを最適化するのに役立ちます。小売業界はショッピング エクスペリエンスをパーソナライズして在庫を管理し、メーカーは工場を自動化し、あらゆる場所にいる組織の安全を確保します。ユーザーが自分の声を使ってスマートフォンやスピーカーにクエリを実行すると、機械学習を使用してリクエストを理解し、結果を見つけ出すことができます。ML のユースケースの範囲は広大で、常に拡大しています。

ML の重要性

データの生成速度は日々加速しています。世界は毎日、歴史上かつてないほど多くのデータを生み出しています。ML なしですべてのデータを分析し、活用することはほぼ不可能です。このように、機械学習は人間がコンピュータや他の機械でできることのまったく新しい領域を切り拓いています。ML は、不正行為の検出、セキュリティ上の脅威の特定、パーソナライズと推奨事項、チャットボットによる自動カスタマー サービス、音声文字変換と翻訳、データ分析などの重要な機能で企業を支援します。機械学習は、自律走行車、ドローン、飛行機、拡張現実 / バーチャル リアリティ、ロボット工学など、今後の画期的なイノベーションも推進しています。

ML、AI、ディープ ラーニングの違いは何ですか。

AI と ML はしばしば同義語として使用されますが、同じ意味の言葉ではありません。

AI は、人間の知能に似た方法で推論、学習、行動できるコンピュータやマシン、または人間が分析できる規模を超えるデータを使用するシステムの構築に関するコンピュータ サイエンスの分野です。この分野には、データ アナリティクス、統計、ハードウェアおよびソフトウェア エンジニアリング、神経科学、さらには哲学など、さまざまな領域が含まれます。

AI はコンピュータ サイエンスの広いカテゴリであるのに対し、ML は AI の応用であり、特別にプログラミングされていなくてもタスクを実行するためのトレーニング マシンが含まれます。ML は、ニューラル ネットワーク、教師あり学習と教師なし学習、ディシジョン ツリー、線形回帰などの手法を使用してデータから知識を抽出する手段として、より明示的に使用されています。

ML が AI のサブセットであるように、ディープ ラーニングは ML のサブセットです。ディープ ラーニングでは、ニューラル ネットワークをデータセットでトレーニングします。ニューラル ネットワークは、データの分類と分析に使用される計算ノードである人工ニューロンのシステムを使用するモデルです。データは、ニューラル ネットワークの第 1 層に供給され、各ノードが決定を行ったのち、その情報を次の層の複数のノードに渡します。3 層を超えるトレーニング モデルは、「ディープ ニューラル ネットワーク」または「ディープ ラーニング」と呼ばれます。最新のニューラル ネットワークの中には、数百から数千のレイヤを持つものもあります。

機械学習の仕組みは?

ML では、パターンの特定やオブジェクトの認識など、期待される成果を達成するためにデータセットでアルゴリズムをトレーニングします。ML は、トレーニング データのサンプルに基づいて正しい回答を予測できるようにモデルを最適化するプロセスです。

トレーニング データが高品質であれば、ML アルゴリズムが受け取るトレーニング サンプルが多いほど、モデルの精度は高くなります。トレーニングでは、「適合プロセス」と呼ばれる処理で、アルゴリズムによってモデルをデータに適合させます。結果が期待を満たさない場合、正確な回答が出力されるまで、アルゴリズムが何度も再トレーニングされます。基本的に、アルゴリズムはデータから学習し、入力と回答がライン、クラスタ、またはその他の統計的相関性に適合するかどうかに基づいて結果に到達します。

ML の種類

ML におけるトレーニング データとは。使用する ML モデルのタイプによって異なります。

大まかに言うと、ML で使用されるモデルは 3 種類あります。

教師あり学習は、ラベル付けされたトレーニング データ(構造化データ)を使用して特定の機能をラベルにマッピングする ML モデルです。教師あり学習では、出力が既知(リンゴの写真の認識など)で、既知の出力のデータに基づいてモデルがトレーニングされます。簡単に言うと、リンゴの画像を認識するようアルゴリズムをトレーニングするには、リンゴのラベルが付いた画像をアルゴリズムに入力します。

現在使用されている最も一般的な教師あり学習アルゴリズムには次のようなものがあります。

  • 線形回帰
  • 多項式回帰
  • K 近傍法
  • 単純ベイズ
  • ディシジョン ツリー

教師なし学習は、ラベルなしデータ(非構造化データ)を使用してパターンを学習する ML モデルです。教師あり学習とは異なり、出力の「正確性」は事前にわかりません。むしろ、アルゴリズムは人間による入力なし(つまり教師なし)のデータから学習し、属性に基づいてデータをグループに分類します。たとえば、リンゴとバナナの画像が与えられた場合、アルゴリズムはどの画像がリンゴで、どの画像がバナナかを自動的に分類します。教師なし学習は、記述的モデリングとパターン マッチングに適しています。

現在使用されている最も一般的な教師なし学習アルゴリズムには次のようなものがあります。

  • ファジィ平均法
  • K 平均法クラスタリング
  • 階層型クラスタリング
  • 部分的最小二乗

ML には、一部のデータのみがラベル付けされる半教師あり学習と呼ばれる混合アプローチもあります。半教師あり学習では、既知の結果を得るために、データを整理、構造化する方法をアルゴリズムが見つけ出す必要があります。たとえば、ML モデルには結果が洋ナシと伝えられますが、洋ナシとラベル付けされるのはトレーニング データの一部だけです。

強化学習は、一連の試行錯誤テストを通じて「実践しながら学ぶ」と言える ML モデルです。「エージェント」は、パフォーマンスが望ましい範囲内になるまで、フィードバック ループを通じて定義されたタスクの実行を学習します。エージェントは、タスクのパフォーマンスが高い場合はポジティブな強化が行われ、パフォーマンスが低い場合はネガティブな強化が行われます。強化学習の一例として、Google の研究者が囲碁ゲームをプレイするための強化学習アルゴリズムを教えたときがあります。このモデルは囲碁のルールについて事前知識を持っていませんでしたが、単に駒をランダムに動かし、最善の手を「学習」しました。このアルゴリズムは、ML モデルがゲームで人間のプレーヤーに勝つことができるまで、正と負の強化によってトレーニングされました。

ML のメリット

パターン認識

ML アルゴリズムで使用されるデータが多いほど、そのデータの傾向やパターンを見つけやすくなります。たとえば、e コマース ウェブサイトでは ML を利用して、サイト上での消費者の購入行動を把握し、その情報を使用してより的確なおすすめ情報を提示したり、新しい商品の販売機会につながるトレンドデータを見つけたりできます。

自動化

ML と AI により、人間の労働者の退屈で単調な仕事の多くをなくすことができます。ロボットによるプロセス自動化のようなユーティリティは、煩雑なビジネスタスクの一部を実行できるため、ユーザーがより有意義な作業を行うのを妨げる場合があります。コンピュータ ビジョンとオブジェクト検出アルゴリズムは、ロボットが組み立てラインの商品をピックアップして梱包する際に役立ちます。不正行為の常時検出と脅威評価の ML により、セキュリティ上の欠陥を問題になる前に見つけることができます。

継続的な改善

適切な種類のデータがあれば、ML アルゴリズムは改善され続け、スピードと精度が向上します。その好例が、テキストの生成方法を継続的に改善する GPT-3 データセットです。

ML のデメリット

バイアスの可能性

多くの場合、ML の品質は供給されるデータで決まります。ML アルゴリズムにバイアスのあるデータセットが供給されると、バイアスのある結果が返されます。

データ取得

ML を利用するには、大量のデータが必要になる場合があります。ML のユースケースの多くは教師あり学習に基づいているため、アルゴリズムをトレーニングするための構造化データの取得とクリーニングが重要な最初のステップとなりますが、組織内のサイロ化されたさまざまな場所にデータが存在している場合はそれが困難な場合があります。

必要な技術的専門知識

ML や AI、クラウドのベンダーは、ML アルゴリズムの設定と実行を可能な限り簡単にするよう努めていますが、多くの場合、組織はトレーニング アルゴリズムとその結果を理解して活用するために、プログラマーやデータ サイエンティストを必要としています。  

リソースを大量に消費

ML には時間がかかる場合があり、データ処理を開始して成果を達成するには、多くのコンピューティング リソースと従業員の時間が消費されます。

Google Cloud でビジネスの課題を解決する

新規のお客様には、Google Cloud で使用できる無料クレジット $300 分を差し上げます。
お客様独自の課題については、Google Cloud のセールス スペシャリストまで詳しくご相談ください。

ML の用途

機械学習の使用例は次のとおりです。

ロボティック プロセス オートメーション

RPA を機械学習と組み合わせることで、住宅ローン申請の処理などの複雑なタスクを自動化できるインテリジェントな自動化が実現されます。

販売の最適化

顧客データは、顧客感情分析、販売予測分析、顧客解約予測のための機械学習アルゴリズムをトレーニングできます。

カスタマー サービス

機械学習アプリケーションには、チャットボットや自動仮想アシスタントなどが挙げられます。これは、定期的なカスタマー サービスタスクを自動化し、問題解決にかかる時間を短縮するためのものです。

セキュリティ

機械学習により、企業は脅威分析機能ならびにサイバー攻撃、ハッカー、マルウェアに対処する方法を改善できます。

デジタル マーケティング

機械学習により、マーケティング担当者は新しい顧客を特定し、適切なタイミングで適切なユーザーに適切なマーケティング資料を提供できます。

不正の防止

機械学習は、クレジット カード会社と銀行が大量の取引データを確認して、不審な操作をリアルタイムで特定するのに役立ちます。

次のステップ

$300 分の無料クレジットと 20 以上の Always Free プロダクトを活用して、Google Cloud で構築を開始しましょう。

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
コンソール
  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud