機械学習の概要

機械学習は、明示的なプログラミングやルールがなくても、ソフトウェアがタスクを実行できるようにする機能です。機械学習は従来、人工知能(AI)のサブカテゴリとみなされてきましたが、統計的手法を含んでいます。たとえば、人間の脳が情報をどのように処理するかの理論からヒントを得たディープ ラーニング(またはニューラル ネットワーク)です。

機械学習の仕組みは?

機械学習では、(ログ、音声、テキスト、画像などの)収集されたデータのパターンを認識するようトレーニングされたアルゴリズム モデルを活用します。大量のトレーニング データとコンピューティング能力を利用できることが、成功の前提条件となります。したがって、データ ストレージと高パフォーマンス コンピューティングを十分に備え、費用対効果に極めて優れたクラウドは、機械学習に適したプラットフォームとなります。

機械学習の応用例にはどのようなものがありますか?

機械学習の応用例は、日常生活の中に豊富にあります。とても簡単な例として、検索フィールドの名前、キーワード、住所のオートコンプリートがありますが、同じコンセプトを多くの業界のより複雑な例に適用できます。たとえば、機械学習は次の目的で使用されます。

  • 画像を分類する(MRI 解析、写真、衛星画像など)
  • 大量のテキスト ドキュメントやメールでキーワードを検索する
  • 不正な可能性のあるトランザクションにフラグを設定する
  • 顧客の行動に基づいておすすめの商品情報をパーソナライズする
  • ソフトウェアが音声コマンドに正確に応答できるようにする
  • 天気のパターンやその他の気候条件を予測する
  • テキストや音声の言語を翻訳する

つまり、人間の能力を超えた規模の、膨大な労力を必要とするタスクを行うソフトウェアが存在する場合、おそらくそこには機械学習が関与していると言えるしょう。

機械学習は Google 内部でどのように利用されていますか?

機械学習は、主にデータドリブン システムを大規模に自動化する必要性に促され、長年にわたり Google の社内システムの基盤となっています。この経験をもとに、適切なフレームワーク、手法、インフラストラクチャ、データに関する独自のインサイトが得られました。こうしてお客様が機械学習を採用して確実に価値を得られるよう、支援できるようになりました。

たとえば、TensorFlow というオープンソース フレームワークは、最初は Google 社内向けに開発されましたが、現在はデータ サイエンス コミュニティの標準となり、経験豊富なユーザーはここでパワフルなモデルを構築してトレーニングできます。また、弊社にいる何百人もの機械学習の研究者は、学術コミュニティやオープンソース コミュニティに大きく貢献するだけでなく、その機能を Google 製品(G Suite、検索、写真など)、そして Google 社内オペレーション(データセンターの自動化など)に実装する助けとなってきました。

機械学習を私の組織で利用し始めるにはどうすればいいですか?

かつては統計学やデータ サイエンスといった特殊な領域に属していた機械学習の機能が、今ではオープンソース ライブラリ(TensorFlow)、マネージド サービス、クラウド API などの形で広くアクセス可能になりました。オンプレミスとクラウドの間で移動可能な「将来性のある」モデルを構築したいデータ サイエンティストにとって、また十分なトレーニング データがなく、事前構築 / 事前トレーニングされたモデルをクラウド API からアプリに導入したいメインストリーム デベロッパーにとって、そのようなツールを日常業務で使用することは現実的な目標となっています。

詳細: