AI & 機械学習

AI の活用で、企業や開発者にさらなる可能性を

2880x1200_6Bt4yn.PNG

*この記事は米国時間 7 月 24 日に、Fei-Fei Li (Chief Scientist, Google AI) によって投稿されたものの抄訳です。

過去 20 年間で AI は劇的に進化しました。画像認識や機械翻訳のような技術が、現在では何百万人もの人々の日常生活の一部となっています。AI は世界中の産業に変化をもたらし、まったく新しい産業も作り出しました。その過程で、いままで想像もできなかったような生活と仕事の質の向上が見込まれています。しかし、私たちにできることはまだ数多く残っており、 AI の領域は今後の発展に向けた機会と課題をいまだ多く抱えている、発展初期の段階にあります。

AI は人々の可能性を広げる力を持っており、私たちは、ひとりひとりが、そして小売から農業、教育から医療に至るまでのあらゆるビジネスが、その力を活用できるようにしたいと考えています。 AI はもはやテクノロジー業界のニッチな存在ではなく、あらゆる業界のビジネスの差別化要因となっています。そして、私たちはビジネスに変革をもたらすことができるツールを提供することに注力しています。

本日、私たちは企業やデベロッパーにイノベーションをもたらすことができる多くの新製品や機能拡張について発表します。

  • Cloud AutoML Vision 、AutoML Natural Language 、AutoML Translation のベータ版の提供開始。
  • 現在ベータ版の Dialogflow Enterprise Edition の新たな拡張機能を追加
  • 新しいソリューション である Contact Center AI のアルファ版の提供開始。

Cloud AutoML : AI の民主化に向けた次なるステップ

データ サイエンティストなどの経験豊富な専門家が TensorFlowCloud ML Engine などのツールを使ってカスタム ソリューションを一から構築している一方で、 Cloud Vision API のような事前学習済みの機械学習モデルが、最小限の投資と技術的能力ですぐに結果を出しています。このように、現在の機械学習(ML)で実現できることは二極化しており、両者の間には大きな格差があります。この両者間に位置する多くの人々は、学習済みモデルが提供する機能以上のニーズがあるにも関わらず、独自のカスタム ソリューションを構築するスキルやリソースを必ずしも所有しているとは限りません。

この中間領域に取り組むため、私たちは今年、Cloud AutoML を発表しました。AutoML は、機械学習やコーディングに関する専門知識を必要とせず、誰でも独自の領域内でカスタマイズされた強力な機械学習モデルを構築することができます。この Cloud AutoML の第一弾として登場した AutoML Vision は、Cloud Vision API を拡張し、まったく新しいカテゴリーの画像を認識することができます。アルファ版のユーザーから得た知見を元にユーザー体験を改善し、本日、AutoML Vision のベータ版を公開しました。

しかし、画像分類は機械学習の無数の応用分野のひとつに過ぎず、私たちは可能な限り多くの課題に取り組んでいます。本日、私たちは新たに 2 つの AutoML 製品をご紹介します。その内のひとつである AutoML Natural Language は、お客様が望む分野に特有のカスタム テキストカテゴリを自動的に予測します。また、もうひとつの AutoML Translation では、翻訳元および翻訳先言語を対でアップロードし、機械学習モデルに学習させることにより、独自のカスタム翻訳モデルを構築することができます。

すでに多くのお客様から、 AutoML を用いることによりどのように機械学習を活用できるか試してみたいという声をいただいています。

Hearst Newspapers の収益担当上級副社長 Esfand Pourmand 氏は、「米国で 25 誌、世界で300 誌近い雑誌を擁する世界最大の出版社のひとつとして、Hearst のスタッフは常により良いコンテンツ管理の方法を模索しています。AutoML Natural Language を使って、私たちのコンテンツに独自の分類法を適用するのを楽しみにしています。AutoML Natural Language を使用することで、私たちが検討した他のソリューションより高い精度で私たち独自のニーズを満たしたカスタムモデルを作成することができます」とコメントしています。

日本経済新聞社 常務取締役 デジタル事業担当 の 渡辺 洋之 氏は、「日経グループは、主要邦字紙の日本経済新聞に加え、英字紙の『Nikkei Asian Review』や『Financial Times』まで、世界中で信頼度の高い情報源を持つ大手メディア組織です。世界中で流通させ共有できるよう、コンテンツを翻訳することは不可欠です。現在、AutoML Translationを評価中ですが、私たちが必要とするカスタマイズに対応しており、その正確さに感銘を受けています」とコメントしています。

Keller Williams Realty のチーフプロダクトオフィサーの Neil Dholakia 氏は、次のように語っています。「Keller Williams Realty では AutoML Vision を使って、不動産業界で最も進んだ住宅サーチ体験を市場にもたらしています。カスタムモデルが備え付け家具や建築に関する一般的な要素を認識するように学習させることで、お客様は住宅リスティング写真から『花崗岩を使用したキッチンカウンター』といったような特定の特徴や、さらには『モダン』などのより一般的な特徴を自動検索することができます」。

AutoML の詳細については、こちらをご覧ください。

AI での可能なことを拡張する

昨年、私たちは AI をより強固なものにするだけでなく、より使いやすくするために多くの取り組みを行ってきました。たとえば、昨年発表した Cloud  TPU は、機械学習タスクを劇的に加速するために Google が独自に開発したカスタム プロセッサです。本日、第 3 世代の Cloud TPU のアルファ版のリリースを発表します。これにより、より多くのビジネスにむけて、大規模な機械学習コンピュテーションがサポートできるようになります。

私たちは、クラウド TPU を用いてお客様がこれまで達成してきたことに驚いてます。たとえば eBay は視覚的検索モデルのトレーニング期間の長さを、TPU によって月単位から日単位まで短縮できました。これは、従来と比較するとおよそ 100 分の 1 にあたります。

また私たちは、最新の AI 研究をいかにして使いやすい製品にして行けるか、日々継続して考えています。本日私たちは、中心的な機械学習 API にのいくつかの重要な更新を行いました。Cloud Vision API は現在、手書き文字を認識するようになり、追加のファイルタイプ(PDF と TIFF)および製品検索をサポートし、画像内のオブジェクトの位置を特定できるようになりました。また、DeepMind の WaveNet テクノロジによって生成された音声が多言語に対応、音声を再生するスピーカの種類を最適化する機能など、Cloud Speech-to-Text の改良もしています。また、現在 Cloud Speech-to-Text で特定可能なものは、言語の種類および会話内での話者、単語レベルでの信頼スコアに加え、複数参加者の会話の録音においても各参加者を別々に録音可能なマルチチャネル認識などです。

働き方の改善に向けた AI の活用

人と機械が共存しながら働くための手法を進化させていく中で、私たちはいまだ初期の段階にいます。反復による負荷を軽減し、人が得意とする創造性や問題解決を支援する知的なツールを通じて、私たちは AI がもたらす最大の可能性は、人間のスキルを補完し強化することであって、AI は人間に取って代わるものではないということを示しています。

このような私たちの取り組みを示す一例として、コンタクトセンターの実務経験の改善があります。コンタクトセンターが日々直面する実際の課題を研究したところ、お客様からの簡単な取引や情報提供依頼が頻繁に寄せられていました。これはコンタクトセンターの従業員にとって反復作業であり、電話サポートできる顧客数の減少、そしてより複雑な問題の解決に時間をかけられない状況に追い込まれます。お客様自身にとっては、苛立ちを覚えるような対応内容、長い待ち時間が発生し全体的にお客様体験の質が下がります。このような事例を受け、私たちは、AI を活用して、お客様とお客様を支援するコンタクトセンターの双方の体験を劇的に向上させる方法を考えました。

私たちの構想は Dialogflow Enterprise Edition が利用可能になったことから始まりました。対話エージェントの構築に向けた包括的な開発パッケージソフトである Dialogflow Enterprise Edition は、昨年 11 月にリリースされました。様々な業界で、すでに 60 万人以上のデベロッパーが導入しています。Dialogflow の機能の多くは、企業のコンタクトセンター全体の効率を大幅に向上させる可能性があると考えましたが、それはまだ包括的なソリューションではありませんでした。本日、私たちはその構想を完成させるような、新しい機能を発表します。

Dialogflow はすでに、Cloud Speech-to-Text で正確な音声認識を提供しています。さらに私たちは電話との融合を果たすため、DeepMind の WaveNetDialogflow Phone Gateway を使用した Text to Speech のような新機能を上記の音声認識機能に追加しました。

しかし、私たちの真の目標は、コンタクトセンターで対応を行う人と、彼らを頼りにするお客様の双方を支援することです。これを実現するため、私たちはパートナーの企業らと協力し、Dialogflow Enterprise Edition やコンタクトセンターで、特に役立つ追加機能などを含めたソリューションを構築しました。これらはすべて、私たちが AI の使用に対して責任を持つだけでなく、人を中心としたアプローチを取ることを示すものです。私たちはこれを Contact Center AI と呼んでおり、カスタマーサービスをあらゆる面で一貫して向上させる可能性があると考えています。これがどのように働くかお話ししましょう。

通話が発信されると、自動的に疑問に答えたりタスクを実行したりする Virtual Agent が即座に発信者に呼びかけます。Google には、ユーザーが電話で操作したりコミュニケーションをするためのいくつかのテクノロジーがあり、Contect Center AI と、先日発表した Duplex には共通のコンポーネントがあります。しかしこれらはそれぞれ全体として異なったテクノロジースタックと目的を持っています。

発信者のニーズが Virtual Agent の機能を超えると、通話は人間のエージェントへと移送されます。この時点でシステムはサポート役に回り、 Contact Center AI の Agent Assist システムが会話をサポートしながら、エージェントに関連情報を提供します。Dialogflow の Knowledge Connectors を活用した支援技術は、企業のナレッジベースから最も関連性の高いナレッジ項目を抽出し、ほとんどリアルタイムでコンタクトセンターの担当者に先を見越して最善のソリューションを提示します。

これにより、柔軟なソリューションが得られるほか、個々の通話ニーズに適応し、人間のエージェントと仮想エージェントの間でシームレスな体験を提供します。状況に応じて Virtual Agent の果たす役割の大きさは変わります。データのプライバシーおよびガバナンスポリシーに準拠しており、インフラストラクチャがなくとも必要なだけの規模にスケーリングされたプラットフォームで実行できます。

最後になりますが私たちは、Appian 、Chatbase 、Cisco 、Five9 、Genesys 、Mitel 、Quantiphi 、RingCentral 、Twilio 、UiPath 、Upwire 、Vonage など、コンタクトセンターのパートナー各社と、Cloud AI の責任ある使用について連携しています 。これには、お客様がボットと話している時間の開示や、無意識な偏見、仕事の未来についての疑問へのアプローチといったベストプラクティスが含まれます。私たちは、従業員とユーザーが公正で、役に立ち、信頼できると感じるような方法で、技術を活用することにを徹底したいと考えています。

Contact Center AI は、私たちが働き方を向上させるために開発している多くのソリューションにおける初の取り組みです。たとえば、当社の Talent Solution は、深層学習のマッチング技術に基づいて構築され、企業の人材獲得を促進します。特定のポジションに対して、これまでの応募者の中で一番適した候補を見つけたり、候補者が自分のスキルや興味に合った適切な仕事を見つけられるよう支援することにより、リクルーターの作業を劇的に軽減します。今後数週間にわたり、Contact Center AI 、Talent Solution 、その他の AI ソリューションについてさらに説明していきます。それまでは、Dialogflow Enterprise Edition の新機能の詳細と、新しく発表した Contact Center AI については、こちらをお読みください。

AI をすべての人に提供し続ける

Cloud TPU のようなハードウェアから、AutoML のようなソフトウェアや Contact Center AI  のような業種別ソリューションまで、私たちは最新の技術を推進し、参入障壁を低くして、幅広いニーズと専門知識を持つお客様にサービスを提供していきます。そして私たちは、人々の経験を向上させるという目的を一心に見据えてこれらを行なっています。

Google Cloud での機械学習の詳細については、私たちのこちら Web サイトをご覧ください。

- Post by Fei-Fei Li, Chief Scientist, Google AI