「ディープラーニング」を備えた音声認識システムで、感情豊かな人工知能を。

今後の IT サービス・製品開発を考える際、なくてはならない基幹技術の1つに挙げられる「音声認識」。フェアリーデバイセズ株式会社は、その国内トップランナーの 1 社です。大手メーカーのスマートフォンへの採用が決定し、今後、驚異的なトラフィックに直面することとなる同社が Google Cloud Platform に期待することとは?

フェアリーデバイセズ株式会社
代表取締役社長 藤野真人さん

Google へ移行した理由は、やはりコスト。

シャープが同社製スマートフォン 2014 年冬モデルから採用されている「エモパー」は、感情を持った人工知能がユーザーのアクションに音声で対応してくれるというエージェント機能。充電開始すると「ああ~、極楽、極楽」と喜びの声を上げるなど、利便性を最優先した従来エージェント機能とは異なる、どこかほっとする親しみやすさを備えているのが特徴です。5 月より発売された NTT ドコモ、KDDI、ソフトバンクモバイルの2015年夏モデル最新スマートフォンに搭載の「エモパー 2.0」では、いよいよユーザーとの音声対話が可能になったことでも話題となっています。

ここで使われているのが、フェアリーデバイセズ株式会社の音声情報処理クラウド「mimi® (ミミ)」。人工知能の最新トレンドである「ディープラーニング」を備えた音声認識技術で、笑い声や拍手などといった環境音を認識するほか、イントネーションの理解や話者認識など、音声をただテキスト化するだけでない、真の意味での音声認識(同社ではこれを「未来の機械のための聴覚プラットフォーム」と定義)を実現しています。

 

実は「mimi®」はこれまで他社のクラウドサーバー上にて運用されていたのですが、今回の「エモパー 2.0」への採用を契機に、Google Cloud Platform への移行を敢行しています。その理由についてフェアリーデバイセズ代表取締役社長の藤野真人さんは次のように語ってくれました。

「最大の理由はやはり“コスト”です。今までのクラウドサービスで何が一番困るかというとリザーブドインスタンスという仕組みが使いにくいこと。せっかくクラウドを使っているのにあらかじめ利用量を指定しないといけないというのはナンセンスだと思いませんか? たまたま参加した説明会で Google の担当者が全く同じことを指摘していて、全くその通りだと思ったのが Google Cloud Platform を使おうと思ったきっかけです。『mimi®』はその特性上、メモリよりも CPU に負担をかけるのですが、ある時点での実測で、最もコスト対性能比が高かったのが Google だったという事情もあります。結果、去年の 11 月に Google Cloud Platform への乗り換えを決意しました」

現状の「mimi®」のアクティブユーザー数は全ての対応機器を合わせてもおよそ 10 万人程度。これが大手メーカーのスマートフォンに採用されることで一気に数十万、数百万人になることが予想されています。

プリエンプティブル VM と通常のインスタンスと組み合わせ、サービスの安定性とコスト削減を適切に両立

「中長期的な需要予測を適切に立てられない伸び盛りの中小企業にとって、Google Cloud Platform の料金プランは良心的。万一の手当のために無駄なマシンを確保しておく必要がありませんからランニングコストを最低限に保つことができます。具体的には、まず我々の方で、直近の利用履歴から統計的な需要予測を行い、スケジュールドなスケーリングを行っています。そこから外れた部分は、Google Cloud Platform のマネージドなオートスケーラーでカバーするという二段構えを取っています。この仕組みをマルチゾーンで構成していますが、コスト削減の観点からは、6月に発表されたプリエンプティブルインスタンスも極めて有効ですね。通常のインスタンスと組み合わせて利用することで、サービスの安定性とコスト削減を適切に両立することができます。」

 

なお、気になる Google Cloud Platform への乗り換えに関しては「全く、何も、苦労しませんでした(笑)」と笑う藤野さん。

「Google の良いところは極めて論理的であるということ。何でこうなっているんだろうということにきちんと理由付けがあるんです。なので、調べればたいていのことには納得できる答がある。強いて言えば今回はオートスケーラーとネットワークロードバランサーを組み合わせる公式ドキュメントが見当たらなかったのですが、問い合わせたところ、すぐに期待した返答があって大変助かりました。通常の問い合わせは英語で行っていますが,分からないポイントが込み入っていたこともあって日本語で問い合せたところ、それに対してタイムリーに日本語で返答してくれたこともポイントが高かったですね。サポート エンジニアのレベルが高いと言うことも Google Cloud Platform の美点と言って良いのではないでしょうか。こちらと同じレベルで話ができるというのが本当に頼もしい。これまでもググって解決方法を探していたのですが、Google Cloud Platform では Google の中の人に直接聞くというググり方がある(笑)。社内に専属担当者を抱えておけない中小企業ほどメリットが大きいと思いますよ」

実はクラウドサービスの移行に際して、Google 以外のサービスも検討・試用してみたそうですが、ドキュメントが不足していたり、質問に対して木で鼻をくくるような返答が返ってきたりとストレスの溜まることが多かったそうです。Google Cloud Platform は、その点でも藤野さんにとって満足度の高いサービスだったということですね。……とはいえ、今後改善を期待したいということもいくつかあるそうです。

 

「まず、日本にデータセンターを作ってほしいですね。『mimi®』のような音声認識技術では0.5秒以上遅れるとユーザーに違和感を与えてしまいます。ある程度は我々の側でも短縮できるのですが、やはりどうしても全ては吸収しきれない。現在は TCP/IP 周りの遅延が少し気になっています。この辺りも含めて改善されるとうれしいのですが……。あと、将来に向けた要望としては GPU インスタンスがほしい。ただ、これは我々の側が実績を作って行かなければならないのだろうなとも思っています。がんばります(笑)」

ちなみに数ある Google Cloud Platform の機能の中で藤野さんが最も気に入っているのが「gcloud コマンド」なのだとか。取材中、身を乗り出すようにしてその魅力を熱弁してくれました。

「gcloud コマンドの導入の簡単さと使いやすさは神がかっていますね!これまでは、何をするにも適切な認証を通した API を逐一叩かなければならなかったりして、ちょっとしたことを細々やるには大げさな面がありました.gcloud コマンドを使えば、シェルスクリプト一発で、何でも簡単にできる。この手軽さは一度使うと手放せないですね.。個人的にはこれだけのために Google Cloud Platform を選んでも良いのではと思っています」

Monitor your resources on the go

Get the Google Cloud Console app to help you manage your projects.