Google Cloud

Cloud Machine Learning API を使った会話アプリの作成 - Part 3

2017年9月11日

Google Cloud Japan Team

このブログ記事の Part 1 と Part 2 では、API.AI と Google Cloud Machine Learning API を使った会話型ツアーガイドアプリの作成方法を紹介しました。最終回となる今回は、このアプリを、Google Assistant が動作するデバイス（Google Home、動作要件を満たす Android スマートフォンおよび iPhone、Android Wear）に拡張する方法を見ていきます。この拡張アプリは、Part 1 と Part 2 で作成した既存の API.AI エージェントがベースとなります。

Actions on Google 用の新しいインテント

Part 1 では会話型ツアーアプリの入力コンテキストと出力コンテキストの関係について説明しました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/5qwiyM4kPl5aqB6w31K3OCrsY5ACLwc_3U2H6vntNONL.max-700x700.PNG

where コンテキストはユーザーに画像のアップロードを要求しますが、これは Google Assistant ではサポートされていません。このコンテキストの関係は次のように変更できます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/wMdKamn2qEe9cZN9P_umPea_xH7lZUy4DdJy9RzxTf.max-1000x1000.PNG

hours-no-context、ticket-no-context、map-no-context という 3 つの新しいインテントを追加します。各インテントは、他のインテントが location を入力パラメータとして使えるように、location を出力コンテキストとして設定します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/nAvo-RV4puHIShLEiuuXbsgGOSZp7RF2obdFYld7Lx.max-1200x1200.PNG

Actions on Google の統合を有効にする

今度は Actions on Google を有効にして、Google Assistant と連携させます。

API.AI コンソールを開き、Integrations（統合）タブで Actions on Google の統合をオンにします。

https://storage.googleapis.com/gweb-cloudblog-publish/images/z0LW_vmCka--h7w9UgdpvBoMPdE-QKTPuUynSCOpX6.max-1600x1600.PNG

Additional triggering intents（追加するトリガーインテント）の下のポップアップダイアログで、Google Assistant でサポートしたいすべてのインテントを追加します。なお、Welcome Intent はシステムによって自動的に Default Welcome Intent に設定されます。後で Actions on Google で SETTINGS（設定）をクリックすると、この設定ダイアログを表示できます。
inquiry.where インテントは画像のアップロードを要求しますので、Google Assistant ではサポートされないことに注意してください。そのため、このインテントをトリガーインテントリストに追加してはなりません。また、サポートする新しいインテントを追加作成する方法については、上述の『Actions on Google 用の新しいインテント』で説明しています。
Actions on Google でサポートしたいすべてのインテント（hours-no-context インテントなど）を Additional triggering intents のリストに追加したら、最下部の UPDATE（更新）および TEST（テスト）ボタンをクリックします。すると、緑色のボックスが生成されるので、VIEW（表示）ボタンをクリックし、Actions on Google Web Simulator に移動します。

https://storage.googleapis.com/gweb-cloudblog-publish/images/2847.max-800x800.png

Actions on Google コンソールに初めてアクセスする場合はプロンプトが表示され、Activity controls センターにおいて Device Information（端末情報）と Voice & Audio Activity（音声アクティビティ）をオンにするよう促されます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/274659.max-700x700.png

デフォルトでは、これらの設定はオフになっています。これらをすでにオンにしている場合は、このプロンプトは表示されません。

https://storage.googleapis.com/gweb-cloudblog-publish/images/347387.max-1600x1600.png

この 2 つの設定をオンにすると、Actions on Google Web Simulator に移動します。いよいよシミュレータで統合のテストに入ります。
まず、“Talk to my test app”（テストアプリと会話）とタイプするか、話しかけます。すると、シミュレータは Default Welcome Intent に基づいてこの文に応答します。続いて、API.AI テストコンソールにアクセスしているかのように、アプリをテストできます。

https://storage.googleapis.com/gweb-cloudblog-publish/images/uq61EjyBl1xaUbTlj9cCIzniAMJGxnaGJnoLTo0Gyj.max-1600x1600.PNG

tell() API と ask() API の違い

Part 2 で触れたように、Actions on Google SDK で Google Cloud Functions を実装するときの tell() API と ask() API には微妙な違いがあります。Part 1 と Part 2 では両 API にはあまり違いはありませんが、Actions on Google を統合する Part 3 では違いがあります。tell() は会話を終了させ、マイクを閉じますが、ask() は会話を継続し、ユーザーの次の入力を待ちます。

この違いはシミュレータでテストできます。Cloud Functions で tell() を使うと、Cloud Functions のウェブフック、たとえば inquiry.parades インテントの “Are there any parades today?”（今日はパレードがある？）などでインテントをトリガーした場合、再び “Talk to my test app” と言わなければなりません。

ask() を使用すればテストアプリとの会話を続けられるので、再び “Talk to my test app” と言う必要はありません。