コンテンツに移動
顧客事例

ヤマハ株式会社:世界初の歌によるコミュニケーション ロボットの音声認識技術に Speech-to-Text を採用

2021年11月18日
https://storage.googleapis.com/gweb-cloudblog-publish/images/hero_image_yamaha_horizontal.max-2600x2600.jpg
Google Cloud Japan Team

「技術×感性」を強みとして、新たな価値を生み出すとともに、顧客ともっとつながることで、それぞれのライフステージに応じた価値の提案を目指すヤマハ株式会社(以下、ヤマハ)。言葉をメロディーにのせて会話するコミュニケーション ロボット「Charlie(チャーリー)」の主要技術の 1 つとして、Google Cloud のプロダクトが採用されています。Charlie の開発について、ブランド戦略本部長および企画開発担当者 2 名に話を伺いました。

利用している Google Cloud サービス:Speech-to-Text

歌によるコミュニケーション ロボットの音声認識技術をサポート

https://storage.googleapis.com/gweb-cloudblog-publish/images/Charlie_small.max-1500x1500.jpg

「ねぇ、チャーリー、私 がんばってるよね?」と話しかけると、「♪半径 2 キロで 1 番がんばってるのは君さ~」と歌って答えてくれる。「もうちょっと広くしてよ」といえば、「♪ちょっと無理~」とつれない返事。日常の相談事や雑談などを話しかけると、ミュージカルのようにメロディーにのせて愛らしく返答してくれるのが、世界で初めて* 歌だけでコミュニケーションしてくれるロボット、Charlie です。

「当初からコミュニケーション ロボットを作るという企画だったわけではなく、これまでヤマハとして接点の薄かった一般ユーザー層、具体的には、楽器を演奏せず、オーディオ機器にも興味が少ない、特に女性層に対してアプローチできる商品を開発したい、というところからプロジェクトがスタートしました」と話すのは、マーケティング統括部の倉光氏です。

「20~30 代の働く女性を対象に調査をおこなったのですが、あらためて社会進出をした女性たちの心の深い部分が見えたというか、仕事のストレスや人に言えない悩み、人生や生き方などの課題を抱えている女性が本当に多いことがわかりました。悩みや課題はすぐに全て解決するわけではないけれど、彼女たちは、まずは明日のために気持ちのリセットをしたいと思っている。ここに共感、注目して、この気持ちのリセットを助けるような、ホッとほぐれる "ゆるい" コミュニケーションが提供できないだろうか、と。このアイデアが、Charlie 開発のきっかけとなりました。」(倉光氏)

目指したのは、ただそばにいて "ゆるい" 話し相手になってくれるコミュニケーションロボット。一般的なスマート スピーカーが持つような、いわゆる便利な機能はほぼ搭載せず、その代わりに、ヤマハならではの発想で会話のセリフを全て歌って返してくれるという機能にこだわりました。この類の開発経験はほぼ無かったものの、明確なコンセプトを作り込み、その実現にむけて開発に取り組むことを決断します。

電子楽器事業部の柴瀬氏は、「開発経験の少なさから、もともとは既存のプラットフォームを利用することを考えていましたが、すべての返事を歌にするというヤマハとしてのオリジナリティを高い精度で実装することについては妥協はしたくありませんでした。どんなメロディーをあてるか、その際の符割りはどうするか、ヤマハ独自の技術も駆使しながら進めるため、結果的に必要な機能を選別し、適したプロダクトを組み合わせて開発するという結論になりました」と話します。

音声認識、自然言語処理と、各パーツごとのプロダクトの選定のための研究も重ね、音声認識部分についてはコンセプトやハードウェアの仕様についても企画チーム内で細かく検討。事前の調査結果から作成したコミュニケーションの想定シナリオをもとに 4~5 社の音声認識技術を細かく試した結果、Speech-to-Text の採用を決定しました。

「私たちのテストでは、Speech-to-Text が圧倒的に認識精度が優れていました。コスト的にも予算内で導入できそうだったので迷わず採用を決めました。」(柴瀬氏)

操作性がよく使いやすいとエンジニアからも高評価

Charlie は企画から開発までに約 4 年、ソフトウェア開発は、電子楽器のソフトウェア開発チームが担当しています。柴瀬氏は、「Speech-to-Text を利用した開発について、エンジニアから特に不満はなく、むしろ多くの情報が公開されていて操作性もよく、使いやすいと聞いています」と話します。

Charlie の仕組みは、一般的なスマート スピーカーと同様に、認識したユーザーの音声をテキストに変換し、自然言語処理で意味解析を行い、返事となるテキストを作成し、音声で返すというシンプルな構成です。最大の特長である返事となる音声を歌に変換する技術には、ヤマハが開発した歌声合成技術、 VOCALOID(ボーカロイド)が使用されています。Charlie が発するセリフにあわせた雰囲気で作曲され、お客様が話した回数によって Charlie の音楽レベルも上がるように設計。また、コミュニケーションロボットとして、自ら話しかける(歌いかける)ことができるという点にもこだわりました。

https://storage.googleapis.com/gweb-cloudblog-publish/images/photo_shibase_small.max-1200x1200.jpg

一方、"ゆるい" 会話ならではの苦労もあるという柴瀬氏。「どこまでの音声を "一つの会話とするか" という判断もその一つ。音声を切る場所により誤判定が出ないようにテストと調整を繰り返しました。また、例えば、"チャーリー、疲れた?" という疑問文と、"チャーリー、(私が)疲れた。" という平叙文の違いが当初の Speech-to-Text では認識できず、返答のさせ方に工夫が必要でした。ここ最近では、一部の疑問文は変換されたテキスト上でも正しく "?" が付くようになり、機能精度の向上に感動しています(笑)。」

https://storage.googleapis.com/gweb-cloudblog-publish/images/photo_kuramitsu_small.max-1200x1200.jpg

「Charlie という名前にしたことは、開発において幸運だったことの一つ」だと笑うのは倉光氏。「Charlie は、人名としてすでに Speech-to-Text の辞書(コーパス)に登録してあったので、大きくカスタマイズすることなく、Charlie と呼べばすぐに反応してくれる仕組みを実現できました。逆に、お客様の発音の違いや、趣味、好みなどに応じて会話に登場しがちな単語が異なることで発生する言葉の判別の揺らぎは、随時チューニングを施しながら対応を重ねています。細かい問い合わせに Google Cloud の担当者からタイムリーにアドバイスをもらえることも助かりました。今後また新たな商品企画の際にはチャットボット ソリューションの Dialogflow など他のプロダクトも使ってみたいと思っていますが、こうした新しい技術の利用に関してもサポートしてもらえることで、さらに新しい世界が広がることを期待しています。」(倉光氏)

「ヤマハとして製品に Google Cloud のプロダクトを利用したのは Charlie が初。ここで繋がりができたことは大きなメリットだったと感じています。Google Cloud のプロダクトの中には、エンジニアでなくてもウェブ上でちょっと試してみることができるものも多く、さらに非エンジニアでも利用しやすいプロダクトとサポート体制が増えれば、新たなアイデアに着手しやすくなると期待しています。」(柴瀬氏)

「音楽 × ○○」で新しい価値を創出していきたい

今後の取り組みについて倉光氏は、次のように話します。「Charlie をリリース後、お客様とCharlie の距離が思ったより近いように感じています。たとえば、"チャーリー、今日の夜何食べたい?" など、お客様が目的を持って話しかける時、Charlie の答えがお客様の次の行動に与える影響はそれなりに大きいのではないか、そうであれば、お客様が何か行動するときに Charlie が応援してくれる機能があれば、ユーザーにもっと響くのではないかと思っています。お客様が悩んでいるときに、背中を押してくれる存在になれればいいなと思っています。」

https://storage.googleapis.com/gweb-cloudblog-publish/images/charlie_and_yamaha_ginza.max-1200x1200.jpg

(Charlie が入口で出迎えるヤマハ銀座店の風景。充実した楽器・楽譜の品揃えに加え、コンサートホールや音楽教室、カフェ等も併設し、多彩な音楽体験を届けることをコンセプトに 2021 年 4 月にリニューアル オープン)

ヤマハは、伝統ある楽器メーカーとして、いかに継続して楽器を演奏してもらえるかという、ヤマハにとっての永遠の課題への挑戦を続けていると言います。柴瀬氏は、「楽器の演奏は、卒業や就職、結婚など、どこかのタイミングで挫折することが多いので、人によるサポートだけではない "応援ツール" を考えては消え、消えては考えてを繰り返していました。個人的には、 Charlie に 一つのヒントがあるのではないかと思っています」とも話します。

最後に、ブランド戦略本部長 大村 寛子氏が次のように話してくださいました。
「音楽の可能性を広げたいというのがヤマハの思いです。音楽の楽しみ方には、聴く楽しみと演奏する楽しみがありますが、可能性はそれだけではないと思っています。今後も "音楽 × ◯◯" という掛け算で、新しい価値を創出していきたいと思っています。そのためには音声認識や画像認識など最先端の技術は不可欠であり、Google Cloud の可能性にも期待しています。」

https://storage.googleapis.com/gweb-cloudblog-publish/images/photo_yamaha_small.max-1500x1500.jpg

ヤマハ株式会社

1887 年創業、1897 年に日本楽器製造株式会社として設立され、1987 年 10 月 1 日に現在のヤマハ株式会社に社名を変更。「感動を・ともに・創る」という企業理念に基づいて、楽器(ピアノ、電子楽器、管・弦・打楽器などの製造販売)、音響機器(オーディオ、業務用音響機器、情報通信機器などの製造販売)、部品・装置ほか(電子部品事業、自動車用内装部品事業、FA 機器事業、ゴルフ用品事業、リゾート事業など)を事業として展開。音・音楽を通じて、人々のこころ豊かな生活に貢献することを目指しています。

インタビュイー
・ブランド戦略本部長 大村 寛子 氏
・電子楽器事業部 柴瀬 頌子 氏(写真左)
・マーケティング統括部 倉光 大樹 氏(写真右)


* ヤマハ株式会社 2021 年 3 月 25 日付ニュースリリース「世界初、歌って会話する“ペット以上恋人未満”の“うたロボ”、ヤマハ コミュニケーションロボット『Charlieチャーリー™』より

歌だけでコミュニケーションをとるロボットの意。(2021 年 3 月 25 日現在。ヤマハ調べ)


ヤマハ株式会社の導入事例 PDF はこちらをご覧ください。

その他の導入事例はこちらをご覧ください。

投稿先