アイシン:音声認識アプリのバックエンド システムを Google Cloud に移行し、サーバーレス アーキテクチャで運用負荷を大幅に削減
Google Cloud Japan Team
自動車部品、エネルギー・住生活関連製品の大手メーカーであり、自動車部品以外の新事業にも取り組まれている株式会社アイシン(以下、アイシン)では、「YYSystem」という音声認識技術や自然言語処理技術を利用したコミュニケーション支援システムを開発しており、スマートフォン向けのリアルタイム音声認識アプリ「YYProbe(ワイワイプローブ)」などを提供しています。この YYSystem や YYProbe では開発当初より音声認識エンジンとして Google Cloud の Cloud Speech-to-Text API を利用していますが、YYProbe の インフラの再構築を機に音声認識エンジン以外のバックエンド システムについても他社クラウド サービスから Google Cloud への移行を実施しました。このプロジェクトに携わる担当者に話を伺いました。
利用しているサービス:
Cloud Speech-to-Text、Translation AI(Translation API)、Cloud Run、Google Cloud Armor、Cloud DNS、Cloud Load Balancing、Cloud SQL、Cloud Storage、Cloud Build、Container Registry、Memorystore、Cloud Monitoring
利用しているソリューション:
音声認識の精度を維持しつつアーキテクチャを刷新、ユーザー数の増加に対応できる仕組みを構築
アイシンが開発した「YYProbe」は、手元の端末で集音した音声をリアルタイムで認識し、テキスト化して会話の内容を画面に表示することができるスマートフォン アプリです。当初は会議などの音声データを収集・分析し、業務に関する知見の蓄積や生産性の向上に活用する目的で開発されました。工場の騒音の中でも素早く正確に声を識別できる独自のアルゴリズムを搭載し、高い処理速度と認識精度を実現しているのが大きな特徴です。現在は、高精度な音声認識技術を生かして、聴覚障がい者向けのコミュニケーション支援アプリとしての活用も進めており、有料のプレミアム プランの提供も始めています。
この YYProbe の音声認識エンジンとして利用しているのが Cloud Speech-to-Text です。Cloud Speech-to-Text を採用した理由について、先進開発部 第4開発室 YYSystemプロジェクト 山川 隼輝氏は次のように説明します。
「開発当初にいくつかの音声認識エンジンを比較したところ、音声認識の精度とレスポンスのリアルタイム性において Cloud Speech-to-Text が圧倒的に優れていることがわかり、採用を決定しました。ただし、この時点ではバックエンドのシステム本体については他社クラウド サービスで構築しており、音声認識エンジンのみ Google Cloud を利用しているという構成でした。」
今回のプロジェクトで、YYProbe のバックエンド システムのインフラについても Google Cloud に移行し、同時にマネージド サービスを活用した、よりモダンなシステム構成に再構築しました。 Google Cloud への移行が必要になった背景としては、ユーザー数が増加してスケーラビリティの向上が必要になってきたことや、サーバー台数が増えたことに伴う運用負荷の増加やコストの増大が問題になってきたことが挙げられると山川氏は語ります。
「社内外への認知度が上がったことでユーザーが増え、それに伴ってサーバー台数を増やしたり、アクセスの増加に対応するためのリソースの調整を行うなど、運用面での負荷が高くなってきました。また有料プランの提供も始まったため、障害が発生した場合に与える影響が大きくなっており、より高い安定性やスケーラビリティを確保するためにアーキテクチャそのものを見直す必要も出てきました。少人数で開発、運用を行う体制のなか、お客様のニーズに応えるために YYProbe 以外の分析サービスや API サービスの開発も同時に進めている状況なので、開発リソースを確保するために運用にかかる工数を削減できる仕組みを構築したいという狙いもありました。」
システムの改修が必要になる一方で、音声認識エンジンについては Cloud Speech-to-Text の利用を継続する方針だったと山川氏は続けます。
「移行プロジェクトの計画時点で音声認識エンジンの精度やレスポンスについて再調査したところ、依然として Cloud Speech-to-Text に優位性があることを確認しました。コミュニケーション支援システムという性質上、リアルタイムかつ高性能な音声認識エンジンであることが不可欠なため、他のエンジンに切り替えるという選択肢はありませんでした。すでに既存システムで Cloud Speech-to-Text に合わせた独自のアルゴリズムも搭載していたため、それを生かしたいという事情もありました。」
また、インフラの移行対象として Google Cloud を採用した理由については次のように説明します。
「まず、Cloud Speech-to-Text を継続して利用するという前提から、他の部分も Google Cloud に統一した方がコスト面のメリットが大きかったという点が挙げられます。また、マネージド サービスが充実しており、必要な機能がそろっていた点も、採用の決め手になりました。Google Cloud の利用経験やサーバーレスに関する知見がないという懸念はありましたが、Google Cloud から積極的に支援していただけたことが採用を後押ししました。」
Cloud Run によるサーバーレスの採用と CI / CD の実現で、メンテナンスの負荷を大幅に削減
新システムでは、Cloud Run を利用したサーバーレス アーキテクチャを採用しました。今後のユーザー数の増加や、負荷が集中する時間への対策、新サービスの追加などといった要件を考慮して、クラウドの価値を生かした柔軟性の高いシステムを構築する必要があったからです。
「メンテナンスの工数を最小限に抑えたかったため、サーバー 1 台ずつを個別に管理する必要がなく、他のサービスとの連携も容易な Cloud Run を採用しました。Cloud Run ではマシンスペックやアクセス制限などの設定をパラメータで細かく調整することができ、コマンドひとつでデプロイが完了します。これによって、従来のシステムに比べてメンテナンスにかかる手間は格段に減りました。特に、さまざまな作業をブラウザだけで完結できることが、運用負荷の大幅な軽減につながるということを実感しました。従来のシステムでは、例えばログの確認をするだけでも、ログファイルをダウンロードしたり、サーバーに直接ログインするなど複数の手続きが必要でしたが、Cloud Run ではすべてブラウザ上のひとつの画面で完結できます。運用が大きく変わりました。」(山川氏)
アイシンでは、Google Cloud への移行にあたって、システムの開発ワークフローに対しても新しいチャレンジを行いました。それは、Cloud Build を利用して CI / CD(Continuous Integration / Continuous Delivery)の仕組みを導入したことです。CI / CD の導入は、開発の効率化に向けて大きな効果を発揮していると山川氏は語ります。
「新システムは、ソースコード管理に GitLab を使用し、GitLab へのプッシュをトリガーにして Cloud Build によるビルドプロセスが起動する仕組みになっています。ローカルからソースコードをプッシュするだけでビルドまで完了できるのはとても便利で、開発のワークフローがシンプルになり、開発効率が大幅に向上しました。今後、運用方法を定めた上で、Cloud Run へのデプロイの自動化も考えています。」
YYProbe 以外のサービスについても順次 Google Cloud への移行を計画
アイシンでは、YYProbe の他にも YYSystem をベースとしたさまざまなサービスの提供をしています。例えば YYProbe を使って記録した会話は、分析サービスの「YYAnalytics」を使用することでデータの集計や分析を行い、分析結果をブラウザで見ることができます。その他に、まだ一般公開には至っていないものの、YYSystem の各種機能を API として利用できる API サービスなども開発中です。
YYProbe の Google Cloud への移行が成功したことを受けて、これらのサービスについてもインフラの移行を検討していると山川氏は言います。
「今回 Google Cloud に対するノウハウを蓄積できたことで、YYProbe 以外のシステムについても将来の新しい可能性を考えられるようになりました。たとえば API サービスなどでは、どのタイミングでどれだけのリクエストが送られてくるのか事前にはわからないので、柔軟性が高い Cloud Run が適しているのではないかと考えています。また、マイクロ サービスの考え方を導入したいという気持ちもあります。」
YYProbe についても、まだ挑戦したい課題が残されていると山川氏は続けます。
「YYProbe をオンプレミスで利用したいというお客様も一定数いらっしゃるので、Google Cloud でどのように実現できるのかを検討しています。これについては、ハイブリッド クラウド基盤の Anthos が助けになるのではないかと考えています。また、せっかく Google Cloud に移行したので、Vertex AI などの AI プラットフォームにも注目しています。」
有料のプレミアム プランの提供が始まったことで、YYProbe は今まさにターニング ポイントを迎えており、今後もさまざまな分野に展開していきたいと山川氏は意欲を高めています。
「現在、自治体や病院、ろう学校、民間の NPO 法人など、さまざまなお客様から声を掛けていただいているので、積極的に導入を進めていきたいと考えています。運用の知見が蓄積されてきたので、この展開を進めていけば、もともとのアイデアであった音声データの記録と活用という構想の実現にも着手できると期待しています。」
株式会社アイシンは、クルマの「走る・止まる・曲がる・快適」を支えるグローバル サプライヤーです。グループで手掛ける製品群は多岐にわたり、カーボン ニュートラルや、急速に進むクルマの電動化にも取り組んでいます。また、自動車部品で培った技術を活用して、クルマだけにとどまらない「移動」に関する商品・サービスやエネルギー関連の商品の開発をしています。アイシンは、「 "移動" に感動を、未来に笑顔を。」を経営理念に、さまざまな社会課題を解決し、笑顔あふれる持続的な社会づくりに貢献していきます。
インタビュイー
・先進開発部 第4開発室 YYSystemプロジェクト 山川 隼輝 氏
株式会社アイシンの導入事例 PDF はこちらをご覧ください。
その他の導入事例はこちらをご覧ください。