Speech-to-Text On-Prem のドキュメント

概要

Speech-to-Text On-Prem では、Google の音声認識技術をオンプレミス ソリューションに簡単に統合できます。STT On-Prem ソリューションを使用すると、データのレジデンシ-とコンプライアンスの要件を満たすために、インフラストラクチャと保護されている音声データを完全に制御できます。この最高レベルの機械学習テクノロジーにより、既存のソリューションよりも、より正確でサイズが少なく、コンピューティング リソースがより少なくて済む、次世代の音声認識モデルにアクセスできます。

Speech-to-Text On-Prem は Google Cloud Marketplace のアプリケーションであり、任意の GKE クラスタにコンテナとしてデプロイできます。これにより、GKE で Google Cloud にデプロイするか、Anthos を使用してオンプレミスにデプロイするかに関係なく、デプロイの柔軟性と管理が向上します。これにより、ハイブリッドな環境全体で Google のコンテナのホスティングと管理のシンプルさ、アジリティ、費用対効果の利点を活用できます。

主な機能
高品質な音声文字変換 Google の高度なディープ ラーニングのニューラル ネットワーク アルゴリズムを利用して、自動音声認識を実現します。
どこにでもデプロイ可能 GKE または Anthos クラスタで実行します。
効率的なモデル サイズが 1 GB 未満のモデルを使って効率的にデプロイし、最小限のリソースだけを消費します。
API との互換性 Speech-to-Text API とそのクライアント ライブラリと完全に互換です。
Istio サービス メッシュ 事前構築済み Istio オブジェクトを使用すると、数千もの接続をシームレスにスケールアップできます。
Stackdriver の統合 メタデータ ログを 1 か所にエクスポートします。
サポートされている言語 英語、フランス語、スペイン語、広東語、日本語で、世界中のユーザーベースをサポートします。

リファレンス アーキテクチャ

デプロイとインストール

  1. 費用の計算方法の概要については、Speech-to-Text On-Prem 料金ページをご覧ください。
  2. ソリューションにアクセスするには、販売者にお問い合わせしてください。
  3. アプリケーションをクラスタにデプロイします。
  4. 選択したクライアント ライブラリを構成してデプロイにアクセスできるようにします。
  5. 音声ファイルの文字変換を開始します。