Speech-to-Text On-Prem 文档

概览

Speech-to-Text On-Prem 能够将 Google 语音识别技术轻松集成到您的本地解决方案中。借助 STT On-Prem 解决方案,您可以完全控制基础架构和受保护的语音数据,以满足数据驻留和合规性要求。借助这种一流的机器学习技术,您可以使用下一代语音识别模型。与现有的解决方案相比,它们更为小巧,需要的计算资源更少。

Speech-to-Text On-Prem 是一款 Google Cloud Marketplace 应用,可作为容器部署到任何 GKE 集群。无论是使用 GKE 在 Google Cloud 上部署还是使用 Anthos 在本地部署,您都可以灵活并更好地控制部署过程。您可以充分享受 Google 在混合环境中的容器托管和管理带来的简便性、敏捷性和成本效益。

主要功能
高质量的转录 将 Google 先进的深度学习神经网络算法应用于自动语音识别。
可在任何地方部署 在任何 GKE 或 Anthos 集群中运行。
高效的模型 使用小于 1 GB 且仅消耗最少资源的模型以高效的方式部署。
与 API 兼容 Speech-to-Text API 及其客户端库完全兼容。
Istio 服务网格 使用我们预建的 Istio 对象无缝扩容至数千个连接。
Stackdriver 集成 将元数据日志导出到一个集中位置。
支持的语言 使用英语、法语、西班牙语、粤语和日语为全球用户群提供支持。

参考架构

部署和安装

  1. 如需简要了解费用的计算方式,请参阅 Speech-to-Text On-Prem 价格页面
  2. 联系您的销售代表获取解决方案。
  3. 将应用部署到您的集群。
  4. 配置您选择的客户端库以访问您的部署。
  5. 开始转录音频文件。