Documentação do Speech-to-Text On-Prem

Visão geral

O Speech-to-Text On-Prem permite a fácil integração das tecnologias de reconhecimento de fala do Google em soluções no local. A solução STT On-Prem oferece controle total sobre a infraestrutura e os dados de fala protegidos para atender aos requisitos de conformidade e residência de dados. Oferece a melhor tecnologia de machine learning e o acesso a modelos de reconhecimento de fala de última geração, que são mais precisos, menores e exigem menos recursos de computação para serem executados, se comparado às soluções atuais.

O Speech-to-Text On-Prem é um aplicativo do Google Cloud Marketplace e pode ser implantado como um contêiner em qualquer cluster do GKE. Isso oferece flexibilidade e maior controle na implantação, seja para implantar no Google Cloud com o GKE ou no local com o Anthos. Assim, você pode aproveitar a simplicidade, a agilidade e a economia da hospedagem e o gerenciamento de contêineres do Google em ambientes híbridos.

Principais recursos
Transcrição de alta qualidade Aplique os algoritmos avançados de rede neural de aprendizado profundo do Google ao reconhecimento automático de fala.
Implante em qualquer lugar Execute em qualquer cluster do GKE ou do Anthos.
Modelos eficientes Implante de maneira eficiente com modelos de tamanho inferior a 1 GB que consomem recursos mínimos.
Compatível com APIs Compatibilidade completa com a API Speech-to-Text e as bibliotecas de cliente dela.
Malha de serviço do Istio Use nossos objetos pré-criados do Istio para escalonar facilmente até milhares de conexões.
Integração com o Stackdriver Exporte registros de metadados para um local centralizado.
Idiomas compatíveis Ofereça suporte à base de usuários global com os idiomas inglês, francês, espanhol, cantonês e japonês.

Arquitetura de referência

Implantação e instalação

  1. Consulte a página de preços do Speech-to-Text On-Prem para ver um resumo de como o custo é calculado.
  2. Entre em contato com o vendedor para ter acesso à solução.
  3. Implante o aplicativo no cluster.
  4. Configure a biblioteca de cliente escolhida para acessar a implantação.
  5. Comece a transcrever arquivos de áudio.