A API Speech-to-Text v2 oferece o design de API mais recente para que os clientes cumpram os requisitos regulamentares e de segurança empresariais de imediato. Google Cloud
Estes requisitos são concretizados através do seguinte:
Residência de dados: o Speech-to-Text v2 oferece a vasta gama dos nossos modelos de transcrição existentes em Google Cloud regiões, como a Bélgica ou Singapura. Isto permite a invocação dos nossos modelos de transcrição através de um serviço totalmente regionalizado.
Engenhosidade do reconhecedor: os reconhecedores são configurações de reconhecimento reutilizáveis que podem conter uma combinação de modelo, idioma e funcionalidades.
Registo: a criação de recursos e as transcrições geram registos disponíveis na consola Google Cloud , o que permite uma melhor telemetria e depuração.
Encriptação: o Speech-to-Text v2 suporta chaves de encriptação geridas pelo cliente para todos os recursos, bem como a transcrição em lote.
Deteção automática de áudio: o Speech-to-Text v2 pode detetar automaticamente a taxa de amostragem, a contagem de canais e o formato dos seus ficheiros de áudio, sem necessidade de fornecer essas informações na configuração do pedido.
Migrar da v1 para a v2
A migração da API v1 para a API v2 não ocorre automaticamente. São necessárias alterações de implementação mínimas para tirar partido do conjunto de funcionalidades.
Migrar na API
Semelhante à API Speech-to-Text v1, para transcrever áudio,
tem de criar um RecognitionConfig
selecionando o idioma do áudio e o modelo de reconhecimento à sua escolha:
Python
Se necessário, selecione uma região na qual quer usar a API Speech-to-Text e verifique a disponibilidade de idiomas e modelos nessa região:
Python
Opcionalmente, crie um recurso de reconhecedor se precisar de reutilizar uma configuração de reconhecimento específica em vários pedidos de transcrição:
Python
Existem outras diferenças nos pedidos e nas respostas na nova API v2. Para mais detalhes, consulte a documentação de referência.
Migração na IU
Para migrar através da consola Speech Google Cloud , siga estes passos:
Aceda à consola Google Cloud do Speech.
Navegue para a página Transcrição.
Clique em Nova transcrição e selecione o áudio no separador Configuração de áudio.
No separador Opções de transcrição, selecione V2.
O que se segue?
- Use bibliotecas cliente para transcrever áudio com a sua linguagem de programação favorita.
- Pratique a transcrição de ficheiros de áudio curtos.
- Saiba como transcrever áudio em streaming.
- Saiba como transcrever ficheiros de áudio longos.