A API Speech-to-Text v2 oferece o design mais recente da API Google Cloud para que os clientes atendam aos requisitos regulamentares e de segurança empresarial.
Esses requisitos são atendidos com o seguinte:
Residência dos dados: a Speech-to-Text v2 oferece uma ampla variedade de nossos modelos de transcrição atuais em regiões doGoogle Cloud como a Bélgica ou Singapura. Assim, é possível fazer a invocação dos modelos de transcrição usando um serviço totalmente regionalizado.
Versatilidade do reconhecedor: os reconhecedores são configurações de reconhecimento reutilizáveis que podem conter uma combinação de modelo, linguagem e recursos.
Geração de registros: a criação de recursos e as transcrições geram registros que ficam disponíveis no console do Google Cloud , permitindo melhor telemetria e depuração.
Criptografia: a Speech-to-Text v2 aceita chaves de criptografia gerenciadas pelo cliente para todos os recursos, bem como para transcrição em lote.
Detecção automática de áudio: a Speech-to-Text v2 pode detectar automaticamente a taxa de amostragem, a contagem de canais e o formato de arquivos de áudio, sem que você precise fornecer essas informações na configuração da solicitação.
Como migrar da v1 para a v2
A migração da v1 para a v2 da API não acontece automaticamente. São necessárias alterações mínimas na implementação para aproveitar o conjunto de recursos.
Como migrar na API
Assim como na Speech-to-Text v1, para transcrever áudios,
você precisa criar um RecognitionConfig
selecionando o idioma do áudio e o modelo de reconhecimento de sua
escolha:
Python
Se necessário, selecione uma região em que você quer usar a API Speech-to-Text e verifique a disponibilidade de idioma e modelo nessa região:
Python
Também é possível criar um recurso reconhecedor para reutilizar uma configuração de reconhecimento específica em muitas solicitações de transcrição:
Python
Há outras diferenças nas solicitações e respostas na nova API v2. Para mais detalhes, consulte a documentação de referência.
Como migrar na interface
Para fazer a migração usando o console da Speech Google Cloud , siga estas etapas:
Acesse o console da Speech Google Cloud .
Navegue até a página Transcrições.
Clique em Nova transcrição e selecione o áudio na guia Configuração de áudio.
Na guia Opções de transcrição, selecione V2.
A seguir
- Use bibliotecas de cliente para transcrever áudios usando sua linguagem de programação preferencial.
- Pratique a transcrição de arquivos de áudio curtos.
- Aprenda a transcrever um áudio de streaming.
- Aprenda a transcrever arquivos de áudio longos.