A API Speech-to-Text v2 oferece o design mais recente da API Google Cloud para que os clientes atendam aos requisitos regulamentares e de segurança empresarial.
Esses requisitos são atendidos por meio do seguinte:
Residência dos dados: o Speech-to-Text v2 oferece uma ampla variedade de nossos modelos de transcrição existentes em Regiões doGoogle Cloud como a Bélgica ou Singapura. Assim, é possível fazer a invocação dos modelos de transcrição por meio de um serviço totalmente regionalizado.
Versatilidade do reconhecedor: os reconhecedores são configurações de reconhecimento reutilizáveis que podem conter uma combinação de modelo, linguagem e recursos. Essa implementação versátil elimina a necessidade de contas de serviço dedicadas para autenticação e autorização.
Geração de registros: a criação de recursos e as transcrições geram registros disponíveis no console do Google Cloud , o que permite melhor telemetria e depuração.
Criptografia: o Speech-to-Text v2 é compatível com chaves de criptografia gerenciadas pelo cliente para todos os recursos, bem como para a transcrição em lote.
Detecção automática de áudio: o Speech-to-Text v2 pode detectar automaticamente a taxa de amostragem, a contagem de canais e o formato dos arquivos de áudio, sem a necessidade de fornecer essas informações na configuração da solicitação.
Como migrar da v1 para a v2
A migração da API v1 para a API v2 não acontece automaticamente. São necessárias alterações mínimas na implementação para aproveitar o conjunto de recursos.
Migração na API
Assim como no Speech-to-Text v1, para transcrever o áudio,
você precisa criar um RecognitionConfig
selecionando o idioma do áudio e o modelo de reconhecimento de sua
escolha:
Python
Se necessário, selecione uma região em que você quer usar a API Speech-to-Text e verifique a disponibilidade de idioma e modelo nessa região:
Python
Como opção, crie um recurso reconhecedor se precisar reutilizar uma configuração de reconhecimento específica em muitas solicitações de transcrição:
Python
Há outras diferenças nas solicitações e respostas na nova API v2. Para mais detalhes, consulte a documentação de referência.
Migração na IU
Para fazer a migração usando o console do Speech Google Cloud , siga estas etapas:
Acesse o console do Speech Google Cloud .
Navegue até a página Transcrições.
Clique em Nova Transcrição e selecione seu áudio na guia Configuração de áudio.
Na guia Opções de transcrição, selecione V2.