Esta página descreve como ativar o reconhecimento de idiomas para pedidos de transcrição de áudio enviados para o Speech-to-Text.
Em algumas situações, não sabe ao certo que idioma contêm as suas gravações de áudio. Por exemplo, se publicar o seu serviço, app ou produto num país com vários idiomas oficiais, pode receber introdução de áudio de utilizadores numa variedade de idiomas. Isto pode tornar a especificação de um único código de idioma para pedidos de transcrição significativamente mais difícil.
Reconhecimento de vários idiomas
A API Speech-to-Text oferece uma forma de especificar um conjunto de idiomas alternativos que os seus dados de áudio podem conter. Quando envia uma solicitação de transcrição de áudio para o Speech-to-Text, pode fornecer uma lista de idiomas adicionais que os dados de áudio podem incluir. Se incluir uma lista de idiomas no seu pedido, o Speech-to-Text tenta transcrever o áudio com base no idioma que melhor se adapta à amostra das alternativas que fornece. Em seguida, a conversão de voz em texto etiqueta os resultados da transcrição com o código de idioma previsto.
Esta funcionalidade é ideal para apps que precisam de transcrever declarações curtas, como comandos de voz ou pesquisas. Pode indicar até três idiomas alternativos entre os que o Speech-to-Text suporta além do seu idioma principal (para um total de quatro idiomas).
Embora possa especificar idiomas alternativos para o seu pedido de transcrição de voz, tem de fornecer um código de idioma principal no campo languageCode
. Além disso, deve restringir o número de idiomas que pede ao mínimo necessário. Quanto menos códigos de idiomas alternativos pedir, mais facilmente o Speech-to-Text seleciona o correto. A especificação de apenas um idioma
produz os melhores resultados.
Ative o reconhecimento de idiomas em pedidos de transcrição de áudio
Para especificar idiomas alternativos na transcrição de áudio,
tem de definir o campo alternativeLanguageCodes
para uma lista de
códigos de idioma nos parâmetros RecognitionConfig
do pedido. A API Speech-to-Text suporta
códigos de idiomas alternativos para todos os métodos de reconhecimento de voz:
speech:recognize
,
speech:longrunningrecognize
e Streaming.
Use um ficheiro local
Protocolo
Consulte o ponto final da API speech:recognize
para ver os detalhes completos.
Para realizar o reconhecimento de voz síncrono, faça um pedido POST
e forneça o corpo do pedido adequado. O exemplo seguinte mostra um pedido POST
com curl
. O exemplo usa a Google Cloud CLI para gerar um token de acesso. Para ver instruções sobre a instalação da CLI gcloud,
consulte o início rápido.
O exemplo seguinte mostra como pedir a transcrição de um ficheiro de áudio que pode incluir voz em alemão, francês ou inglês.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "alternativeLanguageCodes": ["fr-FR", "de-DE"], "model": "command_and_search" }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }' > multi-language.txt
Se o pedido for bem-sucedido, o servidor devolve um código de estado HTTP 200 OK
e a resposta no formato JSON, guardada num ficheiro com o nome multi-language.txt
.
{ "results": [ { "alternatives": [ { "transcript": "hi I'd like to buy a Chromecast I'm ..." "confidence": 0.9466864 } ], "languageCode": "en-us" }, { "alternatives": [ { "transcript": " let's go with the black one", "confidence": 0.9829583 } ], "languageCode": "en-us" }, ] }
Java
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Java Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Node.js Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Python Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Use um ficheiro remoto
Java
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Java Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Node.js Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Python Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.