O Media Translation traduz um arquivo de áudio ou stream de fala para texto de outro idioma. Nesta página, fornecemos exemplos de código que mostram como traduzir áudio de streaming para texto usando bibliotecas de cliente do Media Translation.
Criar o projeto
Antes de usar o Media Translation, você precisa configurar um projeto do Google Cloud e ativar a API Media Translation para esse projeto.
- Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative a API Media Translation.
-
Crie uma conta de serviço:
-
No Console do Google Cloud, acesse a página Criar conta de serviço.
Acesse "Criar conta de serviço" - Selecione o projeto.
-
No campo Nome da conta de serviço, insira um nome. O Console do Google Cloud preenche o campo ID da conta de serviço com base nesse nome.
No campo Descrição da conta de serviço, insira uma descrição. Por exemplo,
Service account for quickstart
. - Clique em Criar e continuar.
-
Conceda o papel Project > Owner à conta de serviço do.
Para conceder o papel, encontre a lista Selecionar um papel e clique em Project > Owner.
- Clique em Continuar.
-
Clique em Concluído para terminar a criação da conta de serviço.
Não feche a janela do navegador. Você vai usá-la na próxima etapa.
-
-
Crie uma chave de conta de serviço:
- No console do Google Cloud, clique no endereço de e-mail da conta de serviço que você criou.
- Clique em Chaves.
- Clique em Adicionar chave e em Criar nova chave.
- Clique em Criar. O download de um arquivo de chave JSON é feito no seu computador.
- Clique em Fechar.
-
Defina a variável de ambiente
GOOGLE_APPLICATION_CREDENTIALS
como o caminho do arquivo JSON que contém suas credenciais. Essa variável só se aplica à sessão de shell atual. Assim, se você abrir uma nova sessão, precisará definir a variável novamente. - Instale a CLI do Google Cloud.
-
Para inicializar a CLI gcloud, execute o seguinte comando:
gcloud init
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative a API Media Translation.
-
Crie uma conta de serviço:
-
No Console do Google Cloud, acesse a página Criar conta de serviço.
Acesse "Criar conta de serviço" - Selecione o projeto.
-
No campo Nome da conta de serviço, insira um nome. O Console do Google Cloud preenche o campo ID da conta de serviço com base nesse nome.
No campo Descrição da conta de serviço, insira uma descrição. Por exemplo,
Service account for quickstart
. - Clique em Criar e continuar.
-
Conceda o papel Project > Owner à conta de serviço do.
Para conceder o papel, encontre a lista Selecionar um papel e clique em Project > Owner.
- Clique em Continuar.
-
Clique em Concluído para terminar a criação da conta de serviço.
Não feche a janela do navegador. Você vai usá-la na próxima etapa.
-
-
Crie uma chave de conta de serviço:
- No console do Google Cloud, clique no endereço de e-mail da conta de serviço que você criou.
- Clique em Chaves.
- Clique em Adicionar chave e em Criar nova chave.
- Clique em Criar. O download de um arquivo de chave JSON é feito no seu computador.
- Clique em Fechar.
-
Defina a variável de ambiente
GOOGLE_APPLICATION_CREDENTIALS
como o caminho do arquivo JSON que contém suas credenciais. Essa variável só se aplica à sessão de shell atual. Assim, se você abrir uma nova sessão, precisará definir a variável novamente. - Instale a CLI do Google Cloud.
-
Para inicializar a CLI gcloud, execute o seguinte comando:
gcloud init
- Instale a biblioteca de cliente na linguagem de sua preferência.
Tradução de fala
Os exemplos de código abaixo mostram como traduzir a fala de um arquivo que contém até cinco minutos de áudio ou de um microfone ao vivo. Veja recomendações sobre como fornecer dados de fala para ter a melhor precisão no reconhecimento em Práticas recomendadas.
As principais etapas são as mesmas, independentemente da fonte de áudio:
Inicialize um cliente
SpeechTranslationServiceClient
e o use para enviar solicitações ao Media Translation.Você pode reutilizar o mesmo cliente para várias solicitações.
Crie um objeto de solicitação
StreamingTranslateSpeechConfig
que especifique como processar o áudio.O objeto
StreamingTranslateSpeechConfig
consiste em um objetoTranslateSpeechConfig
que fornece informações sobre o arquivo de origem de áudio e em umasingle_utterance
propriedade que especifica se o Media Translation continuará traduzindo quando o orador parar de falar.O objeto
TranslateSpeechConfig
fornece especificações técnicas da fonte de áudio (como codificação e taxa de amostragem), define os idiomas de origem e de destino da tradução (usando os códigos BCP-47) e indica qual modelo de tradução a Media Translation usará na transcrição.Envie uma sequência de objetos de solicitação
StreamingTranslateSpeechRequest
.Envie uma sequência de solicitações para cada arquivo de áudio que você quer traduzir. A primeira solicitação fornece o objeto
StreamingTranslateSpeechConfig
para a solicitação, e as solicitações seguintes fornecem o conteúdo de áudio em streaming.Receba o objeto de resposta
StreamingTranslateSpeechResult
.Embora qualquer resposta com o valor
false
paratext_translation_result.is_final
seja recebida, o resultado traduzido mais recente substituirá o resultado anterior.Quando a Media Translation tiver um resultado final, o campo
text_translation_result.is_final
será definido comotrue
e qualquer resultado de tradução recebido posteriormente será anexado ao resultado anterior. Nessa instância, o resultado anterior não é substituído. É possível produzir a tradução concluída e começar com uma nova seção para a próxima parte da transcrição e do áudio correspondente.Quando o orador parar de falar, se o campo
single_utterance
estiver definido como "true" noStreamingTranslateSpeechConfig
objeto de solicitação, a Media Translation retornará um eventoEND_OF_SINGLE_UTTERANCE
paraspeech_event_type
na resposta. O cliente deixará de enviar solicitações, mas continuará a receber respostas até a conclusão da tradução.O streaming tem um limite de 5 minutos. Se esse limite for excedido, o erro OUT_OF_RANGE será retornado.
Amostras de código
Como traduzir fala de um arquivo de áudio
Java
Para saber como instalar e usar a biblioteca de cliente da Media Translation, consulte Bibliotecas de cliente da Media Translation. Para mais informações, consulte a documentação de referência da API Media Translation em Java.
Para autenticar no Media Translation, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca de cliente da Media Translation, consulte Bibliotecas de cliente da Media Translation. Para mais informações, consulte a documentação de referência da API Media Translation em Node.js.
Para autenticar no Media Translation, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca de cliente da Media Translation, consulte Bibliotecas de cliente da Media Translation. Para mais informações, consulte a documentação de referência da API Media Translation em Python.
Para autenticar no Media Translation, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Como traduzir fala de um microfone
Java
Para saber como instalar e usar a biblioteca de cliente da Media Translation, consulte Bibliotecas de cliente da Media Translation. Para mais informações, consulte a documentação de referência da API Media Translation em Java.
Para autenticar no Media Translation, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca de cliente da Media Translation, consulte Bibliotecas de cliente da Media Translation. Para mais informações, consulte a documentação de referência da API Media Translation em Node.js.
Para autenticar no Media Translation, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca de cliente da Media Translation, consulte Bibliotecas de cliente da Media Translation. Para mais informações, consulte a documentação de referência da API Media Translation em Python.
Para autenticar no Media Translation, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.