Configure um projeto de reconhecimento de voz

Esta página ajuda a configurar um projeto para usar o serviço Speech-to-Text. Este processo inclui a criação de um projeto, a ativação da API Speech-to-Text, a instalação de bibliotecas de clientes, a definição de variáveis de ambiente e a autenticação das suas credenciais. Se está a usar a Vertex AI pela primeira vez, saiba mais sobre as funcionalidades de reconhecimento de voz.

Configura um projeto de reconhecimento de voz através da consola GDC e da CLI gdcloud da seguinte forma:

  • Consola GDC: ative a API Speech-to-Text e veja o estado do serviço e o ponto final.
  • A CLI gdcloud: configure contas de serviço para interagir com a API Speech-to-Text, instale bibliotecas cliente e autentique pedidos de API.

Criar um projeto

A criação de um projeto de reconhecimento de voz organiza os seus recursos de conversão de voz em texto, que incluem colaboradores, APIs ativadas, credenciais de autenticação e controlos de acesso.

Para criar o seu projeto, consulte o artigo Configure um projeto para o Vertex AI. Precisa do ID do projeto quando faz chamadas API.

Peça autorizações de programador

Tem de ter a função de programador de voz de IA no seu projeto para aceder às funcionalidades de reconhecimento de voz e gerar um token de API para autenticação e autorização de pedidos.

Peça ao administrador de IAM do projeto para conceder a função de programador de IA de voz (ai-speech-developer) ao seu utilizador ou conta de serviço no espaço de nomes do projeto. Para informações sobre esta função, consulte o artigo Prepare as autorizações de IAM.

Ative a Speech-to-Text API

Tem de ativar a API pré-preparada Speech-to-Text para o seu projeto. Se estiver ativada, pode ver o estado do serviço e o ponto final da API pré-treinada Speech-to-Text.

Instale bibliotecas de cliente

As bibliotecas cliente estão disponíveis para a linguagem de programação Python. Recomendamos que use estas bibliotecas cliente para fazer chamadas para a API Speech-to-Text, porque facilitam o acesso às APIs.

Instale a biblioteca cliente Speech-to-Text e siga estes passos para garantir que tem a versão correta:

  1. Verifique se a biblioteca de cliente Speech-to-Text está instalada e obtenha o número da versão:

    pip freeze | grep speech
    

    Se a biblioteca de cliente já estiver instalada, recebe um resultado semelhante ao seguinte exemplo:

    google-cloud-speech==2.15.0
    

    O número da versão que obtém tem de corresponder à biblioteca cliente no seguinte ponto final:

    https://GDC_URL/.well-known/static/client-libraries
    

    Substitua GDC_URL pelo URL da sua organização no GDC.

  2. Se os números das versões não corresponderem, desinstale a biblioteca de cliente:

    pip uninstall google-cloud-speech
    
  3. Se desinstalou a biblioteca cliente Speech-to-Text, tem de a reinstalar especificando o nome do ficheiro correspondente ao seu sistema operativo.

Defina as variáveis de ambiente

Depois de instalar a biblioteca cliente Speech-to-Text, pode interagir com a API a partir de um script Python.

Se configurar uma conta de serviço no seu projeto para fazer chamadas API autorizadas de forma programática, pode definir variáveis de ambiente no script Python para aceder a valores como as chaves da conta de serviço durante a execução.

Siga estes passos para definir as variáveis de ambiente necessárias num script Python:

  1. Crie um script Python.

  2. Adicione o seguinte código ao script Python:

    import os
    
    os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "APPLICATION_DEFAULT_CREDENTIALS_FILENAME"
    

    Substitua APPLICATION_DEFAULT_CREDENTIALS_FILENAME pelo nome do ficheiro JSON que contém as chaves da conta de serviço que criou no projeto, como my-service-key.json.

  3. Guarde o script Python com um nome, como speech.py.

  4. Execute o script Python para definir as variáveis de ambiente:

    python SCRIPT_NAME
    

    Substitua SCRIPT_NAME pelo nome que deu ao seu script Python, como speech.py.

Configure a autenticação

Antes de poder começar a usar a API Speech-to-Text, tem de autenticar as suas credenciais de cliente e pedir acesso à conta dos recursos do seu projeto. Para mais informações, consulte o artigo Autenticar pedidos de API.