Crie um modelo de tradução personalizado

Forme e use um modelo de tradução personalizado através da Google Cloud consola. O exemplo seguinte usa o AutoML Translation para preparar um modelo de tradução de inglês para espanhol usando um conjunto de dados que contém pares de segmentos orientados para a tecnologia da localização de software.

Antes de começar

Antes de poder começar a usar o AutoML Translation, o seu projeto tem de ter a API Cloud Translation ativada, e tem de ter as autorizações concedidas pelas seguintes funções:

  • Função de leitor para ver os recursos existentes no seu projeto
  • Função Editor da Cloud Translation API para criar e gerir conjuntos de dados e modelos
  • Função Administrador de armazenamento para carregar dados de preparação para um segmento do Cloud Storage

Crie um conjunto de dados de tradução e importe pares de segmentos

  1. Transfira o ficheiro de arquivo que contém os dados de exemplo para preparar o modelo e extraia os ficheiros.

    Para este tutorial, vai usar o ficheiro TSV de inglês para espanhol.

  2. Aceda à consola do AutoML Translation.

    Aceder à página de tradução

  3. No painel de navegação, clique em Conjuntos de dados para aceder à página Conjuntos de dados.

  4. Clique em Criar conjunto de dados.

  5. Na caixa de diálogo Criar conjunto de dados, especifique os detalhes sobre o conjunto de dados:

    1. Introduza tutorial_dataset como o nome do conjunto de dados.
    2. Selecione Inglês (EN) como idioma de origem na lista pendente.
    3. Selecione Espanhol (ES) como idioma de destino.
    4. Clique em Criar.
  6. Após a criação do conjunto de dados, clique no nome do conjunto de dados para ver os respetivos detalhes.

  7. Aceda ao separador Importar e carregue o conjunto de dados en-es.tsv para o Cloud Storage:

    1. Selecione Carregar ficheiros do computador.
    2. Clique em Selecionar ficheiros e escolha o ficheiro en-es.tsv que transferiu e extraiu anteriormente.
    3. Clique em Procurar para selecionar ou criar um novo contentor do Cloud Storage onde o ficheiro TSV está armazenado. A região do contentor tem de ser us-central1.
  8. Clique em Continuar.

    O AutoML Translation divide automaticamente os seus dados em conjuntos de preparação, validação e testes. Pode ver estas divisões e os pares de frases importados no separador Frases do conjunto de dados.

Prepare um modelo

  1. Aceda à consola do AutoML Translation.

    Aceder à página de tradução

  2. No painel de navegação, aceda à página Conjuntos de dados.

  3. Clique no conjunto de dados tutorial_dataset.

  4. Aceda ao separador Formar.

  5. Clique em Iniciar preparação, que abre o painel Preparar novo modelo.

  6. Introduza tutorial_model para o nome do modelo.

  7. Clique em Iniciar preparação.

A preparação de um modelo pode demorar várias horas a ser concluída.

Avalie o modelo

Verifique a comparação do modelo com o modelo de TMR da Google predefinido que se baseia em pares de segmentos do seu conjunto de testes.

  1. Aceda à consola do AutoML Translation.

    Aceder à página de tradução

  2. No painel de navegação, aceda à página Modelos.

  3. Clique no modelo tutorial_model.

  4. Clique no separador Avaliar.

Na secção Avaliações anteriores, o Cloud Translation mostra a pontuação BLEU do seu modelo em comparação com o modelo NMT da Google. A pontuação BLEU (Bilingual Evaluation Understudy) indica a semelhança do texto candidato com os textos de referência. Os valores mais próximos de 100 representam textos mais semelhantes.

Use o modelo de tradução

Na Google Cloud consola, pode usar o seu modelo personalizado para traduzir algum texto.

  1. Aceda à consola do AutoML Translation.

    Aceder à página de tradução

  2. No painel de navegação, aceda à página Modelos.

  3. Clique no modelo tutorial_model.

  4. Clique no separador Prever.

  5. Na caixa de texto Inglês, introduza o texto a traduzir e, de seguida, clique em Traduzir.

    Pode comparar os resultados do seu modelo personalizado com o modelo NMT da Google.

Limpar

Para evitar Google Cloud cobranças desnecessárias, elimine o modelo, o conjunto de dados e o ficheiro en-es.tsv. Também pode usar o comando Google Cloud console para eliminar o seu projeto se não precisar dele.

O que se segue?