Crie um modelo de tradução personalizado
Forme e use um modelo de tradução personalizado através da Google Cloud consola. O exemplo seguinte usa o AutoML Translation para preparar um modelo de tradução de inglês para espanhol usando um conjunto de dados que contém pares de segmentos orientados para a tecnologia da localização de software.
Antes de começar
Antes de poder começar a usar o AutoML Translation, o seu projeto tem de ter a API Cloud Translation ativada, e tem de ter as autorizações concedidas pelas seguintes funções:
- Função de leitor para ver os recursos existentes no seu projeto
- Função Editor da Cloud Translation API para criar e gerir conjuntos de dados e modelos
- Função Administrador de armazenamento para carregar dados de preparação para um segmento do Cloud Storage
Crie um conjunto de dados de tradução e importe pares de segmentos
Transfira o ficheiro de arquivo que contém os dados de exemplo para preparar o modelo e extraia os ficheiros.
Para este tutorial, vai usar o ficheiro TSV de inglês para espanhol.
Aceda à consola do AutoML Translation.
No painel de navegação, clique em Conjuntos de dados para aceder à página Conjuntos de dados.
Clique em Criar conjunto de dados.
Na caixa de diálogo Criar conjunto de dados, especifique os detalhes sobre o conjunto de dados:
- Introduza
tutorial_dataset
como o nome do conjunto de dados. - Selecione Inglês (EN) como idioma de origem na lista pendente.
- Selecione Espanhol (ES) como idioma de destino.
- Clique em Criar.
- Introduza
Após a criação do conjunto de dados, clique no nome do conjunto de dados para ver os respetivos detalhes.
Aceda ao separador Importar e carregue o conjunto de dados
en-es.tsv
para o Cloud Storage:- Selecione Carregar ficheiros do computador.
- Clique em Selecionar ficheiros e escolha o ficheiro
en-es.tsv
que transferiu e extraiu anteriormente. - Clique em Procurar para selecionar ou criar um novo contentor do Cloud Storage
onde o ficheiro TSV está armazenado. A região do contentor tem de ser
us-central1
.
Clique em Continuar.
O AutoML Translation divide automaticamente os seus dados em conjuntos de preparação, validação e testes. Pode ver estas divisões e os pares de frases importados no separador Frases do conjunto de dados.
Prepare um modelo
Aceda à consola do AutoML Translation.
No painel de navegação, aceda à página Conjuntos de dados.
Clique no conjunto de dados tutorial_dataset.
Aceda ao separador Formar.
Clique em Iniciar preparação, que abre o painel Preparar novo modelo.
Introduza
tutorial_model
para o nome do modelo.Clique em Iniciar preparação.
A preparação de um modelo pode demorar várias horas a ser concluída.
Avalie o modelo
Verifique a comparação do modelo com o modelo de TMR da Google predefinido que se baseia em pares de segmentos do seu conjunto de testes.
Aceda à consola do AutoML Translation.
No painel de navegação, aceda à página Modelos.
Clique no modelo tutorial_model.
Clique no separador Avaliar.
Na secção Avaliações anteriores, o Cloud Translation mostra a pontuação BLEU do seu modelo em comparação com o modelo NMT da Google. A pontuação BLEU (Bilingual Evaluation Understudy) indica a semelhança do texto candidato com os textos de referência. Os valores mais próximos de 100 representam textos mais semelhantes.
Use o modelo de tradução
Na Google Cloud consola, pode usar o seu modelo personalizado para traduzir algum texto.
Aceda à consola do AutoML Translation.
No painel de navegação, aceda à página Modelos.
Clique no modelo tutorial_model.
Clique no separador Prever.
Na caixa de texto Inglês, introduza o texto a traduzir e, de seguida, clique em Traduzir.
Pode comparar os resultados do seu modelo personalizado com o modelo NMT da Google.
Limpar
Para evitar Google Cloud cobranças desnecessárias, elimine o modelo, o conjunto de dados e o ficheiro en-es.tsv
. Também pode usar o comando
Google Cloud console para eliminar o seu projeto se não precisar dele.
O que se segue?
- Para saber mais acerca dos modelos personalizados, consulte o guia para principiantes.
- Para criar o seu próprio conjunto de dados e modelo personalizado, consulte o artigo Prepare os dados de preparação para ver instruções sobre como preparar os dados.