Suporte a idiomas em modelos personalizados

Os modelos do AutoML Translation são compatíveis com os pares de idiomas a seguir. Um idioma compatível significa que o Google tem um modelo de tradução automática neural (NMT) para esse idioma, que o AutoML Translation usa como base para criar um modelo personalizado durante o treinamento.

As setas indicam os idiomas de origem e de chegada aceitos para tradução. Por exemplo, há suporte do inglês para o alemão e vice-versa.

Par de idiomas Códigos de idiomas
Africâner <-> Inglês af <-> en
Albanês <-> Inglês sq <-> en
Árabe <-> Inglês ar <-> en
Azerbaijano <-> Inglês az <-> en
Bengali <-> Inglês bn <-> en
Búlgaro <-> Inglês bg <-> en
Catalão <-> Inglês ca <-> en
Chinês (simplificado) <-> Inglês zh-CN * <-> en
Chinês (tradicional) <-> Inglês zh-TW <-> en
Croata <-> Inglês hr <-> en
Tcheco <-> Inglês cs <-> en
Dinamarquês <-> Inglês da <-> en
Holandês <-> Inglês nl <-> en
Estoniano <-> Inglês et <-> en
Filipino <-> Inglês fil <-> en
Finlandês <-> Inglês fi <-> en
Francês <-> Inglês fr <-> en
Galego <-> Inglês gl <-> en
Georgiano <-> Inglês ka <-> en
Alemão <-> Inglês de <-> en
Grego <-> Inglês el <-> en
Guzerati <-> Inglês gu <-> en
Crioulo haitiano <-> Inglês ht <-> en
Hebraico <-> Inglês iw <-> en
Hindi <-> Inglês hi <-> en
Húngaro <-> Inglês hu <-> en
Islandês <-> Inglês is <-> en
Indonésio <-> Inglês id <-> en
Italiano <-> Inglês it <-> en
Japonês <-> Inglês ja <-> en
Javanês <-> Inglês jv <-> en
Khmer <-> Inglês km <-> en
Coreano <-> Inglês ko <-> en
Letão <-> Inglês lv <-> en
Lituano <-> Inglês lt <-> en
Malaio <-> Inglês ms <-> en
Marata <-> Inglês mr <-> en
Mianmar (birmanês) <-> Inglês my <-> en
Nepalês <-> Inglês ne <-> en
Norueguês <-> Inglês no <-> en
Pashto <-> Inglês ps <-> en
Persa <-> Inglês fa <-> en
Polonês <-> Inglês pl <-> en
Português <-> Inglês pt <-> en
Punjabi <-> Inglês pa <-> en
Romeno <-> Inglês ro <-> en
Russo <-> Inglês ru <-> en
Sérvio <-> Inglês sr <-> en
Eslovaco <-> Inglês sk <-> en
Esloveno <-> Inglês sl <-> en
Espanhol <-> Inglês es <-> en
Suaíli <-> Inglês sw <-> en
Sueco <-> Inglês sv <-> en
Tâmil <-> Inglês ta <-> en
Telugo <-> Inglês te <-> en
Tailandês <-> Inglês th <-> en
Turco <-> Inglês tr <-> en
Ucraniano <-> Inglês uk <-> en
Urdu <-> Inglês ur <-> en
Uzbeque <-> Inglês uz <-> en
Vietnamita <-> Inglês vi <-> en
Galês <-> Inglês cy <-> en
Zulu <-> English zu <-> en

* O chinês simplificado pode ser especificado por zh-CN ou zh.

Códigos compatíveis para variantes de idioma

É possível usar os códigos de idioma a seguir, que são variantes dos idiomas compatíveis na tabela anterior. É possível usar esses códigos como o idioma de origem ou de chegada ao criar conjuntos de dados.

O Google não tem modelos NMT de base para esses idiomas. Em vez disso, o AutoML Translation usa o modelo base associado da variante de idioma para o treinamento de modelos personalizados.

O uso desses códigos é útil, por exemplo, quando você traduz conteúdo para um dialeto ou região específicos. Por exemplo, suponha que você tenha dados localizados para zh-HK para os quais quer criar um modelo personalizado. Ao realizar traduções, é possível especificar o código de idioma zh-HK, que aponta para seu modelo personalizado e produz traduções mais precisas para essa localidade.

A tabela a seguir lista os códigos de idioma, as descrições e os modelos base associados que o AutoML Translation usa ao treinar modelos personalizados.

Código do idioma Descrição Modelo base
zh-HK Hong Kong (tradicional) zh-TW