Os modelos do AutoML Translation são compatíveis com os pares de idiomas a seguir. Um idioma compatível significa que o Google tem um modelo de tradução automática neural (NMT) para esse idioma, que o AutoML Translation usa como base para criar um modelo personalizado durante o treinamento.
As setas indicam os idiomas de origem e de chegada aceitos para tradução. Por exemplo, há suporte do inglês para o alemão e vice-versa.
Par de idiomas | Códigos de idiomas |
---|---|
Africâner <-> Inglês | af <-> en |
Albanês <-> Inglês | sq <-> en |
Árabe <-> Inglês | ar <-> en |
Azerbaijano <-> Inglês | az <-> en |
Bengali <-> Inglês | bn <-> en |
Búlgaro <-> Inglês | bg <-> en |
Catalão <-> Inglês | ca <-> en |
Chinês (simplificado) <-> Inglês | zh-CN * <-> en |
Chinês (tradicional) <-> Inglês | zh-TW <-> en |
Croata <-> Inglês | hr <-> en |
Tcheco <-> Inglês | cs <-> en |
Dinamarquês <-> Inglês | da <-> en |
Holandês <-> Inglês | nl <-> en |
Estoniano <-> Inglês | et <-> en |
Filipino <-> Inglês | fil <-> en |
Finlandês <-> Inglês | fi <-> en |
Francês <-> Inglês | fr <-> en |
Galego <-> Inglês | gl <-> en |
Georgiano <-> Inglês | ka <-> en |
Alemão <-> Inglês | de <-> en |
Grego <-> Inglês | el <-> en |
Guzerati <-> Inglês | gu <-> en |
Crioulo haitiano <-> Inglês | ht <-> en |
Hebraico <-> Inglês | iw <-> en |
Hindi <-> Inglês | hi <-> en |
Húngaro <-> Inglês | hu <-> en |
Islandês <-> Inglês | is <-> en |
Indonésio <-> Inglês | id <-> en |
Italiano <-> Inglês | it <-> en |
Japonês <-> Inglês | ja <-> en |
Javanês <-> Inglês | jv <-> en |
Khmer <-> Inglês | km <-> en |
Coreano <-> Inglês | ko <-> en |
Letão <-> Inglês | lv <-> en |
Lituano <-> Inglês | lt <-> en |
Malaio <-> Inglês | ms <-> en |
Marata <-> Inglês | mr <-> en |
Mianmar (birmanês) <-> Inglês | my <-> en |
Nepalês <-> Inglês | ne <-> en |
Norueguês <-> Inglês | no <-> en |
Pashto <-> Inglês | ps <-> en |
Persa <-> Inglês | fa <-> en |
Polonês <-> Inglês | pl <-> en |
Português <-> Inglês | pt <-> en |
Punjabi <-> Inglês | pa <-> en |
Romeno <-> Inglês | ro <-> en |
Russo <-> Inglês | ru <-> en |
Sérvio <-> Inglês | sr <-> en |
Eslovaco <-> Inglês | sk <-> en |
Esloveno <-> Inglês | sl <-> en |
Espanhol <-> Inglês | es <-> en |
Suaíli <-> Inglês | sw <-> en |
Sueco <-> Inglês | sv <-> en |
Tâmil <-> Inglês | ta <-> en |
Telugo <-> Inglês | te <-> en |
Tailandês <-> Inglês | th <-> en |
Turco <-> Inglês | tr <-> en |
Ucraniano <-> Inglês | uk <-> en |
Urdu <-> Inglês | ur <-> en |
Uzbeque <-> Inglês | uz <-> en |
Vietnamita <-> Inglês | vi <-> en |
Galês <-> Inglês | cy <-> en |
Zulu <-> English | zu <-> en |
* O chinês simplificado pode ser especificado por zh-CN
ou zh
.
Códigos compatíveis para variantes de idioma
É possível usar os códigos de idioma a seguir, que são variantes dos idiomas compatíveis na tabela anterior. É possível usar esses códigos como o idioma de origem ou de chegada ao criar conjuntos de dados.
O Google não tem modelos NMT de base para esses idiomas. Em vez disso, o AutoML Translation usa o modelo base associado da variante de idioma para o treinamento de modelos personalizados.
O uso desses códigos é útil, por exemplo, quando você traduz conteúdo para um dialeto ou região específicos. Por exemplo, suponha que você tenha dados localizados para zh-HK
para os quais quer criar um modelo personalizado. Ao realizar traduções, é possível especificar o código de idioma zh-HK
, que aponta para seu modelo personalizado e produz traduções mais precisas para essa localidade.
A tabela a seguir lista os códigos de idioma, as descrições e os modelos base associados que o AutoML Translation usa ao treinar modelos personalizados.
Código do idioma | Descrição | Modelo base |
---|---|---|
zh-HK |
Hong Kong (tradicional) | zh-TW |