Modelo de tradução automática neural
O mecanismo de reconhecimento da API Translation é compatível com vários idiomas no modelo de tradução automática neural (NMT, na sigla em inglês).
Esses idiomas são especificados em uma solicitação de reconhecimento usando parâmetros de código de idioma conforme observado nesta página. A maioria dos parâmetros de código de idioma é compatível com os identificadores ISO-639, exceto onde indicado.
Há suporte de traduções de qualquer idioma para qualquer idioma nesta lista. A romanização e a transliteração são compatíveis apenas com a API Cloud Translation - Advanced. A lista é atualizada conforme novos idiomas são adicionados. Também é possível listar os idiomas compatíveis usando as APIs Cloud Translation - Basic ou Cloud Translation - Advanced.
Faça um teste
Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho do Cloud Translation em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
Faça um teste gratuito do Cloud Translation
Idioma | Código ISO-639 |
---|---|
Africâner | af |
Albanês | sq |
Amárico | am |
Árabe | ar |
Armênio | hy |
Assamês | as |
Aimará | ay |
Azerbaijano | az |
Bambara | bm |
Basco | eu |
Bielorrusso | be |
Bengali | bn |
Boiapuri | bho |
Bósnio | bs |
Búlgaro | bg |
Catalão | ca |
Cebuano | ceb |
Chinês (simplificado) | zh-CN ou zh (BCP-47) |
Chinês (tradicional) | zh-TW (BCP-47) |
Córsico | co |
Croata | hr |
Tcheco | cs |
Dinamarquês | da |
Divehi | dv |
Dogri | doi |
Holandês | nl |
Inglês | en |
Esperanto | eo |
Estoniano | et |
Ewe | ee |
Filipino (Tagalog) | fil |
Finlandês | fi |
Francês | fr |
Frísio | fy |
Galego | gl |
Georgiano | ka |
Alemão | de |
Grego | el |
Guarani | gn |
Gujarati | gu |
Crioulo haitiano | ht |
Hauçá | ha |
Havaiano | haw |
Hebraico | he ou iw |
Hindi | hi |
Hmong | hmn |
Húngaro | hu |
Islandês | is |
Igbo | ig |
Ilocano | ilo |
Indonésio | id |
Irlandês | ga |
Italiano | it |
Japonês | ja |
Javanês | jv ou jw |
Kannada | kn |
Cazaque | kk |
Khmer | km |
Quiniaruanda | rw |
Concani | gom |
Coreano | ko |
Krio | kri |
Curdo | ku |
Kurdish (Sorani) | ckb |
Quirguiz | ky |
Laosiano | lo |
Latim | la |
Letão | lv |
Lingala | ln |
Lituano | lt |
Luganda | lg |
Luxemburguês | lb |
Macedônio | mk |
Maithili | mai |
Malgaxe | mg |
Malaio | ms |
Malaiala | ml |
Maltês | mt |
Maori | mi |
Marati | mr |
Meiteilon (Manipuri) | mni-Mtei |
Mizo | lus |
Mongol | mn |
Mianmar (birmanês) | my |
Nepalês | ne |
Norueguês | no |
Nianja (Chichewa) | ny |
Oriá | or |
Oromo | om |
Pashto | ps |
Persa | fa |
Polonês | pl |
Português (Portugal, Brasil) | pt |
Punjabi | pa |
Quíchua | qu |
Romeno | ro |
Russo | ru |
Samoano | sm |
Sânscrito | sa |
Escocês gaélico | gd |
Sepedi | nso |
Sérvio | sr |
Sesotho | st |
Chona | sn |
Sindi | sd |
Sinhala (cingalês) | si |
Eslovaco | sk |
Esloveno | sl |
Somali | so |
Espanhol | es |
Sundanês | su |
Suaíli | sw |
Sueco | sv |
Tagalo (filipino) | tl |
Tadjique | tg |
Tâmil | ta |
Tártaro | tt |
Télugo | te |
Tailandês | th |
Tigrínia | ti |
Tsonga | ts |
Turco | tr |
Turcomano | tk |
Twi (Akan) | ak |
Ucraniano | uk |
Urdu | ur |
Uyghur | ug |
Usbeque | uz |
Vietnamita | vi |
Galês | cy |
Xhosa | xh |
Ídiche | yi |
Iorubá | yo |
Zulu | zu |
Suporte para romanização e transliteração
A romanização e a transliteração são compatíveis com os seguintes idiomas.
Idioma | Código ISO-639 | Romanização | Transliteração |
---|---|---|---|
Árabe | ar |
||
Amárico | am |
||
Bengali | bn |
||
Bielorrusso | be |
||
Gujarati | gu |
||
Hindi | hi |
||
Japonês | ja |
||
Kannada | kn |
||
Mianmar | uk |
||
Russo | ru |
||
Sérvio | sr |
||
Tâmil | ta |
||
Télugo | te |
||
Ucraniano | uk |
Modelos personalizados
Para a versão Advanced do Cloud Translation, o AutoML Translation aceita os seguintes pares de idiomas para modelos personalizados. Um idioma compatível significa que o Google tem um modelo de tradução automática neural (NMT) para esse idioma, que o AutoML Translation usa como base para criar um modelo personalizado durante o treinamento.
Par de idiomas | Códigos de idiomas |
---|---|
Africâner <-> Inglês | af <-> en |
Albanês <-> Inglês | sq <-> en |
Árabe <-> Inglês | ar <-> en |
Azerbaijano <-> Inglês | az <-> en |
Bengali <-> Inglês | bn <-> en |
Búlgaro <-> Inglês | bg <-> en |
Catalão <-> Inglês | ca <-> en |
Chinês (simplificado) <-> Inglês | zh-CN * <-> en |
Chinês (tradicional) <-> Inglês | zh-TW <-> en |
Croata <-> Inglês | hr <-> en |
Tcheco <-> Inglês | cs <-> en |
Dinamarquês <-> Inglês | da <-> en |
Holandês <-> Inglês | nl <-> en |
Estoniano <-> Inglês | et <-> en |
Finlandês <-> Inglês | fi <-> en |
Francês <-> Inglês | fr <-> en |
Galego <-> Inglês | gl <-> en |
Georgiano <-> Inglês | ka <-> en |
Alemão <-> Inglês | de <-> en |
Grego <-> Inglês | el <-> en |
Guzerati <-> Inglês | gu <-> en |
Crioulo haitiano <-> Inglês | ht <-> en |
Hebraico <-> Inglês | iw <-> en |
Hindi <-> Inglês | hi <-> en |
Húngaro <-> Inglês | hu <-> en |
Islandês <-> Inglês | is <-> en |
Indonésio <-> Inglês | id <-> en |
Italiano <-> Inglês | it <-> en |
Japonês <-> Inglês | ja <-> en |
Coreano <-> Inglês | ko <-> en |
Letão <-> Inglês | lv <-> en |
Lituano <-> Inglês | lt <-> en |
Malaio <-> Inglês | ms <-> en |
Marata <-> Inglês | mr <-> en |
Norueguês <-> Inglês | no <-> en |
Persa <-> Inglês | fa <-> en |
Polonês <-> Inglês | pl <-> en |
Português <-> Inglês | pt <-> en |
Punjabi <-> Inglês | pa <-> en |
Romeno <-> Inglês | ro <-> en |
Russo <-> Inglês | ru <-> en |
Sérvio <-> Inglês | sr <-> en |
Eslovaco <-> Inglês | sk <-> en |
Esloveno <-> Inglês | sl <-> en |
Espanhol <-> Inglês | es <-> en |
Suaíli <-> Inglês | sw <-> en |
Sueco <-> Inglês | sv <-> en |
Tailandês <-> Inglês | th <-> en |
Turco <-> Inglês | tr <-> en |
Ucraniano <-> Inglês | uk <-> en |
Urdu <-> Inglês | ur <-> en |
Vietnamita <-> Inglês | vi <-> en |
Galês <-> Inglês | cy <-> en |
* O chinês simplificado pode ser especificado por zh-CN
ou zh
.
Códigos compatíveis para variantes de idioma
Os códigos de idioma a seguir são variantes dos idiomas com suporte na tabela anterior. É possível usar esses códigos como o idioma de origem ou de chegada ao criar conjuntos de dados.
O Google não tem modelos NMT de base para esses idiomas. Em vez disso, o Cloud Translation usa o modelo base associado da variante de idioma para o treinamento de modelos personalizados.
O uso desses códigos é útil, por exemplo, quando você traduz conteúdo para um dialeto ou região específicos. Por exemplo, suponha que você tenha dados localizados para zh-HK
para os quais quer criar um modelo personalizado. Ao realizar traduções, é
possível especificar o código de idioma zh-HK
, que aponta para seu modelo personalizado e
produz traduções mais precisas para essa localidade.
Veja na tabela a seguir os códigos de idioma, as descrições e os modelos de base associados que o Cloud Translation usa ao treinar modelos personalizados.
Código do idioma | Descrição | Modelo base |
---|---|---|
zh-HK |
Hong Kong (tradicional) | zh-TW |
Idiomas compatíveis com o LLM de tradução
Os seguintes pares de idiomas são compatíveis com traduções de textos que usam o LLM de tradução e para traduções adaptáveis.
Par de idiomas | Códigos de idiomas |
---|---|
Árabe <-> Inglês | ar <-> en |
Chinês (simplificado) <-> Inglês | zh-CN <-> en |
Francês <-> Inglês | fr <-> en |
Alemão <-> Inglês | de <-> en |
Hindi <-> Inglês | hi <-> en |
Italiano <-> Inglês | it <-> en |
Japonês <-> Inglês | ja <-> en |
Coreano <-> Inglês | ko <-> en |
Português <-> Inglês | pt <-> en |
Russo <-> Inglês | ru <-> en |
Espanhol <-> Inglês | es <-> en |