Modelo de traducción automática neuronal
El motor de reconocimiento de la API Translation admite una gran variedad de idiomas para el modelo de traducción automática neuronal (NMT).
Estos idiomas se especifican en una solicitud de reconocimiento mediante parámetros de código de idioma, tal como se indica en esta página. La mayoría de los parámetros de código de idioma se ajustan a los identificadores ISO-639, a menos que se indique lo contrario.
Se admiten traducciones de cualquier idioma a cualquier otro de esta lista. La romanización y la transliteración solo se admiten en la API Cloud Translation - Advanced. La lista se actualiza a medida que se añaden idiomas. También puedes consultar los idiomas admitidos mediante las APIs Cloud Translation Basic o Cloud Translation Advanced.
Pruébalo
Si es la primera vez que utilizas Google Cloud, crea una cuenta para evaluar el rendimiento de Cloud Translation en situaciones reales. Los nuevos clientes también reciben 300 USD en crédito gratuito para ejecutar, probar y desplegar cargas de trabajo.
Probar Cloud Translation gratis
Idioma | Código ISO-639 |
---|---|
Abjasio | ab |
Acehnés | ace |
Acholi | ach |
Afrikáans | af |
Albanés | sq |
Alur | alz |
Amárico | am |
Árabe | ar |
Armenio | hy |
Asamés | as |
Awadhi | awa |
Aimara | ay |
Azerí | az |
Balinés | ban |
Bambara | bm |
Baskir | ba |
Euskera | eu |
Batak Karo | btx |
Batak Simalungun | bts |
Batak toba | bbc |
Bielorruso | be |
Bemba | bem |
Bengalí | bn |
Betawi | bew |
Bhoyapurí | bho |
Bikol | bik |
Bosnio | bs |
Bretón | br |
Búlgaro | bg |
Buriato | bua |
Cantonés | yue |
Catalán | ca |
Cebuano | ceb |
Chichewa (chinyanja) | ny |
Chino (simplificado) | zh-CN o zh (BCP-47) |
Chino (tradicional) | zh-TW (BCP-47) |
Chuvasio | cv |
Corso | co |
Tártaro de Crimea | crh |
Croata | hr |
Checo | cs |
Danés | da |
Dinka | din |
Divehi | dv |
Dogri | doi |
Dombe | dov |
neerlandés | nl |
Dzongkha | dz |
Inglés | en |
Esperanto | eo |
Estonio | et |
Ewé | ee |
Fiyiano | fj |
Filipino (tagalo) | fil o tl |
Finés | fi |
Francés | fr |
Francés (Francia) | fr-FR |
Francés (Canadá) | fr-CA |
Frisón | fy |
Fula | ff |
ga | gaa |
Gallego | gl |
Ganda (luganda) | lg |
Georgiano | ka |
Alemán | de |
Griego | el |
Guaraní | gn |
Guyaratí | gu |
Criollo haitiano | ht |
Chin de Hakha | cnh |
Hausa | ha |
Hawaiano | haw |
Hebreo | iw o he |
Hiligainón | hil |
Hindi | hi |
Hmong | hmn |
Húngaro | hu |
Hunsrik | hrx |
Islandés | is |
Igbo | ig |
Ilocano | ilo |
Indonesio | id |
Irlandés | ga |
Italiano | it |
Japonés | ja |
Javanés | jw o jv |
Canarés | kn |
Pampango | pam |
Kazajo | kk |
Jemer | km |
Kiga | cgg |
Kinyarwanda | rw |
Kituba | ktu |
Konkani | gom |
Coreano | ko |
Krio | kri |
Kurdo (kurmanyi) | ku |
Kurdo (sorani) | ckb |
Kirguís | ky |
Lao | lo |
Latgaliano | ltg |
Latín | la |
Letón | lv |
Ligur | lij |
Limburgués | li |
Lingala | ln |
Lituano | lt |
Lombardo | lmo |
Luo | luo |
Luxemburgués | lb |
Macedonio | mk |
Maithili | mai |
Makassar | mak |
Malgache | mg |
Malayo | ms |
Malayo (jawi) | ms-Arab |
Malabar | ml |
Maltés | mt |
Maorí | mi |
Marathi | mr |
Marí de las praderas | chm |
Meiteilon (manipuri) | mni-Mtei |
Minang | min |
Mizo | lus |
Mongol | mn |
Myanmar (birmano) | my |
Ndebele (Sudáfrica) | nr |
Nepal bhasa (newari) | new |
Nepalí | ne |
Sotho septentrional (sepedi) | nso |
Noruego | no |
Nuer | nus |
Occitano | oc |
Oriya | or |
Oromo | om |
Pangasinán | pag |
Papiamento | pap |
Pastún | ps |
Persa | fa |
Polaco | pl |
Portugués | pt |
Portugués (Portugal) | pt-PT |
Portugués (Brasil) | pt-BR |
Panyabí | pa |
Panyabí (shahmukhi) | pa-Arab |
Quechua | qu |
Romaní | rom |
Rumano | ro |
Kirundi | rn |
Ruso | ru |
Samoano | sm |
Sango | sg |
Sánscrito | sa |
Gaélico escocés | gd |
Serbio | sr |
Sesoto | st |
Criollo seychelense | crs |
Shan | shn |
Shona | sn |
Siciliano | scn |
Silesio | szl |
Sindhi | sd |
Cingalés (sinhala) | si |
Eslovaco | sk |
Esloveno | sl |
Somalí | so |
Español | es |
Sundanés | su |
Swahili | sw |
Suazi | ss |
Sueco | sv |
Tayiko | tg |
Tamil | ta |
tártaro | tt |
Telugú | te |
Tetun | tet |
Tailandés | th |
Tigrinya | ti |
Tsonga | ts |
Setsuana | tn |
Turco | tr |
Turkmeno | tk |
Twi (acano) | ak |
Ucraniano | uk |
Urdu | ur |
Uigur | ug |
Uzbeko | uz |
Vietnamita | vi |
Galés | cy |
Xhosa | xh |
Yiddish | yi |
Yoruba | yo |
Maya yucateco | yua |
Zulú | zu |
Compatibilidad con la romanización y la transliteración
La romanización y la transliteración están disponibles en los siguientes idiomas.
Idioma | Código ISO-639 | Romanización | Transliteración |
---|---|---|---|
Árabe | ar |
||
Amárico | am |
||
Bengalí | bn |
||
Bielorruso | be |
||
Guyaratí | gu |
||
Hindi | hi |
||
Japonés | ja |
||
Canarés | kn |
||
Myanmar/Birmania | my |
||
Ruso | ru |
||
Serbio | sr |
||
Tamil | ta |
||
Telugú | te |
||
Ucraniano | uk |
Modelos personalizados
En la edición avanzada de Cloud Translation, AutoML Translation admite los siguientes pares de idiomas para los modelos personalizados. Un idioma admitido significa que Google tiene un modelo de traducción automática neuronal (NMT) para ese idioma, que AutoML Translation usa como base para crear un modelo personalizado durante el entrenamiento.
Par de idiomas | Códigos de idioma |
---|---|
Afrikáans <-> inglés | af <-> en |
Albanés <-> inglés | sq <-> en |
Árabe <-> inglés | ar <-> en |
Azerbaiyano <-> inglés | az <-> en |
Bengalí <-> inglés | bn <-> en |
Búlgaro <-> inglés | bg <-> en |
Catalán <-> inglés | ca <-> en |
Chino (simplificado) <-> Inglés | zh-CN * <-> en |
Chino (tradicional) <-> Inglés | zh-TW <-> en |
Croata <-> inglés | hr <-> en |
Checo <-> inglés | cs <-> en |
Danés <-> inglés | da <-> en |
Neerlandés <-> inglés | nl <-> en |
Estonio <-> inglés | et <-> en |
Finlandés <-> inglés | fi <-> en |
Francés <-> inglés | fr <-> en |
Gallego <-> inglés | gl <-> en |
Georgiano <-> inglés | ka <-> en |
Alemán <-> inglés | de <-> en |
Griego <-> inglés | el <-> en |
Guyaratí <-> inglés | gu <-> en |
Criollo haitiano <-> inglés | ht <-> en |
Hebreo <-> inglés | iw <-> en |
Hindi <-> inglés | hi <-> en |
Húngaro <-> inglés | hu <-> en |
Islandés <-> inglés | is <-> en |
Indonesio <-> inglés | id <-> en |
Italiano <-> inglés | it <-> en |
Japonés <-> inglés | ja <-> en |
Coreano <-> inglés | ko <-> en |
Letón <-> inglés | lv <-> en |
Lituano <-> inglés | lt <-> en |
Malayo <-> inglés | ms <-> en |
Maratí <-> inglés | mr <-> en |
Noruego <-> inglés | no <-> en |
Persa <-> inglés | fa <-> en |
Polaco <-> inglés | pl <-> en |
Portugués <-> inglés | pt <-> en |
Panyabí <-> inglés | pa <-> en |
Rumano <-> inglés | ro <-> en |
Ruso <-> inglés | ru <-> en |
Serbio <-> inglés | sr <-> en |
Eslovaco <-> inglés | sk <-> en |
Esloveno <-> inglés | sl <-> en |
Español <-> inglés | es <-> en |
Suajili <-> inglés | sw <-> en |
Sueco <-> inglés | sv <-> en |
Tailandés <-> inglés | th <-> en |
Turco <-> inglés | tr <-> en |
Ucraniano <-> inglés | uk <-> en |
Urdu <-> inglés | ur <-> en |
Vietnamita <-> inglés | vi <-> en |
Galés <-> inglés | cy <-> en |
* El chino simplificado se puede especificar con zh-CN
o zh
.
Códigos admitidos para variantes de idiomas
Los siguientes códigos de idioma son variantes de los idiomas admitidos en la tabla anterior. Puedes usar estos códigos como idioma de origen o de destino al crear conjuntos de datos.
Google no tiene modelos de NMT básicos para estos idiomas. En su lugar, Cloud Translation usa el modelo base asociado a la variante de idioma para entrenar modelos personalizados.
Estos códigos son útiles, por ejemplo, cuando traduce contenido para un dialecto o una región concretos. Por ejemplo, supongamos que tiene datos localizados de zh-HK
para los que crea un modelo personalizado. Cuando realices traducciones, puedes especificar el zh-HK
código de idioma, que apunta a tu modelo personalizado y produce traducciones más precisas para esa configuración regional.
En la siguiente tabla se enumeran los códigos de idioma, sus descripciones y los modelos base asociados que usa Cloud Translation al entrenar modelos personalizados.
Código de idioma | Descripción | Modelo base |
---|---|---|
zh-HK |
Hong Kong (tradicional) | zh-TW |
Idiomas admitidos por el LLM de traducción
Se admiten traducciones de cualquier idioma a cualquier otro de esta lista. Los idiomas compatibles con el LLM de traducción también se admiten en la traducción adaptativa.
Nombre del idioma | Código de idioma |
---|---|
Árabe | ar |
Bengalí | bn |
Búlgaro | bg |
Catalán | ca |
Chino (simplificado) | zh-CN |
Croata | hr |
Checo | cs |
Danés | da |
Neerlandés | nl |
Inglés | en |
Estonio | et |
finlandés | fi |
Francés | fr |
Alemán | de |
Griego | el |
Gujarati | gu |
Hebreo | he |
Hindi | hi |
Húngaro | hu |
Islandés | is |
Indonesio | id |
Italiano | it |
Japonés | ja |
Kannada | kn |
Coreano | ko |
Letón | lv |
Lituano | lt |
Malabar | ml |
Marathi | mr |
Noruego | no |
Persa | fa |
Polaco | pl |
Portugués | pt |
Panyabí | pa |
Rumano | ro |
Ruso | ru |
Eslovaco | sk |
Esloveno | sl |
Español | es |
Swahili | sw |
Sueco | sv |
Tamil | ta |
Telugu | te |
Tailandés | th |
Turco | tr |
Ucraniano | uk |
Urdu | ur |
Vietnamita | vi |
Zulú | zu |