Modelo de traducción automática neuronal
El motor de reconocimiento de la API de Translation admite una amplia variedad de idiomas para el modelo de traducción automática neuronal (NMT).
Estos idiomas se especifican en una solicitud de reconocimiento mediante parámetros de códigos de idioma, como se indica en esta página. La mayoría de los parámetros de códigos de idioma se ajustan a los identificadores ISO-639, excepto que se indique lo contrario.
Se admiten las traducciones entre cualquiera de los idiomas de esta lista. La latinización y la transliteración solo son compatibles con la API de Cloud Translation Advanced. La lista se actualiza a medida que se agregan más idiomas. También puedes enumerar los idiomas compatibles con las API de Cloud Translation Basic o Cloud Translation Advanced.
Pruébalo tú mismo
Si es la primera vez que usas Google Cloud, crea una cuenta para evaluar el rendimiento de Cloud Translation en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
Probar Cloud Translation gratis
Idioma | Código ISO-639 |
---|---|
Afrikáans | af |
Albanés | sq |
Amárico | am |
Árabe | ar |
Armenio | hy |
Asamés | as |
Aimara | ay |
Azerbaiyano | az |
Bambara | bm |
Euskara | eu |
Bielorruso | be |
Bengalí | bn |
Bhojpuri | bho |
Bosnio | bs |
Búlgaro | bg |
Catalán | ca |
Cebuano | ceb |
Chino (simplificado) | zh-CN o zh (BCP-47) |
Chino (tradicional) | zh-TW (BCP-47) |
Corso | co |
Croata | hr |
Checo | cs |
Danés | da |
Dhivehi | dv |
Dogri | doi |
Holandés | nl |
Inglés | en |
Esperanto | eo |
Estonio | et |
Ewe | ee |
Filipino (tagalo) | fil |
Finlandés | fi |
Francés | fr |
Frisón | fy |
Galego | gl |
Georgiano | ka |
Alemán | de |
Griego | el |
Guaraní | gn |
Gujarati | gu |
Criollo haitiano | ht |
Hausa | ha |
Hawaiano | haw |
Hebreo | he o iw |
Hindi | hi |
Hmong | hmn |
Húngaro | hu |
Islandés | is |
Igbo | ig |
Ilocano | ilo |
Indonesio | id |
Irlandés | ga |
Italiano | it |
Japonés | ja |
Javanés | jv o jw |
Canarés | kn |
Kazajo | kk |
Jemer | km |
Kiñarwanda | rw |
Konkani | gom |
Coreano | ko |
Krio | kri |
Kurdo | ku |
Kurdo (Sorani) | ckb |
Kirguizo | ky |
Laosiano | lo |
Latín | la |
Letón | lv |
Lingala | ln |
Lituano | lt |
Luganda | lg |
Luxemburgués | lb |
Macedonio | mk |
Maithili | mai |
Malgache | mg |
Malayo | ms |
Malayalam | ml |
Maltés | mt |
Maorí | mi |
Marathi | mr |
Meiteilon (manipuri) | mni-Mtei |
Mizo | lus |
Mongol | mn |
Birmano | my |
Nepalí | ne |
Noruego | no |
Nyanja (Chichewa) | ny |
Odia (oriya) | or |
Oromo | om |
Pastún | ps |
Persa | fa |
Polaco | pl |
Portugués (Portugal y Brasil) | pt |
Panyabí | pa |
Quechua | qu |
Rumano | ro |
Ruso | ru |
Samoano | sm |
Sánscrito | sa |
Gaélico escocés | gd |
Sepedi | nso |
Serbio | sr |
Sesoto | st |
Shona | sn |
Sindhi | sd |
Cingalés | si |
Eslovaco | sk |
Esloveno | sl |
Somalí | so |
Español | es |
Sundanés | su |
Swahili | sw |
Sueco | sv |
Tagalo (filipino) | tl |
Tayiko | tg |
Tamil | ta |
Tártaro | tt |
Telugu | te |
Tailandés | th |
Tigrinya | ti |
Tsonga | ts |
Turco | tr |
Turkmeno | tk |
Twi (Akan) | ak |
Ucraniano | uk |
Urdu | ur |
Uigur | ug |
Uzbeko | uz |
Vietnamita | vi |
Galés | cy |
Xhosa | xh |
Yiddish | yi |
Yoruba | yo |
Zulú | zu |
Compatibilidad con latinización y transliteración
La rotación y la transliteración admiten los siguientes idiomas.
Idioma | Código ISO-639 | Latinización | Transliteración |
---|---|---|---|
Árabe | ar |
||
Amárico | am |
||
Bengalí | bn |
||
Bielorruso | be |
||
Gujarati | gu |
||
Hindi | hi |
||
Japonés | ja |
||
Canarés | kn |
||
Birmania | uk |
||
Ruso | ru |
||
Serbio | sr |
||
Tamil | ta |
||
Telugu | te |
||
Ucraniano | uk |
Modelos personalizados
Para Cloud Translation Advanced, AutoML Translation admite los siguientes pares de idiomas para modelos personalizados. Un idioma compatible significa que Google tiene un modelo de NMT (traducción automática neuronal) existente para ese idioma, que AutoML Translation usa como base para crear un modelo personalizado durante el entrenamiento.
Par de idiomas | Códigos de idioma |
---|---|
Afrikáans <-> Inglés | af <-> en |
Albanés <-> Inglés | sq <-> en |
Árabe <-> Inglés | ar <-> en |
Azerbaiyano <-> Inglés | az <-> en |
Bengalí <-> Inglés | bn <-> en |
Búlgaro <-> Inglés | bg <-> en |
Catalán <-> Inglés | ca <-> en |
Chino (simplificado) <-> Inglés | zh-CN * <-> en |
Chino (tradicional) <-> Inglés | zh-TW <-> en |
Croata <-> Inglés | hr <-> en |
Checo <-> Inglés | cs <-> en |
Danés <-> Inglés | da <-> en |
Holandés <-> Inglés | nl <-> en |
Estonio <-> Inglés | et <-> en |
Finlandés <-> Inglés | fi <-> en |
Francés <-> Inglés | fr <-> en |
Gallego <-> Inglés | gl <-> en |
Georgiano <-> Inglés | ka <-> en |
Alemán <-> Inglés | de <-> en |
Griego <-> Inglés | el <-> en |
Guyaratí <-> Inglés | gu <-> en |
Criollo haitiano <-> Inglés | ht <-> en |
Hebreo <-> Inglés | iw <-> en |
Hindi <-> Inglés | hi <-> en |
Húngaro <-> Inglés | hu <-> en |
Islandés <-> Inglés | is <-> en |
Indonesio <-> Inglés | id <-> en |
Italiano <-> Inglés | it <-> en |
Japonés <-> Inglés | ja <-> en |
Coreano <-> Inglés | ko <-> en |
Letón <-> Inglés | lv <-> en |
Lituano <-> Inglés | lt <-> en |
Malayo <-> Inglés | ms <-> en |
Maratí <-> Inglés | mr <-> en |
Noruego <-> Inglés | no <-> en |
Persa <-> Inglés | fa <-> en |
Polaco <-> Inglés | pl <-> en |
Portugués <-> Inglés | pt <-> en |
Punyabí <-> Inglés | pa <-> en |
Rumano <-> Inglés | ro <-> en |
Ruso <-> Inglés | ru <-> en |
Serbio <-> Inglés | sr <-> en |
Eslovaco <-> Inglés | sk <-> en |
Esloveno <-> Inglés | sl <-> en |
Español <-> Inglés | es <-> en |
Suajili <-> Inglés | sw <-> en |
Sueco <-> Inglés | sv <-> en |
Tailandés <-> Inglés | th <-> en |
Turco <-> Inglés | tr <-> en |
Ucraniano <-> Inglés | uk <-> en |
Urdu <-> Inglés | ur <-> en |
Vietnamita <-> Inglés | vi <-> en |
Galés <-> Inglés | cy <-> en |
* El chino simplificado se puede especificar mediante zh-CN
o zh
.
Códigos admitidos para variantes de idioma
Los siguientes códigos de idioma son variantes de los idiomas compatibles en la tabla anterior. Puedes usar estos códigos como el idioma de origen o el idioma objetivo cuando creas conjuntos de datos.
Google no tiene modelos de NMT base para estos idiomas. En su lugar, Cloud Translation usa el modelo base asociado de la variante de lenguaje para entrenar modelos personalizados.
Estos códigos son útiles, por ejemplo, cuando traduces contenido para un dialecto o una región en particular. Por ejemplo, supongamos que localizaste datos para zh-HK
en los que creas un modelo personalizado. Cuando traduces, puedes especificar el código de idioma zh-HK
, que apunta a tu modelo personalizado y produce traducciones más precisas para esa configuración regional.
En la siguiente tabla, se enumeran los códigos de idioma, sus descripciones y sus modelos base asociados que usa Cloud Translation cuando se entrenan modelos personalizados.
Código de idioma | Descripción | Modelo base |
---|---|---|
zh-HK |
Hong Kong (tradicional) | zh-TW |
Idiomas admitidos por el LLM de traducción
Los siguientes pares de idiomas son compatibles con las traducciones de texto que usan el LLM de traducción y las traducciones adaptables.
Par de idiomas | Códigos de idioma |
---|---|
Árabe <-> Inglés | ar <-> en |
Chino (simplificado) <-> Inglés | zh-CN <-> en |
Francés <-> Inglés | fr <-> en |
Alemán <-> Inglés | de <-> en |
Hindi <-> Inglés | hi <-> en |
Italiano <-> Inglés | it <-> en |
Japonés <-> Inglés | ja <-> en |
Coreano <-> Inglés | ko <-> en |
Portugués <-> Inglés | pt <-> en |
Ruso <-> Inglés | ru <-> en |
Español <-> Inglés | es <-> en |