Los modelos de AutoML Translation son compatibles con los siguientes pares de idiomas de traducción. Un idioma compatible significa que Google tiene un modelo de NMT (traducción automática neuronal) existente para ese idioma, que AutoML Translation usa como base para crear un modelo personalizado durante el entrenamiento.
Las flechas indican qué idiomas fuente y objetivo se admiten para traducción. Por ejemplo, se admite la combinación del inglés al alemán y del alemán al inglés.
Par de idiomas | Códigos de idioma |
---|---|
Afrikáans <-> Inglés | af <-> en |
Albanés <-> Inglés | sq <-> en |
Árabe <-> Inglés | ar <-> en |
Azerbaiyano <-> Inglés | az <-> en |
Bengalí <-> Inglés | bn <-> en |
Búlgaro <-> Inglés | bg <-> en |
Catalán <-> Inglés | ca <-> en |
Chino (simplificado) <-> Inglés | zh-CN * <-> en |
Chino (tradicional) <-> Inglés | zh-TW <-> en |
Croata <-> Inglés | hr <-> en |
Checo <-> Inglés | cs <-> en |
Danés <-> Inglés | da <-> en |
Holandés <-> Inglés | nl <-> en |
Estonio <-> Inglés | et <-> en |
Filipino <-> Inglés | fil <-> en |
Finlandés <-> Inglés | fi <-> en |
Francés <-> Inglés | fr <-> en |
Gallego <-> Inglés | gl <-> en |
Georgiano <-> Inglés | ka <-> en |
Alemán <-> Inglés | de <-> en |
Griego <-> Inglés | el <-> en |
Guyaratí <-> Inglés | gu <-> en |
Criollo haitiano <-> Inglés | ht <-> en |
Hebreo <-> Inglés | iw <-> en |
Hindi <-> Inglés | hi <-> en |
Húngaro <-> Inglés | hu <-> en |
Islandés <-> Inglés | is <-> en |
Indonesio <-> Inglés | id <-> en |
Italiano <-> Inglés | it <-> en |
Japonés <-> Inglés | ja <-> en |
Javanés <-> Inglés | jv <-> en |
Camboyano <-> Inglés | km <-> en |
Coreano <-> Inglés | ko <-> en |
Letón <-> Inglés | lv <-> en |
Lituano <-> Inglés | lt <-> en |
Malayo <-> Inglés | ms <-> en |
Maratí <-> Inglés | mr <-> en |
Myanmar (Birmano) <-> Inglés | my <-> en |
Nepalí <-> Inglés | ne <-> en |
Noruego <-> Inglés | no <-> en |
Pastún <-> Inglés | ps <-> en |
Persa <-> Inglés | fa <-> en |
Polaco <-> Inglés | pl <-> en |
Portugués <-> Inglés | pt <-> en |
Punyabí <-> Inglés | pa <-> en |
Rumano <-> Inglés | ro <-> en |
Ruso <-> Inglés | ru <-> en |
Serbio <-> Inglés | sr <-> en |
Eslovaco <-> Inglés | sk <-> en |
Esloveno <-> Inglés | sl <-> en |
Español <-> Inglés | es <-> en |
Suajili <-> Inglés | sw <-> en |
Sueco <-> Inglés | sv <-> en |
Tamil <-> Inglés | ta <-> en |
Telugu <-> Inglés | te <-> en |
Tailandés <-> Inglés | th <-> en |
Turco <-> Inglés | tr <-> en |
Ucraniano <-> Inglés | uk <-> en |
Urdu <-> Inglés | ur <-> en |
Uzbeko <-> Inglés | uz <-> en |
Vietnamita <-> Inglés | vi <-> en |
Galés <-> Inglés | cy <-> en |
Zulú <-> Inglés | zu <-> en |
* El chino simplificado se puede especificar mediante zh-CN
o zh
.
Códigos admitidos para variantes de idioma
Puedes usar los siguientes códigos de idioma, que son variantes de los idiomas compatibles en la tabla anterior. Puedes usar estos códigos como el idioma de origen o el idioma objetivo cuando creas conjuntos de datos.
Google no tiene modelos de NMT base para estos idiomas. En su lugar, AutoML Translation usa el modelo base asociado de la variante de lenguaje para entrenar modelos personalizados.
Estos códigos son útiles, por ejemplo, cuando traduces contenido para un dialecto o una región en particular. Por ejemplo, supongamos que localizaste datos para zh-HK
en los que creas un modelo personalizado. Cuando realizas traducciones, puedes especificar el código de idioma zh-HK
, que apunta a tu modelo personalizado y produce traducciones más precisas para esa configuración regional.
En la siguiente tabla, se enumeran los códigos de idioma, sus descripciones y sus modelos base asociados que usa AutoML Translation cuando se entrenan modelos personalizados.
Código de idioma | Descripción | Modelo base |
---|---|---|
zh-HK |
Hong Kong (tradicional) | zh-TW |