Idiomas admitidos para modelos personalizados

Los modelos de AutoML Translation son compatibles con los siguientes pares de idiomas de traducción. Un idioma compatible significa que Google tiene un modelo de NMT (traducción automática neuronal) existente para ese idioma, que AutoML Translation usa como base para crear un modelo personalizado durante el entrenamiento.

Las flechas indican qué idiomas fuente y objetivo se admiten para traducción. Por ejemplo, se admite la combinación del inglés al alemán y del alemán al inglés.

Par de idiomas Códigos de idioma
Afrikáans <-> Inglés af <-> en
Albanés <-> Inglés sq <-> en
Árabe <-> Inglés ar <-> en
Azerbaiyano <-> Inglés az <-> en
Bengalí <-> Inglés bn <-> en
Búlgaro <-> Inglés bg <-> en
Catalán <-> Inglés ca <-> en
Chino (simplificado) <-> Inglés zh-CN * <-> en
Chino (tradicional) <-> Inglés zh-TW <-> en
Croata <-> Inglés hr <-> en
Checo <-> Inglés cs <-> en
Danés <-> Inglés da <-> en
Holandés <-> Inglés nl <-> en
Estonio <-> Inglés et <-> en
Filipino <-> Inglés fil <-> en
Finlandés <-> Inglés fi <-> en
Francés <-> Inglés fr <-> en
Gallego <-> Inglés gl <-> en
Georgiano <-> Inglés ka <-> en
Alemán <-> Inglés de <-> en
Griego <-> Inglés el <-> en
Guyaratí <-> Inglés gu <-> en
Criollo haitiano <-> Inglés ht <-> en
Hebreo <-> Inglés iw <-> en
Hindi <-> Inglés hi <-> en
Húngaro <-> Inglés hu <-> en
Islandés <-> Inglés is <-> en
Indonesio <-> Inglés id <-> en
Italiano <-> Inglés it <-> en
Japonés <-> Inglés ja <-> en
Javanés <-> Inglés jv <-> en
Camboyano <-> Inglés km <-> en
Coreano <-> Inglés ko <-> en
Letón <-> Inglés lv <-> en
Lituano <-> Inglés lt <-> en
Malayo <-> Inglés ms <-> en
Maratí <-> Inglés mr <-> en
Myanmar (Birmano) <-> Inglés my <-> en
Nepalí <-> Inglés ne <-> en
Noruego <-> Inglés no <-> en
Pastún <-> Inglés ps <-> en
Persa <-> Inglés fa <-> en
Polaco <-> Inglés pl <-> en
Portugués <-> Inglés pt <-> en
Punyabí <-> Inglés pa <-> en
Rumano <-> Inglés ro <-> en
Ruso <-> Inglés ru <-> en
Serbio <-> Inglés sr <-> en
Eslovaco <-> Inglés sk <-> en
Esloveno <-> Inglés sl <-> en
Español <-> Inglés es <-> en
Suajili <-> Inglés sw <-> en
Sueco <-> Inglés sv <-> en
Tamil <-> Inglés ta <-> en
Telugu <-> Inglés te <-> en
Tailandés <-> Inglés th <-> en
Turco <-> Inglés tr <-> en
Ucraniano <-> Inglés uk <-> en
Urdu <-> Inglés ur <-> en
Uzbeko <-> Inglés uz <-> en
Vietnamita <-> Inglés vi <-> en
Galés <-> Inglés cy <-> en
Zulú <-> Inglés zu <-> en

* El chino simplificado se puede especificar mediante zh-CN o zh.

Códigos admitidos para variantes de idioma

Puedes usar los siguientes códigos de idioma, que son variantes de los idiomas compatibles en la tabla anterior. Puedes usar estos códigos como el idioma de origen o el idioma objetivo cuando creas conjuntos de datos.

Google no tiene modelos de NMT base para estos idiomas. En su lugar, AutoML Translation usa el modelo base asociado de la variante de lenguaje para entrenar modelos personalizados.

Estos códigos son útiles, por ejemplo, cuando traduces contenido para un dialecto o una región en particular. Por ejemplo, supongamos que localizaste datos para zh-HK en los que creas un modelo personalizado. Cuando realizas traducciones, puedes especificar el código de idioma zh-HK, que apunta a tu modelo personalizado y produce traducciones más precisas para esa configuración regional.

En la siguiente tabla, se enumeran los códigos de idioma, sus descripciones y sus modelos base asociados que usa AutoML Translation cuando se entrenan modelos personalizados.

Código de idioma Descripción Modelo base
zh-HK Hong Kong (tradicional) zh-TW