Esta página se ha traducido con Cloud Translation API.

Lista de procesadores

En esta página se incluye información detallada sobre todos los procesadores que ofrece Document AI. Puedes ver una lista de todos los procesadores por tipo de solución.

Todos los procesadores de Document AI cumplen los Términos de Seguridad y Tratamiento de Datos.

Consulta más información en la documentación sobre gestión de versiones de procesador. Además, se aplican límites específicos a los procesadores, que se suman a las cuotas y los límites generales del producto.

Digitalizar texto

Reconocimiento óptico de caracteres (OCR) en documentos de empresa

Descripción

Identifica y extrae texto de diferentes tipos de documentos.

Este procesador identifica y extrae texto, incluido texto escrito a mano, de documentos en más de 200 idiomas. El procesador también usa el aprendizaje automático para evaluar la calidad de un documento en función de la legibilidad de su contenido.

Categoría Digitalizar

Funciones OCR y análisis de calidad

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API OCR_PROCESSOR

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Afrikáans	`af`	`Latn`
Albanés	`sq`	`Latn`
Árabe	`ar`	`Arab`
Armenio	`hy`	`Armn`
Bielorruso	`be`	`Cyrl`
Bengalí	`bn`	`Beng`
Bengalí	`bn`	`Beng`
Búlgaro	`bg`	`Cyrl`
Catalán	`ca`	`Latn`
Chino	`zh`	`Hani`
Croata	`hr`	`Latn`
Checo	`cs`	`Latn`
Danés	`da`	`Latn`
neerlandés	`nl`	`Latn`
Inglés	`en`	`Latn`
Estonio	`et`	`Latn`
Filipino	`fil`	`Latn`
Finés	`fi`	`Latn`
Francés	`fr`	`Latn`
Alemán	`de`	`Latn`
Griego	`el`	`Grek`
Guyaratí	`gu`	`Gujr`
Hebreo	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandés	`is`	`Latn`
Indonesio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonés	`ja`	`Jpan`
Canarés	`kn`	`Knda`
Jemer	`km`	`Khmr`
Coreano	`ko`	`Kore`
Lao	`lo`	`Laoo`
Letón	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedonio	`mk`	`Cyrl`
Malayo	`ms`	`Latn`
Malabar	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalí	`ne`	`Deva`
Noruego	`no`	`Latn`
Persa	`fa`	`Arab`
Polaco	`pl`	`Latn`
Portugués (Brasil y Portugal)	`pt`	`Latn`
Panyabí	`pa`	`Guru`
Rumano	`ro`	`Latn`
Ruso	`ru`	`Cyrl`
Serbio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Español	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugú	`te`	`Telu`
Tailandés	`th`	`Thai`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versiones del procesador

ID de versión	Canal de lanzamiento	Descripción
`pretrained-ocr-v1.2-2022-11-10`	Estable	Versión del modelo inmovilizada de la versión 1.0: archivos de modelo, configuraciones y archivos binarios de una captura de versión inmovilizada en una imagen de contenedor durante un máximo de 18 meses.
`pretrained-ocr-v2.0-2023-06-02`	Estable	Modelo listo para producción especializado en casos prácticos de documentos. Incluye acceso a todos los complementos de OCR.
`pretrained-ocr-v2.1-2024-08-07`	Estable	Las principales áreas de mejora de la versión 2.1 son: mejor reconocimiento de texto impreso, detección más precisa de casillas de verificación y orden de lectura más preciso.
`pretrained-ocr-v2.1.1-2025-01-31`	Versión candidata	La versión 2.1.1 es similar a la 2.1 y está disponible en todas las regiones, excepto en `US`, `EU` y `asia-southeast1`.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	500
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	30

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Más información Enterprise Document OCR

Extraer entidades de documentos

Consulta Conjuntos de datos de ejemplo para ver conjuntos de datos etiquetados y sin etiquetar que puedes usar para el entrenamiento.

Extractor personalizado

Descripción

Extrae campos de documentos con IA generativa o modelos personalizados, y ajusta los modelos para extraer datos de tus documentos con precisión.

Categoría Extraer

Funciones OCR y extracción de entidades

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API CUSTOM_EXTRACTION_PROCESSOR

Notas

Si usas la IA generativa para la extracción, haz lo siguiente:
- Solo se admite oficialmente el inglés.
- La disponibilidad regional es en US, EU, northamerica-northeast1 y asia-southeast1.

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Afrikáans	`af`	`Latn`
Árabe	`ar`	`Arab`
Azerí	`az`	`Latn`
Azerí (cirílico)	`az-Cyrl`	`Cyrl`
Bielorruso	`be`	`Cyrl`
Búlgaro	`bg`	`Cyrl`
Bosnio	`bs`	`Latn`
Catalán	`ca`	`Latn`
Cebuano	`ceb`	`Latn`
Checo	`cs`	`Latn`
Galés	`cy`	`Latn`
Danés	`da`	`Latn`
Alemán	`de`	`Latn`
Griego	`el`	`Grek`
Inglés	`en`	`Latn`
Esperanto	`eo`	`Latn`
Español	`es`	`Latn`
Estonio	`et`	`Latn`
Euskera	`eu`	`Latn`
Persa	`fa`	`Arab`
Finés	`fi`	`Latn`
Filipino	`fil`	`Latn`
Francés	`fr`	`Latn`
Irlandés	`ga`	`Latn`
Gallego	`gl`	`Latn`
Hindi	`hi`	`Deva`
Croata	`hr`	`Latn`
Criollo haitiano	`ht`	`Latn`
Húngaro	`hu`	`Latn`
Indonesio	`id`	`Latn`
Islandés	`is`	`Latn`
Italiano	`it`	`Latn`
Hebreo	`iw`	`Hebr`
Japonés	`ja`	`Jpan`
Javanés	`jv`	`Latn`
Kazajo	`kk`	`Cyrl`
Coreano	`ko`	`Kore`
Kirguís	`ky`	`Cyrl`
Latín	`la`	`Latn`
Lituano	`lt`	`Latn`
Letón	`lv`	`Latn`
Macedonio	`mk`	`Cyrl`
Mongol	`mn`	`Cyrl`
Marathi	`mr`	`Deva`
Malayo	`ms`	`Latn`
Maltés	`mt`	`Latn`
Nepalí	`ne`	`Deva`
neerlandés	`nl`	`Latn`
Noruego	`no`	`Latn`
Polaco	`pl`	`Latn`
Pastún	`ps`	`Arab`
Portugués (Brasil y Portugal)	`pt`	`Latn`
Rumano	`ro`	`Latn`
Ruso	`ru`	`Cyrl`
Ruso (ortografía petrina)	`ru-PETR1708`	`Cyrl`
Sánscrito	`sa`	`Deva`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Albanés	`sq`	`Latn`
Serbio	`sr`	`Cyrl`
Sueco	`sv`	`Latn`
Swahili	`sw`	`Latn`
Tagalo	`tl`	`Latn`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Urdu	`ur`	`Arab`
Uzbeko	`uz`	`Latn`
Uzbeko (cirílico)	`uz-Cyrl`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`
Chino simplificado	`zh-Hans`	`Hani`
Chino tradicional	`zh-Hant`	`Hani`
Zulú	`zu`	`Latn`

Versiones del procesador

ID de versión	Canal de lanzamiento	Descripción
`pretrained-foundation-model-v1.4-2025-02-05`	Estable	Modelo GA que usa el LLM Gemini 2.0 Flash. También incluye funciones avanzadas de OCR, como la detección de casillas de verificación.
`pretrained-foundation-model-v1.5-2025-05-05`	Estable	Candidato listo para producción basado en el LLM Gemini 2.5 Flash. Recomendado para quienes quieran experimentar con modelos más recientes.
`pretrained-foundation-model-v1.5-pro-2025-06-20`	Estable	Modelo listo para producción que usa el LLM Gemini 2.5 Pro. Admite una cuota de hasta 30 páginas por minuto para las solicitudes de proceso online. Este modelo tiene una calidad mejorada en comparación con la versión 1.5 y puede tener una latencia mayor.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	200
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	30

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Tipos de datos normalizados

Puedes consultar más información en las páginas Enriquecimiento y normalización y Crear conjunto de datos.

Lista completa de tipos de datos normalizados

dateTime as STRING
currency as STRING
money as google.type.Money
number as FLOAT or INTEGER

Uptraining

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Más información Extractor personalizado

Análisis de formularios

Descripción

Extrae pares clave-valor generales (entidades y casillas de verificación), tablas y entidades genéricas de documentos, además de texto de OCR.

Este procesador aplica tecnologías avanzadas de aprendizaje automático para extraer pares clave-valor, casillas de verificación y tablas de documentos en más de 200 idiomas. Este procesador también utiliza modelos de aprendizaje profundo para extraer 11 entidades genéricas que son habituales en varios tipos de documentos.

Categoría Extraer

Funciones Reconocimiento óptico de caracteres, análisis de formularios y extracción de entidades

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API FORM_PARSER_PROCESSOR

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Afrikáans	`af`	`Latn`
Albanés	`sq`	`Latn`
Árabe	`ar`	`Arab`
Bielorruso	`be`	`Cyrl`
Catalán	`ca`	`Latn`
Chino	`zh`	`Hani`
Croata	`hr`	`Latn`
Checo	`cs`	`Latn`
Danés	`da`	`Latn`
neerlandés	`nl`	`Latn`
Inglés	`en`	`Latn`
Estonio	`et`	`Latn`
Filipino	`fil`	`Latn`
Finés	`fi`	`Latn`
Francés	`fr`	`Latn`
Alemán	`de`	`Latn`
Hebreo	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandés	`is`	`Latn`
Indonesio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonés	`ja`	`Jpan`
Coreano	`ko`	`Kore`
Letón	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedonio	`mk`	`Cyrl`
Malayo	`ms`	`Latn`
Marathi	`mr`	`Deva`
Nepalí	`ne`	`Deva`
Noruego	`no`	`Latn`
Persa	`fa`	`Arab`
Polaco	`pl`	`Latn`
Portugués (Brasil y Portugal)	`pt`	`Latn`
Rumano	`ro`	`Latn`
Ruso	`ru`	`Cyrl`
Serbio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Español	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versiones del procesador

ID de versión	Canal de lanzamiento	Campos adicionales detectados	Descripción
`pretrained-form-parser-v1.0-2020-09-23`	Estable	Ninguno	Versión antigua. Para obtener la mejor calidad y el conjunto de funciones completo, usa la versión 2.0 del analizador de formularios.
`pretrained-form-parser-v2.0-2022-11-10`	Estable	Mostrar campos `email` `phone` `url` `date_time` `address` `person` `organization` `quantity` `price` `id` `page_number`	Versión recomendada. Admite entidades genéricas e incluye modelos de tabla, KVP y casilla mejorados, así como más de 200 idiomas.
`pretrained-form-parser-v2.1-2023-06-26`	Versión candidata	Ninguno	Versión preliminar pública. Es el mismo modelo que la versión 2.0, pero con la extracción de texto nativa de archivos PDF digitales habilitada.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	100
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	30

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Más información Analizador de formularios

Analizador de diseños

Descripción

Extrae elementos de contenido de documentos (texto, tablas y listas) y crea fragmentos contextualizados.

Layout Parser extrae elementos de contenido de documentos, como texto, tablas y listas, y crea fragmentos contextualizados que facilitan la recuperación de información en aplicaciones de IA generativa y de descubrimiento.

Categoría Extraer

Funciones Análisis de diseños y división de documentos en fragmentos

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API LAYOUT_PARSER_PROCESSOR

Notas

Este analizador admite archivos PDF, HTML, DOCX, PPTX y XLSX/XLSM.

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Afrikáans	`af`	`Latn`
Albanés	`sq`	`Latn`
Árabe	`ar`	`Arab`
Armenio	`hy`	`Armn`
Bielorruso	`be`	`Cyrl`
Bengalí	`bn`	`Beng`
Bengalí	`bn`	`Beng`
Búlgaro	`bg`	`Cyrl`
Catalán	`ca`	`Latn`
Chino	`zh`	`Hani`
Croata	`hr`	`Latn`
Checo	`cs`	`Latn`
Danés	`da`	`Latn`
neerlandés	`nl`	`Latn`
Inglés	`en`	`Latn`
Estonio	`et`	`Latn`
Filipino	`fil`	`Latn`
Finés	`fi`	`Latn`
Francés	`fr`	`Latn`
Alemán	`de`	`Latn`
Griego	`el`	`Grek`
Guyaratí	`gu`	`Gujr`
Hebreo	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandés	`is`	`Latn`
Indonesio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonés	`ja`	`Jpan`
Canarés	`kn`	`Knda`
Jemer	`km`	`Khmr`
Coreano	`ko`	`Kore`
Lao	`lo`	`Laoo`
Letón	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedonio	`mk`	`Cyrl`
Malayo	`ms`	`Latn`
Malabar	`ml`	`Mlym`
Marathi	`mr`	`Deva`
Nepalí	`ne`	`Deva`
Noruego	`no`	`Latn`
Persa	`fa`	`Arab`
Polaco	`pl`	`Latn`
Portugués (Brasil y Portugal)	`pt`	`Latn`
Panyabí	`pa`	`Guru`
Rumano	`ro`	`Latn`
Ruso	`ru`	`Cyrl`
Serbio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Español	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugú	`te`	`Telu`
Tailandés	`th`	`Thai`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Yiddish	`yi`	`Hebr`

Versiones del procesador

ID de versión	Canal de lanzamiento	Descripción
`pretrained-layout-parser-v1.0-2024-06-03`	Estable	Versión recomendada.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	500
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	30

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

eu
us

Más información Analizador de diseños

Consultar procesadores preentrenados

Analizador de extractos bancarios

Descripción

Extraer información de extractos bancarios, como el nombre, la cuenta, las transacciones, etc.

Categoría Preentrenado

Funciones OCR y extracción de entidades

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API BANK_STATEMENT_PROCESSOR

Notas

Si una página de un archivo de entrada de varias páginas es del tipo de documento correcto y de una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento admitido. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, devuelve un mensaje de error.

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Escritura a mano admitida
Inglés	`en`	`Latn`

Versiones del procesador

ID de versión	Canal de lanzamiento	Descripción
`pretrained-bankstatement-v1.0-2021-08-08`	Estable
`pretrained-bankstatement-v1.1-2021-08-13`	Estable
`pretrained-bankstatement-v2.0-2021-12-10`	Estable
`pretrained-bankstatement-v3.0-2022-05-16`	Estable	En esta versión se presupone que el archivo de entrada contiene un único extracto bancario. A diferencia de la versión predeterminada, esta versión no comprueba si el archivo de entrada contiene extractos bancarios y no devolverá ningún error si no se encuentra ninguno.
`pretrained-bankstatement-v4.0-2023-07-31`	Versión candidata
`pretrained-bankstatement-v5.0-2023-12-06`	Versión candidata

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	30
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	30

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

account_number
account_type
bank_address
bank_name
client_address
client_name
ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item

table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_deposit_description
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date
table_item/transaction_withdrawal_description

Campos enriquecidos

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos

bank_address
bank_name

Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

Uptraining

Instrucciones de etiquetado Abrir en una ventana nueva.

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

eu
us

Analizador de formularios W‐2

Descripción

Extrae información del formulario W2, como el empleado, la empresa, los salarios, etc.

Categoría Preentrenado

Funciones OCR y extracción de entidades

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API FORM_W2_PROCESSOR

Notas

Si una página de un archivo de entrada de varias páginas es del tipo de documento correcto y de una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento admitido. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, devuelve un mensaje de error.

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Escritura a mano admitida
Inglés	`en`	`Latn`

Formulario o versiones admitidas

2020 (versiones estándar y personalizadas)
2019 (versiones estándar y personalizadas)
2018 (versiones estándar y personalizadas)

Versiones del procesador

ID de versión	Canal de lanzamiento	Campos adicionales detectados	Descripción
`pretrained-w2-v1.0-2020-10-01`	Estable	Ninguno
`pretrained-w2-v1.1-2022-01-27`	Estable	Ninguno
`pretrained-w2-v1.2-2022-01-28`	Estable	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress` `EmployeeName` `EmployerNameAndAddress` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalityName_Line1` `LocalWagesTipsEtc_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `SSN` `State_Line1` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `WagesTipsOtherCompensation`	Mejoras de calidad y compatibilidad con nuevos campos; no incluye el separador.
`pretrained-w2-v2.0-2022-03-30`	Versión candidata	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Mejoras en la calidad y compatibilidad con los campos de la casilla 12 y predicciones detalladas de `EmployeeName`, `EmployeeAddress` y `EmployerNameAndAddress`, que ya no forman parte de la salida y se han sustituido por campos adicionales.
`pretrained-w2-v2.1-2022-06-08`	Estable	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployeeName_Suffix` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Es similar a la versión `pretrained-w2-v2.0-2022-03-30`, pero con mejoras de calidad adicionales y la incorporación de una entidad más: `EmployeeName_Suffix`.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	15
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	15

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

ControlNumber
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
FederalIncomeTaxWithheld
MedicareTaxWithheld
MedicareWagesAndTips
SSN
SocialSecurityTaxWithheld
SocialSecurityWages
WagesTipsOtherCompensation

Campos enriquecidos

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos

EmployerNameAndAddress
EIN

Uptraining

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

eu
us

Analizador de pasaportes de EE. UU.

Descripción

Extraer campos como nombres, IDs de documentos o fechas de nacimiento.

Categoría Preentrenado

Funciones OCR y extracción de entidades

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API US_PASSPORT_PROCESSOR

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Escritura a mano admitida
Inglés	`en`	`Latn`

Versiones del procesador

ID de versión	Canal de lanzamiento	Descripción
`pretrained-us-passport-v1.0-2021-06-14`	Estable

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	2
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	2
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	2

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
MRZ Code
Portrait

Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

Date Of Birth
Expiration Date
Issue Date

Uptraining

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

eu
us

Analizador de utilidades

Descripción

Extrae texto y valores de facturas de servicios públicos, como el nombre del proveedor y el importe pagado anteriormente.

Categoría Preentrenado

Funciones OCR y extracción de entidades

Fase de lanzamiento Disponibilidad general

Estado del acceso Limitado ^[*]

Escribir en la API UTILITY_PROCESSOR

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Escritura a mano admitida
Inglés	`en`	`Latn`

Versiones del procesador

ID de versión	Canal de lanzamiento	Descripción
`pretrained-utility-v1.1-2021-04-09`	Estable
`pretrained-utility-v1.2-2022-12-15`	Versión candidata

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	10
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	200
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	30

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

adjusted_amount
amount_due
balance_transfer_amount
carrier
currency
currency_exchange_rate
delivery_date
deposit_credited_amount
due_date
freight_amount
invoice_date
invoice_id
late_fee_amount
line_item

line_item/amount
line_item/description
line_item/frequency
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/service_address
line_item/service_end_date
line_item/service_id_1
line_item/service_id_2
line_item/service_start_date
line_item/supplier_account_number
line_item/tax_amount
line_item/unit_number
line_item/unit_of_measure
line_item/unit_price
line_item/usage

net_amount
payment_terms
prior_amount_due
prior_paid_amount
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
reclaimed_water
remit_to_address
remit_to_name
service

service/service_end_date
service/service_id
service/service_start_date
service/unit_of_measure
service/usage

service_address
service_end_date
service_id
service_start_date
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_account_number
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
tampering
total_amount
total_tax_amount
usage
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

adjusted_amount
amount_due
balance_transfer_amount
currency
currency_exchange_rate
delivery_date
due_date
invoice_date
late_fee_amount
line_item/amount
line_item/quantity
line_item/tax_amount
line_item/unit_price
net_amount
prior_amount_due
prior_paid_amount
total_amount
total_tax_amount

Uptraining

Instrucciones de etiquetado Abrir en una ventana nueva.

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

eu
us

Analizador de verificación de documentos de identidad

Descripción

Predice la validez de los documentos de identificación mediante varias señales.

El procesador de verificación de documentos de identidad se ha diseñado para ayudar a predecir la validez de los documentos de identificación con cuatro señales diferentes.

Actualmente, el procesador devuelve información de las siguientes señales:

Detección de fraud_signals_is_identity_document: predice si una imagen contiene un documento de identificación reconocido.
Detección de fraud_signals_suspicious_words: predice si hay palabras que no son habituales en los documentos de identificación.
Detección de fraud_signals_image_manipulation: predice si la imagen se ha alterado o manipulado con una herramienta de edición de imágenes.
fraud_signals_online_duplicate: predice si la imagen se puede encontrar online (solo en EE. UU.).

Categoría Preentrenado

Funciones OCR y análisis de calidad

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API ID_PROOFING_PROCESSOR

Notas

Actualmente, la función de detección de duplicados online se procesa en centros de datos de EE. UU. La asistencia regional y multirregional no está disponible para esta función fuera de EE. UU.
Este procesador es compatible con algoritmos que se actualizan con más frecuencia que las nuevas versiones del procesador. Por este motivo, el procesador puede devolver resultados diferentes a lo largo del tiempo, incluso cuando se usa la misma versión del procesador. Por ejemplo, el sistema de detección de duplicados online monitoriza las imágenes presentes en la Web. El comportamiento del sistema puede cambiar más rápido de lo que se puede registrar en las versiones del procesador.
Consulta las notas sobre la IA responsable^[†] y la revisión humana.^[‡]

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Escritura a mano admitida
Inglés	`en`	`Latn`

Formulario o versiones admitidas

Se admiten pasaportes, tarjetas de acceso y carnés de conducir de EE. UU.

Versiones del procesador

ID de versión	Canal de lanzamiento	Campos adicionales detectados	Descripción
`pretrained-id-proofing-v1.0-2022-10-03`	Estable	Ninguno
`pretrained-id-proofing-v1.1-2023-05-18`	Versión candidata	Mostrar campos `fraud_signals_photocopy_detection`	Señal adicional de detección de fotocopias
`pretrained-id-proofing-v1.2-2023-10-04`	Versión candidata	Mostrar campos `fraud_signals_photocopy_detection`

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	2
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	2
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	2

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

fraud_signals_is_identity_document
fraud_signals_suspicious_words
evidence_suspicious_word
evidence_inconclusive_suspicious_word
fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_photocopy_detection
evidence_hostname (US only)
evidence_thumbnail_url (US only)

Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

Uptraining

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

eu
us

Analizador de nóminas

Descripción

Extraer información de nóminas, como el nombre, la empresa o las cantidades.

Categoría Preentrenado

Funciones OCR y extracción de entidades

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API PAYSTUB_PROCESSOR

Notas

Si el documento de entrada de varias páginas contiene más de una nómina válida, el procesador extrae entidades solo de la primera nómina válida. Si no se encuentran nóminas en el archivo de entrada, el procesador devuelve un mensaje de error.

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Escritura a mano admitida
Inglés	`en`	`Latn`

Versiones del procesador

ID de versión	Canal de lanzamiento	Campos adicionales detectados	Descripción
`pretrained-paystub-v1.0-2021-03-19`	Estable	Ninguno
`pretrained-paystub-v1.1-2021-08-13`	Estable	Mostrar campos `net_pay` `net_pay_ytd` `employee_account_number`	Mejoras de calidad y compatibilidad con nuevos campos.
`pretrained-paystub-v1.2-2021-12-10`	Estable	Ninguno
`pretrained-paystub-v2.0-2022-05-17`	Versión candidata	Mostrar campos `deduction_item` `deduction_item/deduction_type` `deduction_item/deduction_this_period` `deduction_item/deduction_ytd` `direct_deposit_item` `direct_deposit_item/direct_deposit` `direct_deposit_item/employee_account_number` `earning_item` `earning_item/earning_type` `earning_item/earning_rate` `earning_item/earning_hours` `earning_item/earning_this_period` `earning_item/earning_ytd` `page_number` `tax_item` `tax_item/tax_type` `tax_item/tax_this_period` `tax_item/tax_ytd` `federal_additional_tax` `federal_allowance` `federal_marital_status` `state_additional_tax` `state_allowance` `state_marital_status`	En esta versión, se presupone que el archivo de entrada contiene una sola nómina. A diferencia de la versión predeterminada, esta versión no comprueba si el archivo de entrada contiene nóminas y no devolverá ningún error si no se encuentra ninguna. Mejoras en la calidad, compatibilidad con campos nuevos y nuevo esquema. Las bonificaciones, las comisiones, las vacaciones, las horas extraordinarias y el salario normal ahora forman parte de earning_item/earning_this_period, y sus versiones acumuladas desde principios de año se encuentran en earning_item/earning_ytd. Los campos Direct Deposit y Employee Account Number ahora están anidados en direct_deposit_item. El límite de páginas asíncronas es 10.
`pretrained-paystub-v2.0-2022-07-22`	Estable	Ninguno	Mejoras en la calidad y en la formación complementaria.
`pretrained-paystub-v3.0-2023-12-06`	Versión candidata	Ninguno

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	50
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	30

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
employee_address
employee_name
employer_address
employer_name
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
ssn
start_date
vacation
vacation_ytd

Campos enriquecidos

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos

employer_address
employer_name

Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

Uptraining

Instrucciones de etiquetado Abrir en una ventana nueva.

Regiones admitidas

eu
us

Analizador de carnés de conducir de EE. UU.

Descripción

Extraer campos como nombres, IDs de documentos o fechas de nacimiento.

Categoría Preentrenado

Funciones OCR y extracción de entidades

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API US_DRIVER_LICENSE_PROCESSOR

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Escritura a mano admitida
Inglés	`en`	`Latn`

Formulario o versiones admitidas

Es compatible con los 50 estados y centros de datos.

Versiones del procesador

ID de versión	Canal de lanzamiento	Descripción
`pretrained-us-driver-license-v1.0-2021-06-14`	Estable

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	2
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	2
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	2

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
Address
Portrait

Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

Date Of Birth
Expiration Date
Issue Date

Uptraining

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

eu
us

Analizador de gastos

Descripción

Extrae texto y valores de documentos de gastos, como la fecha del gasto, el nombre del proveedor, el importe total y la moneda.

Categoría Preentrenado

Funciones OCR y extracción de entidades

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API EXPENSE_PROCESSOR

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Alemán	`de`	`Latn`
Inglés	`en`	`Latn`
Español	`es`	`Latn`
Francés	`fr`	`Latn`
Japonés	`ja`	`Jpan`
neerlandés	`nl`	`Latn`

Versiones del procesador

ID de versión	Canal de lanzamiento	Campos adicionales detectados	Idiomas adicionales disponibles	Descripción
`pretrained-expense-v1.1-2021-04-09`	Estable	Ninguno	Ninguno	Lanzado en abril del 2021.
`pretrained-expense-v1.3.2-2024-09-11`	Versión candidata	Mostrar campos `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: japonés	Una actualización a la versión 1.3 con un modelo de visión subyacente mejorado.
`pretrained-expense-v1.4-2022-11-18`	Versión candidata	Mostrar campos `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: japonés `it`: italiano `pt`: portugués (Portugal y Brasil)	Mejoras de rendimiento y compatibilidad con el entrenamiento adicional. El límite máximo de páginas (solicitudes online o síncronas) se ha aumentado a 15. Nota: Dejará de estar disponible en Estados Unidos y en la Unión Europea a partir del 30 de abril del 2025.
`pretrained-expense-v1.4.2-2024-09-12`	Versión candidata	Mostrar campos `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: japonés `it`: italiano `pt`: portugués (Portugal y Brasil)	Actualización a la versión 1.4 con un modelo de visión subyacente mejorado.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	10
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	10
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	10

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

credit_card_last_four_digits
currency
end_date
net_amount
payment_type
purchase_time
receipt_date
start_date
supplier_address
supplier_city
supplier_name
tip_amount
total_amount
total_tax_amount
line_item

line_item/amount
line_item/description
line_item/product_code

Campos enriquecidos

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos

supplier_address
supplier_name
supplier_phone

Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

Uptraining

Instrucciones de etiquetado Abrir en una ventana nueva.

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Análisis de facturas

Descripción

Extrae texto y valores de las facturas, como el número de factura, el nombre del proveedor, el importe de la factura, el importe de los impuestos, la fecha de la factura y la fecha de vencimiento.

El analizador de facturas extrae los campos del encabezado y de las líneas de pedido, como el número de factura, el nombre del proveedor, el importe de la factura, el importe de los impuestos, la fecha de la factura, la fecha de vencimiento y los importes de las líneas de pedido.

Categoría Preentrenado

Funciones OCR y extracción de entidades

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API INVOICE_PROCESSOR

Idiomas admitidos

Lista completa de idiomas

Idioma	Etiqueta BCP 47	Secuencia de comandos
Alemán	`de`	`Latn`
Inglés	`en`	`Latn`
Español	`es`	`Latn`
Estonio	`et`	`Latn`
Francés	`fr`	`Latn`
Italiano	`it`	`Latn`
Letón	`lv`	`Latn`
Lituano	`lt`	`Latn`
neerlandés	`nl`	`Latn`
Portugués (Brasil y Portugal)	`pt`	`Latn`
Rumano	`ro`	`Latn`
Sueco	`sv`	`Latn`

Versiones del procesador

ID de versión	Canal de lanzamiento	Idiomas adicionales disponibles	Descripción
`pretrained-invoice-v1.1-2021-04-09`	Estable	Ninguno
`pretrained-invoice-v1.2-2022-02-18`	Estable	Ninguno	La retirada está prevista para pronto.
`pretrained-invoice-v1.3-2022-07-15`	Estable	`it`: italiano `pt`: portugués (Portugal y Brasil) `ro`: rumano `sv`: sueco `et`: estonio `lv`: letón `lt`: lituano	Versión del procesador que se puede actualizar. El número máximo de páginas (solicitudes online o síncronas) se ha aumentado a 15.
`pretrained-invoice-v1.4-2022-10-21`	Versión candidata	Ninguno	Versión del procesador que se puede actualizar. El número máximo de páginas (solicitudes online o síncronas) se ha aumentado a 15.
`pretrained-invoice-v1.5-2023-09-15`	Versión candidata	Ninguno
`pretrained-invoice-v2.0-2023-12-06`	Versión candidata	Ninguno

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	200
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	30

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos

amount_paid_since_last_invoice
carrier
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
invoice_id
line_item

line_item/amount
line_item/description
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/unit
line_item/unit_price

net_amount
payment_terms
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
remit_to_address
remit_to_name
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
total_amount
total_tax_amount
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Campos enriquecidos

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos

supplier_address
supplier_name
supplier_phone

Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

Uptraining

Instrucciones de etiquetado Abrir en una ventana nueva.

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Clasificar documentos

Clasificador personalizado

Descripción

Entrena un modelo para clasificar un tipo de documento a partir de un conjunto de clases.

Categoría Clasificar

Funciones OCR, clasificación

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API CUSTOM_CLASSIFICATION_PROCESSOR

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Escritura a mano admitida
Inglés	`en`	`Latn`

Versiones del procesador

ID de versión	Canal de lanzamiento	Descripción
`pretrained-foundation-model-v1.4-2025-05-16`	Versión candidata	Versión candidata basada en el LLM Gemini 2.0 Flash. También incluye funciones avanzadas de OCR.
`pretrained-classifier-v1.5-2025-08-05`	Versión candidata	Versión candidata para lanzamiento basada en el LLM Gemini 2.5 Flash. También incluye funciones avanzadas de OCR.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	200
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	30

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Más información Crear un procesador de clasificación personalizado

Divisor personalizado

Descripción

Entrena un modelo para dividir un archivo que contenga varios documentos en documentos individuales clasificados.

Categoría Clasificar

Funciones OCR, clasificación y división

Fase de lanzamiento Disponibilidad general

Estado del acceso Público

Escribir en la API CUSTOM_SPLITTING_PROCESSOR

Notas

La internacionalización solo se puede admitir mediante opciones de entrenamiento personalizadas.

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Escritura a mano admitida
Inglés	`en`	`Latn`

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	1000
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	30

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Más información Crear un procesador de divisiones personalizado

Resume documentos

Resumidor

Descripción

Obtén resúmenes y listas con viñetas de documentos cortos y largos.

Categoría preentrenado

Funciones Resumir

Fase de lanzamiento Vista previa

Estado del acceso Público

Escribir en la API SUMMARY_PROCESSOR

Idiomas admitidos

Idioma	Etiqueta BCP 47	Secuencia de comandos	Escritura a mano admitida
Inglés	`en`	`Latn`

Versiones del procesador

ID de versión	Canal de lanzamiento	Descripción
`pretrained-foundation-model-v1.0-2023-08-22`	Estable	Modelo fundacional de Google

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites

Número máximo de páginas (solicitudes online o síncronas):	15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas):	250
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas):	30

Nota: Para ampliar el límite máximo de páginas de las solicitudes online y síncronas a 30, habilita imageless_mode en ProcessRequest.

Uptraining

Archivo de entrada de ejemplo Abrir en una ventana nueva.

Ejemplo de salida Abrir en una ventana nueva.

Regiones admitidas

us

Más información Resumidor personalizado

Notas a pie de página

^[*] Este procesador solo está disponible para los clientes que tienen acceso limitado.

Para solicitar acceso a la API, rellena y envía el formulario de solicitud de acceso limitado a Document AI para clientes. En el formulario se solicita información sobre ti, tu empresa y tu caso práctico. Ten en cuenta que se necesita un ID de proyecto de Google Cloud para acceder. Para crear un proyecto de Google Cloud o identificar el ID de su proyecto, consulta las instrucciones que aparecen a continuación.

Una vez que hayas enviado el formulario, el equipo de Document AI revisará tu solicitud para comprobar que cumples los criterios de acceso. Si se aprueba la solicitud, recibirás un correo electrónico con instrucciones para acceder a esta función y usarla.

^[†] La verificación de documentos de identificación extrae y evalúa información de documentos de identificación que contribuye a determinar si la imagen introducida representa un documento de identificación auténtico.

En Google Cloud, priorizamos ayudar a los clientes a desarrollar e implementar soluciones de IA de forma segura, y la verificación de identidad se ha desarrollado de acuerdo con los principios de IA de Google.

De acuerdo con los principios de la IA de Google y el diseño de producto actual, te recomendamos que actúes con precaución y evalúes detenidamente las posibles ventajas y los riesgos de usar la verificación de documentos de identificación en los siguientes casos:

Toma de decisiones sin intervención humana en predicciones que pueden afectar a los derechos humanos.
En ámbitos sensibles, como el empleo, el acceso a servicios públicos, la sanidad y los contextos de seguridad.

^[‡] Utiliza siempre la prueba de identidad como parte de tu proceso y flujo de trabajo de detección de identidad más amplios. Es importante que incluya a un revisor humano en su flujo de trabajo para verificar si las señales predichas son precisas. El procesador de verificación de identidad no está diseñado para sustituir la revisión humana de los documentos de identificación en un flujo de trabajo, sino para ayudar a los revisores humanos a validar los documentos de identificación. El procesador de verificación de identidad no debe usarse como una herramienta de decisión automatizada para determinar si un documento de identificación es válido. Gracias a la revisión humana, los clientes pueden procesar documentos con mayor precisión y ayudar a las empresas a evaluar las predicciones con herramientas específicas que permiten habilitar dichas revisiones.

Asegúrate de revisar las normativas de la región en la que vas a implementar esta tecnología y de investigar las directrices del sector para conocer las políticas y los problemas de equidad habituales. Consulta información sobre la equidad en el aprendizaje automático, incluidas las formas de mitigar los sesgos en los conjuntos de datos de entrenamiento, evaluar las disparidades en el rendimiento de los modelos personalizados y otras consideraciones que debes tener en cuenta al usar tu modelo personalizado.

Recomendamos a los clientes que tengan en cuenta las prácticas recomendadas de equidad, interpretabilidad, privacidad y seguridad al implementar la verificación de identidad. Para obtener más información sobre cómo implementar la IA responsable, consulta las recomendaciones de Google sobre las prácticas de IA responsable.

Consulta la entrada de blog Automatizar el procesamiento de documentos de identificación con Document AI para obtener más información sobre los casos prácticos y un repositorio de código de aplicación de ejemplo.

Archivos admitidos

Lista de procesadores Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Digitalizar texto

Reconocimiento óptico de caracteres (OCR) en documentos de empresa

Lista completa de idiomas

Extraer entidades de documentos

Extractor personalizado

Lista completa de idiomas

Lista completa de tipos de datos normalizados

Análisis de formularios

Lista completa de idiomas

Mostrar campos

Analizador de diseños

Lista completa de idiomas

Consultar procesadores preentrenados

Analizador de extractos bancarios

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Analizador de formularios W‐2

Mostrar campos

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Analizador de pasaportes de EE. UU.

Lista completa de campos

Lista completa de campos normalizados

Analizador de utilidades

Lista completa de campos

Lista completa de campos normalizados

Analizador de verificación de documentos de identidad

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos normalizados

Analizador de nóminas

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Analizador de carnés de conducir de EE. UU.

Lista completa de campos

Lista completa de campos normalizados

Analizador de gastos

Lista completa de idiomas

Mostrar campos

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Análisis de facturas

Lista completa de idiomas

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Clasificar documentos

Clasificador personalizado

Divisor personalizado

Resume documentos

Resumidor

Notas a pie de página

Lista de procesadores