Lista de procesadores

En esta página se incluye información detallada sobre todos los procesadores que ofrece Document AI. Puedes ver una lista de todos los procesadores por tipo de solución.

Todos los procesadores de Document AI cumplen los Términos de Seguridad y Tratamiento de Datos.

Consulta más información en la documentación sobre gestión de versiones de procesador. Además, se aplican límites específicos a los procesadores, que se suman a las cuotas y los límites generales del producto.

Digitalizar texto

Reconocimiento óptico de caracteres (OCR) en documentos de empresa

Descripción

Identifica y extrae texto de diferentes tipos de documentos.

Este procesador identifica y extrae texto, incluido texto escrito a mano, de documentos en más de 200 idiomas. El procesador también usa el aprendizaje automático para evaluar la calidad de un documento en función de la legibilidad de su contenido.

Categoría Digitalizar
Funciones OCR y análisis de calidad
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API OCR_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Afrikáans af Latn
Albanés sq Latn
Árabe ar Arab
Armenio hy Armn
Bielorruso be Cyrl
Bengalí bn Beng
Bengalí bn Beng
Búlgaro bg Cyrl
Catalán ca Latn
Chino zh Hani
Croata hr Latn
Checo cs Latn
Danés da Latn
neerlandés nl Latn
Inglés en Latn
Estonio et Latn
Filipino fil Latn
Finés fi Latn
Francés fr Latn
Alemán de Latn
Griego el Grek
Guyaratí gu Gujr
Hebreo iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandés is Latn
Indonesio id Latn
Italiano it Latn
Japonés ja Jpan
Canarés kn Knda
Jemer km Khmr
Coreano ko Kore
Lao lo Laoo
Letón lv Latn
Lituano lt Latn
Macedonio mk Cyrl
Malayo ms Latn
Malabar ml Mlym
Marathi mr Deva
Nepalí ne Deva
Noruego no Latn
Persa fa Arab
Polaco pl Latn
Portugués (Brasil y Portugal) pt Latn
Panyabí pa Guru
Rumano ro Latn
Ruso ru Cyrl
Serbio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Español es Latn
Sueco sv Latn
Tagalo tl Latn
Tamil ta Taml
Telugú te Telu
Tailandés th Thai
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versiones del procesador
ID de versión Canal de lanzamiento Descripción
pretrained-ocr-v1.2-2022-11-10 Estable Versión del modelo inmovilizada de la versión 1.0: archivos de modelo, configuraciones y archivos binarios de una captura de versión inmovilizada en una imagen de contenedor durante un máximo de 18 meses.
pretrained-ocr-v2.0-2023-06-02 Estable Modelo listo para producción especializado en casos prácticos de documentos. Incluye acceso a todos los complementos de OCR.
pretrained-ocr-v2.1-2024-08-07 Estable Las principales áreas de mejora de la versión 2.1 son: mejor reconocimiento de texto impreso, detección más precisa de casillas de verificación y orden de lectura más preciso.
pretrained-ocr-v2.1.1-2025-01-31 Versión candidata La versión 2.1.1 es similar a la 2.1 y está disponible en todas las regiones, excepto en US, EU y asia-southeast1.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 500
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 30
Uptraining
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Enterprise Document OCR

Extraer entidades de documentos

Consulta Conjuntos de datos de ejemplo para ver conjuntos de datos etiquetados y sin etiquetar que puedes usar para el entrenamiento.

Extractor personalizado

Descripción

Extrae campos de documentos con IA generativa o modelos personalizados, y ajusta los modelos para extraer datos de tus documentos con precisión.

Categoría Extraer
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API CUSTOM_EXTRACTION_PROCESSOR
Notas
  • Si usas la IA generativa para la extracción, haz lo siguiente:

    • Solo se admite oficialmente el inglés.
    • La disponibilidad regional es en US, EU, northamerica-northeast1 y asia-southeast1.

Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Afrikáans af Latn
Árabe ar Arab
Azerí az Latn
Azerí (cirílico) az-Cyrl Cyrl
Bielorruso be Cyrl
Búlgaro bg Cyrl
Bosnio bs Latn
Catalán ca Latn
Cebuano ceb Latn
Checo cs Latn
Galés cy Latn
Danés da Latn
Alemán de Latn
Griego el Grek
Inglés en Latn
Esperanto eo Latn
Español es Latn
Estonio et Latn
Euskera eu Latn
Persa fa Arab
Finés fi Latn
Filipino fil Latn
Francés fr Latn
Irlandés ga Latn
Gallego gl Latn
Hindi hi Deva
Croata hr Latn
Criollo haitiano ht Latn
Húngaro hu Latn
Indonesio id Latn
Islandés is Latn
Italiano it Latn
Hebreo iw Hebr
Japonés ja Jpan
Javanés jv Latn
Kazajo kk Cyrl
Coreano ko Kore
Kirguís ky Cyrl
Latín la Latn
Lituano lt Latn
Letón lv Latn
Macedonio mk Cyrl
Mongol mn Cyrl
Marathi mr Deva
Malayo ms Latn
Maltés mt Latn
Nepalí ne Deva
neerlandés nl Latn
Noruego no Latn
Polaco pl Latn
Pastún ps Arab
Portugués (Brasil y Portugal) pt Latn
Rumano ro Latn
Ruso ru Cyrl
Ruso (ortografía petrina) ru-PETR1708 Cyrl
Sánscrito sa Deva
Eslovaco sk Latn
Esloveno sl Latn
Albanés sq Latn
Serbio sr Cyrl
Sueco sv Latn
Swahili sw Latn
Tagalo tl Latn
Turco tr Latn
Ucraniano uk Cyrl
Urdu ur Arab
Uzbeko uz Latn
Uzbeko (cirílico) uz-Cyrl Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Chino simplificado zh-Hans Hani
Chino tradicional zh-Hant Hani
Zulú zu Latn
Versiones del procesador
ID de versión Canal de lanzamiento Descripción
pretrained-foundation-model-v1.4-2025-02-05 Estable Modelo GA que usa el LLM Gemini 2.0 Flash. También incluye funciones avanzadas de OCR, como la detección de casillas de verificación.
pretrained-foundation-model-v1.5-2025-05-05 Estable Candidato listo para producción basado en el LLM Gemini 2.5 Flash. Recomendado para quienes quieran experimentar con modelos más recientes.
pretrained-foundation-model-v1.5-pro-2025-06-20 Estable Modelo listo para producción que usa el LLM Gemini 2.5 Pro. Admite una cuota de hasta 30 páginas por minuto para las solicitudes de proceso online. Este modelo tiene una calidad mejorada en comparación con la versión 1.5 y puede tener una latencia mayor.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 30
Tipos de datos normalizados

Puedes consultar más información en las páginas Enriquecimiento y normalización y Crear conjunto de datos.

Lista completa de tipos de datos normalizados
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Extractor personalizado

Análisis de formularios

Descripción

Extrae pares clave-valor generales (entidades y casillas de verificación), tablas y entidades genéricas de documentos, además de texto de OCR.

Este procesador aplica tecnologías avanzadas de aprendizaje automático para extraer pares clave-valor, casillas de verificación y tablas de documentos en más de 200 idiomas. Este procesador también utiliza modelos de aprendizaje profundo para extraer 11 entidades genéricas que son habituales en varios tipos de documentos.

Categoría Extraer
Funciones Reconocimiento óptico de caracteres, análisis de formularios y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API FORM_PARSER_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Afrikáans af Latn
Albanés sq Latn
Árabe ar Arab
Bielorruso be Cyrl
Catalán ca Latn
Chino zh Hani
Croata hr Latn
Checo cs Latn
Danés da Latn
neerlandés nl Latn
Inglés en Latn
Estonio et Latn
Filipino fil Latn
Finés fi Latn
Francés fr Latn
Alemán de Latn
Hebreo iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandés is Latn
Indonesio id Latn
Italiano it Latn
Japonés ja Jpan
Coreano ko Kore
Letón lv Latn
Lituano lt Latn
Macedonio mk Cyrl
Malayo ms Latn
Marathi mr Deva
Nepalí ne Deva
Noruego no Latn
Persa fa Arab
Polaco pl Latn
Portugués (Brasil y Portugal) pt Latn
Rumano ro Latn
Ruso ru Cyrl
Serbio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Español es Latn
Sueco sv Latn
Tagalo tl Latn
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versiones del procesador
ID de versión Canal de lanzamiento Campos adicionales detectados Descripción
pretrained-form-parser-v1.0-2020-09-23 Estable

Ninguno

Versión antigua. Para obtener la mejor calidad y el conjunto de funciones completo, usa la versión 2.0 del analizador de formularios.
pretrained-form-parser-v2.0-2022-11-10 Estable
Mostrar campos
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number
Versión recomendada. Admite entidades genéricas e incluye modelos de tabla, KVP y casilla mejorados, así como más de 200 idiomas.
pretrained-form-parser-v2.1-2023-06-26 Versión candidata

Ninguno

Versión preliminar pública. Es el mismo modelo que la versión 2.0, pero con la extracción de texto nativa de archivos PDF digitales habilitada.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 100
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 30
Uptraining
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Analizador de formularios

Analizador de diseños

Descripción

Extrae elementos de contenido de documentos (texto, tablas y listas) y crea fragmentos contextualizados.

Layout Parser extrae elementos de contenido de documentos, como texto, tablas y listas, y crea fragmentos contextualizados que facilitan la recuperación de información en aplicaciones de IA generativa y de descubrimiento.

Categoría Extraer
Funciones Análisis de diseños y división de documentos en fragmentos
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API LAYOUT_PARSER_PROCESSOR
Notas
  • Este analizador admite archivos PDF, HTML, DOCX, PPTX y XLSX/XLSM.
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Afrikáans af Latn
Albanés sq Latn
Árabe ar Arab
Armenio hy Armn
Bielorruso be Cyrl
Bengalí bn Beng
Bengalí bn Beng
Búlgaro bg Cyrl
Catalán ca Latn
Chino zh Hani
Croata hr Latn
Checo cs Latn
Danés da Latn
neerlandés nl Latn
Inglés en Latn
Estonio et Latn
Filipino fil Latn
Finés fi Latn
Francés fr Latn
Alemán de Latn
Griego el Grek
Guyaratí gu Gujr
Hebreo iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandés is Latn
Indonesio id Latn
Italiano it Latn
Japonés ja Jpan
Canarés kn Knda
Jemer km Khmr
Coreano ko Kore
Lao lo Laoo
Letón lv Latn
Lituano lt Latn
Macedonio mk Cyrl
Malayo ms Latn
Malabar ml Mlym
Marathi mr Deva
Nepalí ne Deva
Noruego no Latn
Persa fa Arab
Polaco pl Latn
Portugués (Brasil y Portugal) pt Latn
Panyabí pa Guru
Rumano ro Latn
Ruso ru Cyrl
Serbio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Español es Latn
Sueco sv Latn
Tagalo tl Latn
Tamil ta Taml
Telugú te Telu
Tailandés th Thai
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versiones del procesador
ID de versión Canal de lanzamiento Descripción
pretrained-layout-parser-v1.0-2024-06-03 Estable Versión recomendada.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 500
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 30
Uptraining
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us
Más información Analizador de diseños

Consultar procesadores preentrenados

Analizador de extractos bancarios

Descripción

Extraer información de extractos bancarios, como el nombre, la cuenta, las transacciones, etc.

Categoría Preentrenado
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API BANK_STATEMENT_PROCESSOR
Notas
  • Si una página de un archivo de entrada de varias páginas es del tipo de documento correcto y de una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento admitido. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, devuelve un mensaje de error.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Inglés en Latn
Versiones del procesador
ID de versión Canal de lanzamiento Descripción
pretrained-bankstatement-v1.0-2021-08-08 Estable
pretrained-bankstatement-v1.1-2021-08-13 Estable
pretrained-bankstatement-v2.0-2021-12-10 Estable
pretrained-bankstatement-v3.0-2022-05-16 Estable En esta versión se presupone que el archivo de entrada contiene un único extracto bancario. A diferencia de la versión predeterminada, esta versión no comprueba si el archivo de entrada contiene extractos bancarios y no devolverá ningún error si no se encuentra ninguno.
pretrained-bankstatement-v4.0-2023-07-31 Versión candidata
pretrained-bankstatement-v5.0-2023-12-06 Versión candidata

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 30
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 30
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
Campos enriquecidos

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • bank_address
  • bank_name
Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de formularios W‐2

Descripción

Extrae información del formulario W2, como el empleado, la empresa, los salarios, etc.

Categoría Preentrenado
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API FORM_W2_PROCESSOR
Notas
  • Si una página de un archivo de entrada de varias páginas es del tipo de documento correcto y de una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento admitido. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, devuelve un mensaje de error.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Inglés en Latn
Formulario o versiones admitidas
  • 2020 (versiones estándar y personalizadas)
  • 2019 (versiones estándar y personalizadas)
  • 2018 (versiones estándar y personalizadas)
Versiones del procesador
ID de versión Canal de lanzamiento Campos adicionales detectados Descripción
pretrained-w2-v1.0-2020-10-01 Estable

Ninguno

pretrained-w2-v1.1-2022-01-27 Estable

Ninguno

pretrained-w2-v1.2-2022-01-28 Estable
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

Mejoras de calidad y compatibilidad con nuevos campos; no incluye el separador.

pretrained-w2-v2.0-2022-03-30 Versión candidata
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Mejoras en la calidad y compatibilidad con los campos de la casilla 12 y predicciones detalladas de EmployeeName, EmployeeAddress y EmployerNameAndAddress, que ya no forman parte de la salida y se han sustituido por campos adicionales.

pretrained-w2-v2.1-2022-06-08 Estable
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Es similar a la versión pretrained-w2-v2.0-2022-03-30, pero con mejoras de calidad adicionales y la incorporación de una entidad más: EmployeeName_Suffix.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 15
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 15
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
Campos enriquecidos

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • EmployerNameAndAddress
  • EIN
Uptraining
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de pasaportes de EE. UU.

Descripción

Extraer campos como nombres, IDs de documentos o fechas de nacimiento.

Categoría Preentrenado
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API US_PASSPORT_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Inglés en Latn
Versiones del procesador
ID de versión Canal de lanzamiento Descripción
pretrained-us-passport-v1.0-2021-06-14 Estable

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 2
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 2
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de utilidades

Descripción

Extrae texto y valores de facturas de servicios públicos, como el nombre del proveedor y el importe pagado anteriormente.

Categoría Preentrenado
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Limitado [*]
Escribir en la API UTILITY_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Inglés en Latn
Versiones del procesador
ID de versión Canal de lanzamiento Descripción
pretrained-utility-v1.1-2021-04-09 Estable
pretrained-utility-v1.2-2022-12-15 Versión candidata

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 10
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 30
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de verificación de documentos de identidad

Descripción

Predice la validez de los documentos de identificación mediante varias señales.

El procesador de verificación de documentos de identidad se ha diseñado para ayudar a predecir la validez de los documentos de identificación con cuatro señales diferentes.

Actualmente, el procesador devuelve información de las siguientes señales:

  • Detección de fraud_signals_is_identity_document: predice si una imagen contiene un documento de identificación reconocido.
  • Detección de fraud_signals_suspicious_words: predice si hay palabras que no son habituales en los documentos de identificación.
  • Detección de fraud_signals_image_manipulation: predice si la imagen se ha alterado o manipulado con una herramienta de edición de imágenes.
  • fraud_signals_online_duplicate: predice si la imagen se puede encontrar online (solo en EE. UU.).

Categoría Preentrenado
Funciones OCR y análisis de calidad
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API ID_PROOFING_PROCESSOR
Notas
  • Actualmente, la función de detección de duplicados online se procesa en centros de datos de EE. UU. La asistencia regional y multirregional no está disponible para esta función fuera de EE. UU.
  • Este procesador es compatible con algoritmos que se actualizan con más frecuencia que las nuevas versiones del procesador. Por este motivo, el procesador puede devolver resultados diferentes a lo largo del tiempo, incluso cuando se usa la misma versión del procesador. Por ejemplo, el sistema de detección de duplicados online monitoriza las imágenes presentes en la Web. El comportamiento del sistema puede cambiar más rápido de lo que se puede registrar en las versiones del procesador.
  • Consulta las notas sobre la IA responsable[†] y la revisión humana.[‡]
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Inglés en Latn
Formulario o versiones admitidas
  • Se admiten pasaportes, tarjetas de acceso y carnés de conducir de EE. UU.
Versiones del procesador
ID de versión Canal de lanzamiento Campos adicionales detectados Descripción
pretrained-id-proofing-v1.0-2022-10-03 Estable

Ninguno

pretrained-id-proofing-v1.1-2023-05-18 Versión candidata
Mostrar campos
  • fraud_signals_photocopy_detection

Señal adicional de detección de fotocopias

pretrained-id-proofing-v1.2-2023-10-04 Versión candidata
Mostrar campos
  • fraud_signals_photocopy_detection

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 2
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 2
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de nóminas

Descripción

Extraer información de nóminas, como el nombre, la empresa o las cantidades.

Categoría Preentrenado
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API PAYSTUB_PROCESSOR
Notas
  • Si el documento de entrada de varias páginas contiene más de una nómina válida, el procesador extrae entidades solo de la primera nómina válida. Si no se encuentran nóminas en el archivo de entrada, el procesador devuelve un mensaje de error.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Inglés en Latn
Versiones del procesador
ID de versión Canal de lanzamiento Campos adicionales detectados Descripción
pretrained-paystub-v1.0-2021-03-19 Estable

Ninguno

pretrained-paystub-v1.1-2021-08-13 Estable
Mostrar campos
  • net_pay
  • net_pay_ytd
  • employee_account_number
Mejoras de calidad y compatibilidad con nuevos campos.
pretrained-paystub-v1.2-2021-12-10 Estable

Ninguno

pretrained-paystub-v2.0-2022-05-17 Versión candidata
Mostrar campos
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

En esta versión, se presupone que el archivo de entrada contiene una sola nómina. A diferencia de la versión predeterminada, esta versión no comprueba si el archivo de entrada contiene nóminas y no devolverá ningún error si no se encuentra ninguna.

Mejoras en la calidad, compatibilidad con campos nuevos y nuevo esquema. Las bonificaciones, las comisiones, las vacaciones, las horas extraordinarias y el salario normal ahora forman parte de earning_item/earning_this_period, y sus versiones acumuladas desde principios de año se encuentran en earning_item/earning_ytd. Los campos Direct Deposit y Employee Account Number ahora están anidados en direct_deposit_item.

El límite de páginas asíncronas es 10.

pretrained-paystub-v2.0-2022-07-22 Estable

Ninguno

Mejoras en la calidad y en la formación complementaria.

pretrained-paystub-v3.0-2023-12-06 Versión candidata

Ninguno

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 50
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 30
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
Campos enriquecidos

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • employer_address
  • employer_name
Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
Instrucciones de etiquetado Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de carnés de conducir de EE. UU.

Descripción

Extraer campos como nombres, IDs de documentos o fechas de nacimiento.

Categoría Preentrenado
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API US_DRIVER_LICENSE_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Inglés en Latn
Formulario o versiones admitidas
  • Es compatible con los 50 estados y centros de datos.
Versiones del procesador
ID de versión Canal de lanzamiento Descripción
pretrained-us-driver-license-v1.0-2021-06-14 Estable

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 2
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 2
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de gastos

Descripción

Extrae texto y valores de documentos de gastos, como la fecha del gasto, el nombre del proveedor, el importe total y la moneda.

Categoría Preentrenado
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API EXPENSE_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Alemán de Latn
Inglés en Latn
Español es Latn
Francés fr Latn
Japonés ja Jpan
neerlandés nl Latn
Versiones del procesador
ID de versión Canal de lanzamiento Campos adicionales detectados Idiomas adicionales disponibles Descripción
pretrained-expense-v1.1-2021-04-09 Estable

Ninguno

Ninguno

Lanzado en abril del 2021.
pretrained-expense-v1.3.2-2024-09-11 Versión candidata
Mostrar campos
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: japonés
Una actualización a la versión 1.3 con un modelo de visión subyacente mejorado.
pretrained-expense-v1.4-2022-11-18 Versión candidata
Mostrar campos
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: japonés
  • it: italiano
  • pt: portugués (Portugal y Brasil)
Mejoras de rendimiento y compatibilidad con el entrenamiento adicional. El límite máximo de páginas (solicitudes online o síncronas) se ha aumentado a 15.
pretrained-expense-v1.4.2-2024-09-12 Versión candidata
Mostrar campos
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: japonés
  • it: italiano
  • pt: portugués (Portugal y Brasil)
Actualización a la versión 1.4 con un modelo de visión subyacente mejorado.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 10
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 10
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 10
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
Campos enriquecidos

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • supplier_address
  • supplier_name
  • supplier_phone
Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Análisis de facturas

Descripción

Extrae texto y valores de las facturas, como el número de factura, el nombre del proveedor, el importe de la factura, el importe de los impuestos, la fecha de la factura y la fecha de vencimiento.

El analizador de facturas extrae los campos del encabezado y de las líneas de pedido, como el número de factura, el nombre del proveedor, el importe de la factura, el importe de los impuestos, la fecha de la factura, la fecha de vencimiento y los importes de las líneas de pedido.

Categoría Preentrenado
Funciones OCR y extracción de entidades
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API INVOICE_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Alemán de Latn
Inglés en Latn
Español es Latn
Estonio et Latn
Francés fr Latn
Italiano it Latn
Letón lv Latn
Lituano lt Latn
neerlandés nl Latn
Portugués (Brasil y Portugal) pt Latn
Rumano ro Latn
Sueco sv Latn
Versiones del procesador
ID de versión Canal de lanzamiento Idiomas adicionales disponibles Descripción
pretrained-invoice-v1.1-2021-04-09 Estable

Ninguno

pretrained-invoice-v1.2-2022-02-18 Estable

Ninguno

La retirada está prevista para pronto.
pretrained-invoice-v1.3-2022-07-15 Estable
  • it: italiano
  • pt: portugués (Portugal y Brasil)
  • ro: rumano
  • sv: sueco
  • et: estonio
  • lv: letón
  • lt: lituano
Versión del procesador que se puede actualizar. El número máximo de páginas (solicitudes online o síncronas) se ha aumentado a 15.
pretrained-invoice-v1.4-2022-10-21 Versión candidata

Ninguno

Versión del procesador que se puede actualizar. El número máximo de páginas (solicitudes online o síncronas) se ha aumentado a 15.
pretrained-invoice-v1.5-2023-09-15 Versión candidata

Ninguno

pretrained-invoice-v2.0-2023-12-06 Versión candidata

Ninguno

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 30
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campos enriquecidos

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • supplier_address
  • supplier_name
  • supplier_phone
Campos normalizados

Puedes consultar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Clasificar documentos

Clasificador personalizado

Descripción

Entrena un modelo para clasificar un tipo de documento a partir de un conjunto de clases.

Categoría Clasificar
Funciones OCR, clasificación
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API CUSTOM_CLASSIFICATION_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Inglés en Latn
Versiones del procesador
ID de versión Canal de lanzamiento Descripción
pretrained-foundation-model-v1.4-2025-05-16 Versión candidata Versión candidata basada en el LLM Gemini 2.0 Flash. También incluye funciones avanzadas de OCR.
pretrained-classifier-v1.5-2025-08-05 Versión candidata Versión candidata para lanzamiento basada en el LLM Gemini 2.5 Flash. También incluye funciones avanzadas de OCR.

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 30
Uptraining
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Crear un procesador de clasificación personalizado

Divisor personalizado

Descripción

Entrena un modelo para dividir un archivo que contenga varios documentos en documentos individuales clasificados.

Categoría Clasificar
Funciones OCR, clasificación y división
Fase de lanzamiento Disponibilidad general
Estado del acceso Público
Escribir en la API CUSTOM_SPLITTING_PROCESSOR
Notas
  • La internacionalización solo se puede admitir mediante opciones de entrenamiento personalizadas.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Inglés en Latn
Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 1000
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 30
Uptraining
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Crear un procesador de divisiones personalizado

Resume documentos

Resumidor

Descripción

Obtén resúmenes y listas con viñetas de documentos cortos y largos.

Categoría preentrenado
Funciones Resumir
Fase de lanzamiento Vista previa
Estado del acceso Público
Escribir en la API SUMMARY_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Escritura a mano admitida
Inglés en Latn
Versiones del procesador
ID de versión Canal de lanzamiento Descripción
pretrained-foundation-model-v1.0-2023-08-22 Estable Modelo fundacional de Google

Para obtener más información, consulta Gestionar versiones de procesador.

Cuotas y límites
Número máximo de páginas (solicitudes online o síncronas): 15
Número máximo de páginas (solicitudes por lotes, sin conexión o asíncronas): 250
Número máximo de páginas (modo sin imágenes, solicitudes online o síncronas): 30
Uptraining
Archivo de entrada de ejemplo Abrir en una ventana nueva.
Ejemplo de salida Abrir en una ventana nueva.
Regiones admitidas
  • us
Más información Resumidor personalizado

Notas a pie de página

[*] Este procesador solo está disponible para los clientes que tienen acceso limitado.

Para solicitar acceso a la API, rellena y envía el formulario de solicitud de acceso limitado a Document AI para clientes. En el formulario se solicita información sobre ti, tu empresa y tu caso práctico. Ten en cuenta que se necesita un ID de proyecto de Google Cloud para acceder. Para crear un proyecto de Google Cloud o identificar el ID de su proyecto, consulta las instrucciones que aparecen a continuación.

Una vez que hayas enviado el formulario, el equipo de Document AI revisará tu solicitud para comprobar que cumples los criterios de acceso. Si se aprueba la solicitud, recibirás un correo electrónico con instrucciones para acceder a esta función y usarla.

[†] La verificación de documentos de identificación extrae y evalúa información de documentos de identificación que contribuye a determinar si la imagen introducida representa un documento de identificación auténtico.

En Google Cloud, priorizamos ayudar a los clientes a desarrollar e implementar soluciones de IA de forma segura, y la verificación de identidad se ha desarrollado de acuerdo con los principios de IA de Google.

De acuerdo con los principios de la IA de Google y el diseño de producto actual, te recomendamos que actúes con precaución y evalúes detenidamente las posibles ventajas y los riesgos de usar la verificación de documentos de identificación en los siguientes casos:

  • Toma de decisiones sin intervención humana en predicciones que pueden afectar a los derechos humanos.
  • En ámbitos sensibles, como el empleo, el acceso a servicios públicos, la sanidad y los contextos de seguridad.

[‡] Utiliza siempre la prueba de identidad como parte de tu proceso y flujo de trabajo de detección de identidad más amplios. Es importante que incluya a un revisor humano en su flujo de trabajo para verificar si las señales predichas son precisas. El procesador de verificación de identidad no está diseñado para sustituir la revisión humana de los documentos de identificación en un flujo de trabajo, sino para ayudar a los revisores humanos a validar los documentos de identificación. El procesador de verificación de identidad no debe usarse como una herramienta de decisión automatizada para determinar si un documento de identificación es válido. Gracias a la revisión humana, los clientes pueden procesar documentos con mayor precisión y ayudar a las empresas a evaluar las predicciones con herramientas específicas que permiten habilitar dichas revisiones.

Asegúrate de revisar las normativas de la región en la que vas a implementar esta tecnología y de investigar las directrices del sector para conocer las políticas y los problemas de equidad habituales. Consulta información sobre la equidad en el aprendizaje automático, incluidas las formas de mitigar los sesgos en los conjuntos de datos de entrenamiento, evaluar las disparidades en el rendimiento de los modelos personalizados y otras consideraciones que debes tener en cuenta al usar tu modelo personalizado.

Recomendamos a los clientes que tengan en cuenta las prácticas recomendadas de equidad, interpretabilidad, privacidad y seguridad al implementar la verificación de identidad. Para obtener más información sobre cómo implementar la IA responsable, consulta las recomendaciones de Google sobre las prácticas de IA responsable.

Consulta la entrada de blog Automatizar el procesamiento de documentos de identificación con Document AI para obtener más información sobre los casos prácticos y un repositorio de código de aplicación de ejemplo.