Lista de procesadores

En esta página, se incluye información detallada sobre todos los procesadores que ofrece Document AI. Puedes ver una lista de todos los procesadores por tipo de solución.

Todos los procesadores de Document AI cumplen con las Condiciones de Seguridad y Procesamiento de Datos.

Consulta la documentación Administra versiones de procesadores para obtener más detalles. Además, se aplican límites específicos del procesador además de las cuotas y límites generales del producto.

Digitaliza texto

OCR de documentos empresariales (reconocimiento óptico de caracteres)

Descripción

Identifica y extrae texto en diferentes tipos de documentos.

Este procesador te permite identificar y extraer texto, incluido el texto escrito a mano, de documentos en más de 200 idiomas. El encargado del tratamiento de datos también usa el aprendizaje automático para realizar una evaluación de calidad de un documento en función de la legibilidad de su contenido.

Categoría Digitalizar
Funciones OCR y análisis de calidad
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API OCR_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Afrikáans af Latn
Albanés sq Latn
Árabe ar Arab
Armenio hy Armn
Bielorruso be Cyrl
Bengalí bn Beng
Bengalí bn Beng
Búlgaro bg Cyrl
Catalán ca Latn
Chino zh Hani
Croata hr Latn
Checo cs Latn
Danés da Latn
Neerlandés nl Latn
Inglés en Latn
Estonio et Latn
Filipino fil Latn
Finlandés fi Latn
Francés fr Latn
Alemán de Latn
Griego el Grek
Gujarati gu Gujr
Hebreo iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandés is Latn
Indonesio id Latn
Italiano it Latn
Japonés ja Jpan
Canarés kn Knda
Jemer km Khmr
Coreano ko Kore
Laosiano lo Laoo
Letón lv Latn
Lituano lt Latn
Macedonio mk Cyrl
Malayo ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalí ne Deva
Noruego no Latn
Persa fa Arab
Polaco pl Latn
Portugués (Brasil y Portugal) pt Latn
Panyabí pa Guru
Rumano ro Latn
Ruso ru Cyrl
Serbio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Español es Latn
Sueco sv Latn
Tagalo tl Latn
Tamil ta Taml
Telugu te Telu
Tailandés th Thai
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-ocr-v1.0-2020-09-23 Estable

Ninguno

Ninguno

No se recomienda su uso y se descontinuará en Estados Unidos (EE.UU.) y la Unión Europea (UE) a partir del 30 de abril de 2025.
pretrained-ocr-v1.1-2022-09-12 Estable

Ninguno

Ninguno

No se recomienda su uso y se descontinuará en Estados Unidos (EE.UU.) y la Unión Europea (UE) a partir del 30 de abril de 2025.
pretrained-ocr-v1.2-2022-11-10 Estable

Ninguno

Ninguno

Versión del modelo inmovilizada de la v1.0: Archivos de modelos, configuraciones y objetos binarios de una instantánea de versión inmovilizada en una imagen de contenedor durante un máximo de 18 meses.
pretrained-ocr-v2.0-2023-06-02 Estable

Ninguno

Ninguno

Modelo listo para producción especializado en casos de uso de documentos. Incluye acceso a todos los complementos de OCR.
pretrained-ocr-v2.1-2024-08-07 Versión candidata

Ninguno

Ninguno

Las principales áreas de mejora de la versión 2.1 son: un mejor reconocimiento de texto impreso, una detección más precisa de las casillas de verificación y un orden de lectura más preciso.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 500
Uptraining
Human-in-the-Loop
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Enterprise Document OCR

Extraer entidades de los documentos

Consulta Conjuntos de datos de muestra para ver ejemplos de conjuntos de datos etiquetados y sin etiquetar que puedes usar para el entrenamiento.

Extractor personalizado

Descripción

Extrae campos de documentos con IA generativa o modelos personalizados. Ajusta los modelos para extraer datos de tus documentos con precisión.

Categoría Extraer
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API CUSTOM_EXTRACTION_PROCESSOR
Notas
  • Si usas la IA generativa para la extracción, haz lo siguiente:

    • Solo se admite oficialmente el idioma inglés.
    • La disponibilidad por región se encuentra en US, EU, northamerica-northeast1 y asia-southeast1.

Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Afrikáans af Latn
Árabe ar Arab
Azerbaiyano az Latn
Azerí (cirílico) az-Cyrl Cyrl
Bielorruso be Cyrl
Búlgaro bg Cyrl
Bosnio bs Latn
Catalán ca Latn
Cebuano ceb Latn
Checo cs Latn
Galés cy Latn
Danés da Latn
Alemán de Latn
Griego el Grek
Inglés en Latn
Esperanto eo Latn
Español es Latn
Estonio et Latn
Euskara eu Latn
Persa fa Arab
Finlandés fi Latn
Filipino fil Latn
Francés fr Latn
Irlandés ga Latn
Gallego gl Latn
Hindi hi Deva
Croata hr Latn
Criollo haitiano ht Latn
Húngaro hu Latn
Indonesio id Latn
Islandés is Latn
Italiano it Latn
Hebreo iw Hebr
Japonés ja Jpan
Javanés jv Latn
Kazajo kk Cyrl
Corean ko Kore
Kirguizo ky Cyrl
Latín la Latn
Lituano lt Latn
Letón lv Latn
Macedonio mk Cyrl
Mongol mn Cyrl
Marathi mr Deva
Malayo ms Latn
Maltés mt Latn
Nepalí ne Deva
Neerlandés nl Latn
Noruego no Latn
Polaco pl Latn
Pastún ps Arab
Portugués (Brasil y Portugal) pt Latn
Rumano ro Latn
Ruso ru Cyrl
Ruso (ortografía petrina) ru-PETR1708 Cyrl
Sánscrito sa Deva
Eslovaco sk Latn
Esloveno sl Latn
Albanés sq Latn
Serbio sr Cyrl
Sueco sv Latn
Suajili sw Latn
Tagalo tl Latn
Turco tr Latn
Ucraniano uk Cyrl
Urdu ur Arab
Uzbeko uz Latn
Uzbeko (cirílico) uz-Cyrl Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Chino simplificado zh-Hans Hani
Chino tradicional zh-Hant Hani
Zulú zu Latn
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-foundation-model-v1.0-2023-08-22 Estable

Ninguno

Ninguno

Candidato listo para producción especializado en casos de uso de documentos con modelos de visión y modelos de base especializados.
pretrained-foundation-model-v1.1-2024-03-12 Versión candidata

Ninguno

Ninguno

Versión candidata potenciada por el LLM de Gemini 1.0 Pro y tecnologías recientemente desarrolladas, incluidos modelos de lenguaje y visión especializados. También incluye funciones avanzadas de OCR, como la detección de casillas de verificación.
pretrained-foundation-model-v1.2-2024-05-10 Estable

Ninguno

Ninguno

Candidato listo para la producción potenciado por el LLM de Gemini 1.5 Pro y tecnologías recientemente desarrolladas, incluidos modelos de lenguaje y visión especializados También incluye funciones avanzadas de OCR, como la detección de casillas de verificación. Se recomienda para los usuarios que desean usar los límites de tokens más grandes admitidos o experimentar con modelos más nuevos.
pretrained-foundation-model-v1.3-2024-08-31 Estable

Ninguno

Ninguno

Candidato listo para la producción con el LLM de Gemini 1.5 Flash También incluye funciones avanzadas de OCR, como la detección de casillas de verificación. Se recomienda para quienes desean la latencia más baja.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Tipos de datos normalizados

Puedes encontrar más información en las páginas Enriquecimiento y normalización y Crea un conjunto de datos.

Lista completa de tipos de datos normalizados
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
Human-in-the-Loop
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Extractor personalizado

Analizador de formularios

Descripción

Extrae pares clave-valor generales (entidad y casilla de verificación), tablas y entidades genéricas de documentos, además del texto de OCR.

Este procesador aplica tecnologías avanzadas de aprendizaje automático para extraer pares clave-valor, casillas de verificación y tablas de documentos en más de 200 idiomas. Este procesador también aprovecha los modelos de aprendizaje profundo para extraer 11 entidades genéricas que son comunes en varios tipos de documentos.

Categoría Extraer
Funciones OCR, análisis de formularios y extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API FORM_PARSER_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Afrikáans af Latn
Albanés sq Latn
Árabe ar Arab
Bielorruso be Cyrl
Catalán ca Latn
Chino zh Hani
Croata hr Latn
Checo cs Latn
Danés da Latn
Neerlandés nl Latn
Inglés en Latn
Estonio et Latn
Filipino fil Latn
Finlandés fi Latn
Francés fr Latn
Alemán de Latn
Hebreo iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandés is Latn
Indonesio id Latn
Italiano it Latn
Japonés ja Jpan
Corean ko Kore
Letón lv Latn
Lituano lt Latn
Macedonio mk Cyrl
Malayo ms Latn
Marathi mr Deva
Nepalí ne Deva
Noruego no Latn
Persa fa Arab
Polaco pl Latn
Portugués (Brasil y Portugal) pt Latn
Rumano ro Latn
Ruso ru Cyrl
Serbio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Español es Latn
Sueco sv Latn
Tagalo tl Latn
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-form-parser-v1.0-2020-09-23 Estable

Ninguno

Ninguno

Versión heredada. Para obtener la mejor calidad y el conjunto completo de funciones, usa el Analizador de formularios v2.0.
pretrained-form-parser-v2.0-2022-11-10 Estable
Mostrar campos
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number

Ninguno

Versión recomendada. Admite entidades genéricas y, además, incluye una tabla, un modelo de KVP y una casilla de verificación actualizados, así como más de 200 idiomas.
pretrained-form-parser-v2.1-2023-06-26 Versión candidata

Ninguno

Ninguno

Versión preliminar pública. Es el mismo modelo que la versión 2.0 con la extracción de texto nativa de archivos PDF digitales habilitada.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 100
Uptraining
Human-in-the-Loop
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Analizador de formularios

Analizador de diseño

Descripción

Extrae elementos de contenido de documentos (texto, tablas y listas) y crea fragmentos con contexto.

El analizador de diseño extrae elementos de contenido de documentos, como texto, tablas y listas, y crea fragmentos con contexto que facilitan la recuperación de información en la IA generativa y las aplicaciones de descubrimiento.

Categoría Extraer
Funciones Análisis de diseño y fragmentación de documentos
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API LAYOUT_PARSER_PROCESSOR
Notas
  • Este analizador admite archivos PDF, HTML y DOCX.
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Afrikáans af Latn
Albanés sq Latn
Árabe ar Arab
Armenio hy Armn
Bielorruso be Cyrl
Bengalí bn Beng
Bengalí bn Beng
Búlgaro bg Cyrl
Catalán ca Latn
Chino zh Hani
Croata hr Latn
Checo cs Latn
Danés da Latn
Neerlandés nl Latn
Inglés en Latn
Estonio et Latn
Filipino fil Latn
Finlandés fi Latn
Francés fr Latn
Alemán de Latn
Griego el Grek
Gujarati gu Gujr
Hebreo iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandés is Latn
Indonesio id Latn
Italiano it Latn
Japonés ja Jpan
Canarés kn Knda
Jemer km Khmr
Coreano ko Kore
Laosiano lo Laoo
Letón lv Latn
Lituano lt Latn
Macedonio mk Cyrl
Malayo ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepalí ne Deva
Noruego no Latn
Persa fa Arab
Polaco pl Latn
Portugués (Brasil y Portugal) pt Latn
Panyabí pa Guru
Rumano ro Latn
Ruso ru Cyrl
Serbio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Español es Latn
Sueco sv Latn
Tagalo tl Latn
Tamil ta Taml
Telugu te Telu
Tailandés th Thai
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Yiddish yi Hebr
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-layout-parser-v1.0-2024-06-03 Estable

Ninguno

Ninguno

Versión recomendada.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 500
Uptraining
Human-in-the-Loop
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us
Más información Analizador de diseño

Explora procesadores previamente entrenados

Analizador de estados de cuenta

Descripción

Extrae información de los estados de cuenta, incluidos el nombre, la cuenta, las transacciones, etcétera

Categoría Previamente entrenados
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API BANK_STATEMENT_PROCESSOR
Notas
  • Si una página de un archivo de entrada de varias páginas es el tipo de documento correcto y una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento compatible. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, muestra un mensaje de error.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Inglés en Latn
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-bankstatement-v1.0-2021-08-08 Estable

Ninguno

Ninguno

pretrained-bankstatement-v1.1-2021-08-13 Estable

Ninguno

Ninguno

pretrained-bankstatement-v2.0-2021-12-10 Estable

Ninguno

Ninguno

pretrained-bankstatement-v3.0-2022-05-16 Estable

Ninguno

Ninguno

Esta versión supone que el archivo de entrada contiene un solo estado de cuenta. A diferencia de la versión predeterminada, esta versión no verifica el archivo de entrada en busca de estados de cuenta y no mostrará un error si no se encuentran estados de cuenta.
pretrained-bankstatement-v4.0-2023-07-31 Versión candidata

Ninguno

Ninguno

pretrained-bankstatement-v5.0-2023-12-06 Versión candidata

Ninguno

Ninguno

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 30
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • bank_address
  • bank_name
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
Human-in-the-Loop
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador W2

Descripción

Extrae información del formulario W2, como el empleado, el empleador, los salarios, etcétera

Categoría Previamente entrenados
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API FORM_W2_PROCESSOR
Notas
  • Si una página de un archivo de entrada de varias páginas es el tipo de documento correcto y una de las versiones admitidas, el procesador realiza la extracción de entidades en el primer documento compatible. Si el procesador no encuentra ningún documento aplicable en el archivo de entrada, muestra un mensaje de error.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Inglés en Latn
Formularios o versiones compatibles
  • 2020 (versiones estándar y personalizadas)
  • 2019 (versiones estándar y personalizadas)
  • 2018 (versiones estándar y personalizadas)
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-w2-v1.0-2020-10-01 Estable

Ninguno

Ninguno

pretrained-w2-v1.1-2022-01-27 Estable

Ninguno

Ninguno

pretrained-w2-v1.2-2022-01-28 Estable
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

Ninguno

Mejoras de calidad y compatibilidad con campos nuevos (no incluye el divisor).

pretrained-w2-v2.0-2022-03-30 Versión candidata
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Ninguno

Mejoras de calidad y compatibilidad con los campos del cuadro 12 y las predicciones detalladas de EmployeeName, EmployeeAddress y EmployerNameAndAddress, que ya no forman parte del resultado y se reemplazan por campos adicionales.

pretrained-w2-v2.1-2022-06-08 Estable
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Ninguno

Es similar a la versión pretrained-w2-v2.0-2022-03-30 con más mejoras de calidad y una entidad más EmployeeName_Suffix.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 15
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • EmployerNameAndAddress
  • EIN
Uptraining
Human-in-the-Loop
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de pasaportes de EE.UU.

Descripción

Extrae campos como nombres, IDs de documentos, fecha de nacimiento, etcétera.

Categoría Previamente entrenados
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API US_PASSPORT_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Inglés en Latn
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-us-passport-v1.0-2021-06-14 Estable

Ninguno

Ninguno

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Human-in-the-Loop
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de utilidades

Descripción

Extrae el texto y los valores de las facturas de servicios públicos, como el nombre del proveedor y el importe pagado anterior.

Categoría Previamente entrenados
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Limitada [*]
Escribe API UTILITY_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Inglés en Latn
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-utility-v1.1-2021-04-09 Estable

Ninguno

Ninguno

pretrained-utility-v1.2-2022-12-15 Versión candidata

Ninguno

Ninguno

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 10
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
Human-in-the-Loop
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de revisión de documentos de identidad

Descripción

Predice la validez de los documentos de identificación con varios indicadores.

El procesador de verificación de documentos de identidad está diseñado para ayudar a predecir la validez de los documentos de ID con cuatro indicadores diferentes.

Actualmente, el procesador muestra información de los siguientes indicadores:

  • Detección de fraud_signals_is_identity_document: Predice si una imagen contiene un documento de identidad reconocido.
  • Detección de fraud_signals_suspicious_words: Predice si hay palabras que no son típicas en los IDs.
  • Detección de fraud_signals_image_manipulation: Predice si la imagen se alteró o se manipuló con una herramienta de edición de imágenes.
  • Detección de fraud_signals_online_duplicate: Predice si la imagen se puede encontrar en línea (solo en EE.UU.).

Categoría Previamente entrenados
Funciones OCR y análisis de calidad
Etapa de lanzamiento Vista previa
Estado de acceso Pública
Escribe API ID_PROOFING_PROCESSOR
Notas
  • Actualmente, la función de detección de duplicados en línea se procesa en centros de datos de EE.UU. La asistencia regional y multirregional no está disponible para esta función fuera de EE.UU.
  • Este procesador es compatible con algoritmos que se actualizan con más frecuencia que el lanzamiento de nuevas versiones del procesador. Por este motivo, el procesador puede mostrar diferentes resultados con el tiempo, incluso cuando se usa la misma versión del procesador. Por ejemplo, el sistema de detección de duplicados en línea supervisa las imágenes presentes en la Web. El comportamiento del sistema puede cambiar más rápido de lo que se puede hacer un seguimiento en las versiones de procesador.
  • Consulta las notas sobre la IA responsable[†] y la revisión humana.[‡]
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Inglés en Latn
Formularios o versiones compatibles
  • Compatibilidad con pasaportes, tarjetas de acceso y licencias de conducir de EE.UU.
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-id-proofing-v1.0-2022-10-03 Estable

Ninguno

Ninguno

pretrained-id-proofing-v1.1-2023-05-18 Versión candidata
Mostrar campos
  • fraud_signals_photocopy_detection

Ninguno

Señal de detección de fotocopia adicional

pretrained-id-proofing-v1.2-2023-10-04 Versión candidata
Mostrar campos
  • fraud_signals_photocopy_detection

Ninguno

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
Human-in-the-Loop
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de comprobantes de pago

Descripción

Extrae información de los recibos de pago, como el nombre, la empresa, los importes, etcétera.

Categoría Previamente entrenados
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API PAYSTUB_PROCESSOR
Notas
  • Si el documento de entrada de varias páginas contiene más de una hoja de pago válida, el procesador extrae entidades solo de la primera hoja de pago válida. Si no se encuentran recibos de pago en el archivo de entrada, el procesador muestra un mensaje de error.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Inglés en Latn
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-paystub-v1.0-2021-03-19 Estable

Ninguno

Ninguno

pretrained-paystub-v1.1-2021-08-13 Estable
Mostrar campos
  • net_pay
  • net_pay_ytd
  • employee_account_number

Ninguno

Mejora de la calidad y compatibilidad con campos nuevos
pretrained-paystub-v1.2-2021-12-10 Estable

Ninguno

Ninguno

pretrained-paystub-v2.0-2022-05-17 Versión candidata
Mostrar campos
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

Ninguno

Esta versión supone que el archivo de entrada contiene un solo recibo de pago. A diferencia de la versión predeterminada, esta versión no verifica si hay recibos de sueldo en el archivo de entrada y no mostrará un error si no se encuentran recibos de sueldo.

Mejora de la calidad, compatibilidad con campos nuevos y un esquema nuevo. Bonificación, Comisiones, Feriado, Horas extras, Sueldo normal y Vacaciones ahora forman parte de earning_item/earning_this_period, y sus versiones en lo que va del año se encuentran en earning_item/earning_ytd. Direct Deposit y Employee Account Number ahora se anidan en direct_deposit_item.

El límite de páginas asíncronas es de 10.

pretrained-paystub-v2.0-2022-07-22 Estable

Ninguno

Ninguno

Mejoras en la calidad y en la capacitación continua.

pretrained-paystub-v3.0-2023-12-06 Versión candidata

Ninguno

Ninguno

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 50
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • employer_address
  • employer_name
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
Human-in-the-Loop
Instrucciones de etiquetado Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de licencias de conducir de EE.UU.

Descripción

Extrae campos como nombres, IDs de documentos, fecha de nacimiento, etcétera.

Categoría Previamente entrenados
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API US_DRIVER_LICENSE_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Inglés en Latn
Formularios o versiones compatibles
  • Admite los 50 estados y el Distrito de Columbia (DC).
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-us-driver-license-v1.0-2021-06-14 Estable

Ninguno

Ninguno

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Human-in-the-Loop
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • eu
  • us

Analizador de gastos

Descripción

Extrae texto y valores de los documentos de gastos, como la fecha del gasto, el nombre del proveedor, el importe total y la moneda.

Categoría Previamente entrenados
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API EXPENSE_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Alemán de Latn
Inglés en Latn
Español es Latn
Francés fr Latn
Japonés ja Jpan
Neerlandés nl Latn
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-expense-v1.1-2021-04-09 Estable

Ninguno

Ninguno

Se lanzó en abril de 2021. Pronto se planea la baja.
pretrained-expense-v1.2-2022-02-18 Estable

Ninguno

Ninguno

pretrained-expense-v1.3-2022-07-15 Estable
Mostrar campos
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: Japonés
Compatibilidad con los folletos de hoteles y alquileres de automóviles
pretrained-expense-v1.3.2-2024-09-11 Versión candidata
Mostrar campos
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: Japonés
Una actualización a la versión 1.3 con un modelo de visión subyacente mejorado.
pretrained-expense-v1.4-2022-11-18 Versión candidata
Mostrar campos
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Japonés
  • it: Italiano
  • pt: Portugués (Portugal y Brasil)
Se realizaron mejoras de rendimiento y compatibilidad con el entrenamiento avanzado. Se aumentó a 15 el límite máximo de páginas (solicitudes en línea o síncronas).
pretrained-expense-v1.4.2-2024-09-12 Versión candidata
Mostrar campos
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Japonés
  • it: Italiano
  • pt: Portugués (Portugal y Brasil)
Una actualización a la versión 1.4 con un modelo de visión subyacente mejorado.

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 10
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 10
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • supplier_address
  • supplier_name
  • supplier_phone
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
Human-in-the-Loop
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Analizador de facturas

Descripción

Extrae texto y valores de las facturas, como el número de factura, el nombre del proveedor, el importe, el importe fiscal, la fecha de facturación y la fecha de vencimiento.

El analizador de facturas extrae campos de encabezado y de línea de pedido, como el número de factura, el nombre del proveedor, el importe de la factura, el importe de los impuestos, la fecha de facturación, la fecha de vencimiento y los importes de las líneas de pedido.

Categoría Previamente entrenados
Funciones OCR, extracción de entidades
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API INVOICE_PROCESSOR
Idiomas admitidos
Lista completa de idiomas
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Alemán de Latn
Inglés en Latn
Español es Latn
Estonio et Latn
Francés fr Latn
Italiano it Latn
Letón lv Latn
Lituano lt Latn
Neerlandés nl Latn
Portugués (Brasil y Portugal) pt Latn
Rumano ro Latn
Sueco sv Latn
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-invoice-v1.1-2021-04-09 Estable

Ninguno

Ninguno

pretrained-invoice-v1.2-2022-02-18 Estable

Ninguno

Ninguno

Pronto se planea la baja.
pretrained-invoice-v1.3-2022-07-15 Estable

Ninguno

  • it: Italiano
  • pt: Portugués (Portugal y Brasil)
  • ro: Rumano
  • sv: Sueco
  • et: Estonio
  • lv: Letón
  • lt: Lituano
Versión del procesador que se puede actualizar. La cantidad máxima de páginas (solicitudes en línea o síncronas) aumentó a 15.
pretrained-invoice-v1.4-2022-10-21 Versión candidata

Ninguno

Ninguno

Versión del procesador que se puede actualizar. La cantidad máxima de páginas (solicitudes en línea o síncronas) aumentó a 15.
pretrained-invoice-v1.5-2023-09-15 Versión candidata

Ninguno

Ninguno

pretrained-invoice-v2.0-2023-12-06 Versión candidata

Ninguno

Ninguno

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Campos detectados en la versión más antigua

También puedes encontrar esta información en la página Campo detectado.

Lista completa de campos
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campos enriquecidos

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos enriquecidos
  • supplier_address
  • supplier_name
  • supplier_phone
Campos normalizados

Puedes encontrar más información en la página Enriquecimiento y normalización.

Lista completa de campos normalizados
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
Human-in-the-Loop
Instrucciones de etiquetado Abrir en una ventana nueva.
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Clasifica documentos

Clasificador personalizado

Descripción

Entrena un modelo para clasificar un tipo de documento a partir de un conjunto de clases.

Categoría Clasificar
Funciones OCR, clasificación
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API CUSTOM_CLASSIFICATION_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Inglés en Latn
Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Uptraining
Human-in-the-Loop
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Cómo crear un procesador de clasificación personalizado

Divisor personalizado

Descripción

Entrena un modelo para dividir un archivo que contiene varios documentos en documentos individuales y clasificados.

Categoría Clasificar
Funciones OCR, clasificación y división
Etapa de lanzamiento Disponibilidad general
Estado de acceso Pública
Escribe API CUSTOM_SPLITTING_PROCESSOR
Notas
  • La internacionalización solo se puede admitir a través de opciones de entrenamiento personalizadas.
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Inglés en Latn
Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 1000
Uptraining
Human-in-the-Loop
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Más información Cómo crear un procesador de divisores personalizados

Resume documentos

Summarizer

Descripción

Obtén resúmenes de viñetas y resúmenes de documentos cortos y largos.

Categoría preentrenado
Funciones Resumir
Etapa de lanzamiento Vista previa
Estado de acceso Pública
Escribe API SUMMARY_PROCESSOR
Idiomas admitidos
Idioma Etiqueta BCP 47 Secuencia de comandos Compatibilidad con la escritura a mano
Inglés en Latn
Versiones de procesadores
ID de versión Canal de actualización Se detectaron campos adicionales Idiomas adicionales admitidos Descripción
pretrained-foundation-model-v1.0-2023-08-22 Estable

Ninguno

Ninguno

Modelo de base de Google

Para obtener más información, consulta Administra versiones de procesadores.

Cuotas y límites
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 250
Uptraining
Human-in-the-Loop
Archivo de entrada de muestra Abrir en una ventana nueva.
Resultado de muestra: Abrir en una ventana nueva.
Regiones admitidas
  • us
Más información Resumen personalizado

Pies de página

[*] Este procesador solo está disponible para los clientes con acceso limitado.

Para solicitar acceso a la API, completa y envía el formulario de solicitud de clientes con acceso limitado de Document AI. En el formulario, se solicita información sobre tu empresa, tu caso práctico y tus datos personales. Ten en cuenta que se requiere un ID de proyecto de Google Cloud para acceder. Para crear un proyecto nuevo de Google Cloud o identificar el ID de tu proyecto existente, consulta las siguientes instrucciones.

Después de que envíes el formulario, el equipo de Document AI revisará tu solicitud para asegurarse de que cumplas con los criterios de acceso. Si se aprueba, recibirás un correo electrónico con instrucciones para acceder y usar esta función.

[†] La verificación de documentos de identidad sirve para extraer y evaluar información de los documentos de ID que contribuye a identificar si la imagen de entrada representa un ID auténtico.

En Google Cloud, priorizamos ayudar a los clientes a desarrollar e implementar soluciones de IA de forma segura, y la verificación de identidad se desarrolló de acuerdo con los principios de IA de Google.

En función de los Principios de IA de Google y el diseño actual del producto, te recomendamos que tengas precaución y evalúes cuidadosamente los posibles beneficios y riesgos de usar la verificación de documentos de identidad para lo siguiente:

  • Toma de decisiones sin intervención humana para las predicciones que pueden afectar los derechos humanos
  • En dominios sensibles, incluidos, sin limitaciones, el empleo, el acceso a servicios públicos, la atención médica y los contextos de seguridad esenciales.

[‡] Siempre usa la verificación de identidad como parte de tu proceso y flujo de trabajo de detección de identidad más amplio. Es importante que tengas un revisor manual en tu flujo de trabajo para verificar si los indicadores previstos son precisos. El procesador de pruebas de identidad no está diseñado para reemplazar la revisión manual de los IDs en un flujo de trabajo, sino para ayudar a los revisores manuales a validar los documentos de ID. El procesador de pruebas de identidad no debe usarse como una herramienta de decisión automatizada para determinar si un ID es válido. Con la revisión manual, los clientes pueden lograr una mayor exactitud en el procesamiento de documentos y ayudar a las empresas a evaluar las predicciones con herramientas diseñadas con un propósito determinado para permitir esas revisiones.

Asegúrate de revisar las reglamentaciones de la región en la que implementarás esta tecnología y de investigar la orientación existente de la industria para obtener información sobre los lineamientos de las políticas y los problemas comunes de equidad. Obtén información sobre la imparcialidad en el aprendizaje automático, incluidas las formas de mitigar el sesgo en los conjuntos de datos de entrenamiento, evaluar tus modelos personalizados en busca de desigualdades en el rendimiento y otras consideraciones a tener en cuenta cuando usas tu modelo personalizado.

Recomendamos a los clientes que tengan en cuenta la equidad, la interpretabilidad y las prácticas recomendadas de privacidad y seguridad cuando implementen la verificación de identidad. Para obtener más información sobre cómo implementar la IA responsable, lee las recomendaciones de Google para las prácticas de IA responsable.

Consulta la entrada de blog Automatiza el procesamiento de documentos de identidad con Document AI] para obtener más información sobre los casos de uso y un repositorio de código de la aplicación de muestra.