Límites

En este documento, se enumeran los límites del sistema que se aplican a Document AI. A diferencia de las cuotas, los límites del sistema no se pueden cambiar.

Límites de contenido

Los siguientes límites de contenido se aplican a todos los procesadores de Document AI.

Límite de contenido Valor
Resolución máxima de la imagen:
(el límite no se aplica a los archivos PDF)
40 megapíxeles (por página si la imagen contiene varias páginas)
Tamaño máximo de archivo para las solicitudes de procesamiento en línea 20 MB
Tamaño máximo de archivo para las solicitudes de procesamiento por lotes 1 GB
Archivos por solicitud de procesamiento por lotes 5,000 archivos
Páginas de con interacción humana por documento 10 páginas

Límites del procesador

Los límites se definen en la lista actual.

Procesadores de extracción

Procesador Límites
Extractor personalizado
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Analizador de formularios
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 100
Analizador de diseño
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 500

Procesadores de clasificación

Procesador Límites
Clasificador personalizado
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Divisor personalizado
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 1000

Procesadores de digitalización

Procesador Límites
OCR de documentos empresariales (reconocimiento óptico de caracteres)
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 500

Procesadores previamente entrenados

Procesador Límites
Analizador de estados de cuenta
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 30
Analizador W2
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 15
Analizador de pasaportes de EE.UU.
Cantidad máxima de páginas (solicitudes en línea o síncronas): 2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Analizador de utilidades
Cantidad máxima de páginas (solicitudes en línea o síncronas): 10
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200
Analizador de revisión de documentos de identidad
Cantidad máxima de páginas (solicitudes en línea o síncronas): 2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Analizador de comprobantes de pago
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 50
Analizador de licencias de conducir de EE.UU.
Cantidad máxima de páginas (solicitudes en línea o síncronas): 2
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 2
Expense Parser
Cantidad máxima de páginas (solicitudes en línea o síncronas): 10
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 10
Analizador de facturas
Cantidad máxima de páginas (solicitudes en línea o síncronas): 15
Cantidad máxima de páginas (solicitudes por lotes, sin conexión o asíncronas): 200

Limitaciones de Document AI

Document AI tiene las limitaciones actuales.

Criterios Versión estable de julio de 2023
Conjunto de datos
  • Un máximo de 30,000 documentos en total
  • Un máximo de 250,000 páginas en total
Importación de documentos
  • Un máximo de 5,000 documentos por importación
  • Un máximo de 200 páginas por documento
Límites para entrenar un extractor de documentos personalizado (CDE) Entrenamiento basado en modelos (GA)
  • Máximos del conjunto de datos de entrenamiento: 25,000 documentos; 100,000 páginas
  • Mínimo de conjunto de datos de entrenamiento: Cada etiqueta debe estar presente en, al menos, 1 etiqueta por cada 10 documentos.
  • Máximos del conjunto de datos de prueba: 2,000 documentos; 8,000 páginas
  • Mínimo del conjunto de datos de prueba: Cada etiqueta en, al menos, 10 documentos
  • Un máximo de 200 páginas por documento

Capacitación basada en plantillas (GA)
  • Máximos del conjunto de datos de entrenamiento: 300 documentos, 300 páginas
  • Mínimo del conjunto de datos de entrenamiento: Cada etiqueta en al menos 3 documentos
  • Máximos del conjunto de datos de prueba: 2,000 documentos; 8,000 páginas
  • Mínimo del conjunto de datos de prueba: Cada etiqueta en, al menos, 3 documentos
  • Máximo de 20 páginas por documento
Límites para entrenar un clasificador de documentos personalizados (CDC) o un separador de documentos personalizados (CDS)
  • Máximos del conjunto de datos de entrenamiento: 30,000 documentos; 100,000 páginas
  • Mínimo de conjunto de datos de entrenamiento: Cada etiqueta en al menos 10 documentos
  • Máximos del conjunto de datos de prueba: 2,000 documentos; 8,000 páginas
  • Mínimo del conjunto de datos de prueba: Cada etiqueta en, al menos, 2 documentos
  • Un máximo de 200 páginas por documento
Etiquetar
  • Para comenzar, asegúrate de que las etiquetas de los documentos cumplan con los umbrales mínimos de entrenamiento y evaluación definidos.
  • Para comenzar a evaluar el rendimiento del modelo para documentos con variación de diseño, etiqueta al menos 100 documentos. Específicamente, asegúrate de que cada etiqueta exista en 50 documentos de entrenamiento y 50 de evaluación.
  • Cantidad máxima de etiquetas (campos) permitidas: 150
  • Límites de tamaño de las etiquetas (caracteres): Los elementos largos no son muy compatibles, pero no hay un límite explícito. Divide los documentos en secciones de 800 o 1,000 tokens, con una superposición de 100 a 200 tokens entre las secciones. (Los elementos más largos que el área superpuesta pueden tener problemas de calidad).
  • Etiqueta ocurrencias en un documento: Sin límite
Cobertura geográfica
  • Regiones admitidas generalmente: EE.UU. y UE (multirregión)
  • Regiones con accesibilidad limitada: Alemania, Australia, Canadá, India, Reino Unido y Singapur