Limites

Este documento lista os limites do sistema que se aplicam à Document AI. Ao contrário das cotas, os limites do sistema não podem ser alterados.

Limites de conteúdo

Os limites de conteúdo a seguir se aplicam a todos os processadores do Document AI.

Limite de conteúdo Valor
Resolução máxima da imagem
(o limite não se aplica a arquivos PDF)
40 megapixels (por página se a imagem tiver várias páginas)
Tamanho máximo do arquivo para solicitações de processamento on-line 20 MB
Tamanho máximo do arquivo para solicitações de processamento em lote 1 GB
Arquivos por solicitação de processamento em lote 5.000 arquivos
Páginas do Human-in-the-Loop por documento 10 páginas

Limites do processador

Os limites são definidos na lista atual.

Processadores de extração

Processador Limites
Extrator personalizado
Páginas máximas (solicitações on-line/síncronas): 15
Páginas máximas (solicitações em lote/off-line/assíncronas): 200
Analisador de formulários
Páginas máximas (solicitações on-line/síncronas): 15
Páginas máximas (solicitações em lote/off-line/assíncronas): 100
Analisador de layout
Páginas máximas (solicitações on-line/síncronas): 15
Páginas máximas (solicitações em lote/off-line/assíncronas): 500

Processadores de classificação

Processador Limites
Classificador personalizado
Páginas máximas (solicitações on-line/síncronas): 15
Páginas máximas (solicitações em lote/off-line/assíncronas): 200
Divisor personalizado
Páginas máximas (solicitações on-line/síncronas): 15
Páginas máximas (solicitações em lote/off-line/assíncronas): 1000

Digitalizar processadores

Processador Limites
OCR de documentos corporativos (reconhecimento óptico de caracteres)
Páginas máximas (solicitações on-line/síncronas): 15
Páginas máximas (solicitações em lote/off-line/assíncronas): 500

Processadores pré-treinados

Processador Limites
Analisador de extrato bancário
Páginas máximas (solicitações on-line/síncronas): 15
Páginas máximas (solicitações em lote/off-line/assíncronas): 30
Analisador W2
Páginas máximas (solicitações on-line/síncronas): 15
Páginas máximas (solicitações em lote/off-line/assíncronas): 15
Analisador de passaportes dos EUA
Páginas máximas (solicitações on-line/síncronas): 2
Páginas máximas (solicitações em lote/off-line/assíncronas): 2
Analisador de utilitários
Páginas máximas (solicitações on-line/síncronas): 10
Páginas máximas (solicitações em lote/off-line/assíncronas): 200
Analisador de comprovação de documento de identidade
Páginas máximas (solicitações on-line/síncronas): 2
Páginas máximas (solicitações em lote/off-line/assíncronas): 2
Pay Slip Parser
Páginas máximas (solicitações on-line/síncronas): 15
Páginas máximas (solicitações em lote/off-line/assíncronas): 50
Analisador de carteira de habilitação dos EUA
Páginas máximas (solicitações on-line/síncronas): 2
Páginas máximas (solicitações em lote/off-line/assíncronas): 2
Analisador de despesas
Páginas máximas (solicitações on-line/síncronas): 10
Páginas máximas (solicitações em lote/off-line/assíncronas): 10
Analisador de faturas
Páginas máximas (solicitações on-line/síncronas): 15
Páginas máximas (solicitações em lote/off-line/assíncronas): 200

Limitações da Document AI

A Document AI tem as limitações atuais.

Critérios Versão estável em julho de 2023
Conjunto de dados
  • Máximo de 30.000 documentos no total
  • Máximo de 250.000 páginas no total
Importação de documentos
  • Máximo de 5.000 documentos por importação
  • Máximo de 200 páginas por documento
Limites para treinar um extrator de documentos personalizado (CDE) Treinamento baseado em modelo (GA)
  • Máximos do conjunto de dados de treinamento: 25.000 documentos; 100.000 páginas
  • Mínimo do conjunto de dados de treinamento: cada rótulo precisa estar presente em pelo menos 1 rótulo a cada 10 documentos
  • Máximos do conjunto de dados de teste: 2.000 documentos; 8.000 páginas
  • Mínimo do conjunto de dados de teste: cada rótulo em pelo menos 10 documentos
  • Máximo de 200 páginas por documento

Treinamento baseado em modelo (GA)
  • Máximos do conjunto de dados de treinamento: 300 documentos, 300 páginas
  • Mínimo do conjunto de dados de treinamento: cada rótulo em pelo menos três documentos
  • Máximos do conjunto de dados de teste: 2.000 documentos; 8.000 páginas
  • Mínimo do conjunto de dados de teste: cada rótulo em pelo menos três documentos
  • Máximo de 20 páginas por documento
Limites para treinar um classificador de documentos personalizado (CDC) ou um divisor de documentos personalizado (CDS)
  • Máximos do conjunto de dados de treinamento: 30.000 documentos; 100.000 páginas
  • Mínimo do conjunto de dados de treinamento: cada rótulo em pelo menos 10 documentos
  • Máximos do conjunto de dados de teste: 2.000 documentos; 8.000 páginas
  • Mínimo do conjunto de dados de teste: cada rótulo em pelo menos dois documentos
  • Máximo de 200 páginas por documento
Rotulação
  • Para começar, verifique se os marcadores de documento atendem aos limites mínimos de treinamento e avaliação definidos.
  • Para começar a avaliar o desempenho do modelo em documentos com variação de layout, rotule pelo menos 100 documentos. Especifique que cada rótulo exista em 50 documentos de treinamento e 50 de avaliação.
  • Rótulos (campos) máximos permitidos: 150
  • Limites de tamanho de rótulo (caracteres): itens longos não têm suporte, mas não há limite explícito. Divida os documentos em pedaços de 800 ou 1.000 tokens, com 100 a 200 tokens sobrepostos entre os pedaços. Itens mais longos que a área de sobreposição podem ter problemas de qualidade.
  • Marcar ocorrências em um documento: sem limite
Cobertura geográfica
  • Regiões geralmente compatíveis: EUA, UE (multirregião)
  • Regiões com acessibilidade limitada: Alemanha, Singapura, Reino Unido, Canadá, Índia e Austrália