Máximos do conjunto de dados de treinamento: 300 documentos, 300 páginas
Mínimo do conjunto de dados de treinamento: cada rótulo em pelo menos três documentos
Máximos do conjunto de dados de teste: 2.000 documentos; 8.000 páginas
Mínimo do conjunto de dados de teste: cada rótulo em pelo menos três documentos
Máximo de 20 páginas por documento
Limites para treinar um classificador de documentos personalizado (CDC) ou um divisor de documentos personalizado (CDS)
Máximos do conjunto de dados de treinamento: 30.000 documentos; 100.000 páginas
Mínimo do conjunto de dados de treinamento: cada rótulo em pelo menos 10 documentos
Máximos do conjunto de dados de teste: 2.000 documentos; 8.000 páginas
Mínimo do conjunto de dados de teste: cada rótulo em pelo menos dois documentos
Máximo de 200 páginas por documento
Rotulação
Para começar, verifique se os marcadores de documento atendem aos limites mínimos de treinamento e avaliação definidos.
Para começar a avaliar o desempenho do modelo em documentos com variação de layout, rotule pelo menos 100 documentos. Especifique que cada rótulo exista em 50 documentos de treinamento e 50 de avaliação.
Rótulos (campos) máximos permitidos: 150
Limites de tamanho de rótulo (caracteres): itens longos não têm suporte, mas não há limite explícito. Divida os documentos em pedaços de 800 ou 1.000 tokens, com 100 a 200 tokens sobrepostos entre os pedaços. Itens mais longos que a área de sobreposição podem ter problemas de qualidade.
Marcar ocorrências em um documento: sem limite
Cobertura geográfica
Regiões geralmente compatíveis: EUA, UE (multirregião)
Regiões com acessibilidade limitada: Alemanha, Singapura, Reino Unido, Canadá, Índia e Austrália
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-02-14 UTC."],[],[]]