Tipos de arquivo
Document AI é compatível com os seguintes tipos de imagem.
Para informações sobre limites de tamanho de arquivo e de páginas, consulte a página Cotas e limites.
Nome | Extensões de arquivo | Tipo MIME |
---|---|---|
Formato de documento portátil (PDF) | .pdf |
application/pdf |
Formato de troca de gráficos (GIF) | .gif |
image/gif |
Formato de arquivo de imagem com tag (TIFF) | .tiff , .tif |
image/tiff |
Joint Photographic Experts Group (JPEG) | .jpg , .jpeg |
image/jpeg |
Portable Network Graphics (PNG) | .png |
image/png |
Bitmap (BMP) | .bmp |
image/bmp |
WebP | .webp |
image/webp |
Linguagem de marcação de hipertexto (HTML) | .html |
text/html |
Microsoft Word Office Open XML (OOXML) (pré-lançamento) | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Microsoft PowerPoint OOXML (pré-lançamento) | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Microsoft Excel OOXML (prévia) | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
Observe que alguns desses formatos de imagem têm perdas (por exemplo, JPEG). A redução do tamanho do arquivo para formatos com perdas pode resultar em uma degradação da qualidade da imagem e da precisão dos resultados da Document AI.
Resolução da digitalização de documentos
Para resultados de OCR mais precisos da Document AI, as digitalizações de documentos precisam ter no mínimo 200 dpi (pontos por polegada). 300 dpi e mais geralmente produzem os melhores resultados. A precisão da OCR depende da resolução e do tamanho mínimo da fonte, além de outros fatores, como a qualidade do documento (e da caligrafia, se for manuscrito). Por isso, é recomendável fazer testes. O recurso análise da qualidade da imagem pode ajudar a avaliar problemas de resolução.
OBSERVAÇÃO: é necessário ter 2.000 x 3.000 pixels para a imagem do verso da carteira de habilitação dos EUA para ler o código de barras.