文件类型
Document AI 支持以下图片类型。
如需了解文件大小和页面限制,请参阅配额和限制页面。
| 名称 | 文件扩展名 | MIME 类型 | 
|---|---|---|
| 便携式文档格式 (PDF) | .pdf | 
application/pdf | 
| 图形交换格式 (GIF) | .gif | 
image/gif | 
| 标记图像文件格式 (TIFF) | .tiff,.tif | 
image/tiff | 
| 联合图像专家组 (JPEG) | .jpg,.jpeg | 
image/jpeg | 
| 便携式网络图形 (PNG) | .png | 
image/png | 
| 位图 (BMP) | .bmp | 
image/bmp | 
| WebP | .webp | 
image/webp | 
| 超文本标记语言 (HTML) | .html | 
text/html | 
| Microsoft Word Office 开放式 XML (OOXML)(预览版) | .docx | 
application/vnd.openxmlformats-officedocument.wordprocessingml.document | 
| Microsoft PowerPoint OOXML(预览版) | .pptx | 
application/vnd.openxmlformats-officedocument.presentationml.presentation | 
| Microsoft Excel OOXML(预览版) | .xlsx | 
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet | 
请注意,其中一些图片格式为“有损”格式(如 JPEG)。对于采用有损格式的文件,如果减小其大小,则可能会导致图片质量下降,进而降低 Document AI 的结果准确性。
文档扫描分辨率
为了通过 Document AI 获得最准确的 OCR 结果,文档扫描件的分辨率应至少为 200 dpi(每英寸像素数)。300 dpi 及以上的分辨率通常可产生最佳效果。OCR 准确性取决于分辨率和最小字号,以及文档(如果是手写文档,则取决于手写内容)质量等其他因素,因此建议进行测试。 图像质量分析功能可帮助您评估分辨率问题。
注意:美国驾照背面图片必须达到 2,000 x 3,000 像素,才能读取条形码。