文件类型
Document AI 支持以下图片类型。
如需了解文件大小和页面限制,请参阅配额和限制页面。
名称 | 文件扩展名 | MIME 类型 |
---|---|---|
便携式文档格式 (PDF) | .pdf |
application/pdf |
图形交换格式 (GIF) | .gif |
image/gif |
标记图像文件格式 (TIFF) | .tiff ,.tif |
image/tiff |
联合图像专家组 (JPEG) | .jpg ,.jpeg |
image/jpeg |
便携式网络图形 (PNG) | .png |
image/png |
位图 (BMP) | .bmp |
image/bmp |
WebP | .webp |
image/webp |
超文本标记语言 (HTML) | .html |
text/html |
Microsoft Word Office 开放式 XML (OOXML)(预览版) | .docx |
application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Microsoft PowerPoint OOXML(预览版) | .pptx |
application/vnd.openxmlformats-officedocument.presentationml.presentation |
Microsoft Excel OOXML(预览版) | .xlsx |
application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
请注意,其中一些图片格式为“有损”格式(如 JPEG)。对于采用有损格式的文件,如果减小其大小,则可能会导致图片质量下降,进而降低 Document AI 的结果准确性。
文档扫描分辨率
为了通过 Document AI 获得最准确的 OCR 结果,文档扫描件的分辨率应至少为 200 dpi(每英寸像素数)。300 dpi 及以上的分辨率通常可产生最佳效果。OCR 准确性取决于分辨率和最小字号,以及文档(如果是手写文档,则取决于手写内容)质量等其他因素,因此建议进行测试。 图像质量分析功能可帮助您评估分辨率问题。
注意:美国驾照背面图片必须达到 2,000 x 3,000 像素,才能读取条形码。