支持的图片

文件格式

Cloud Vision API 支持以下图片类型:

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • 动画 GIF(仅第一帧)
  • BMP
  • WEBP
  • RAW
  • ICO

请注意,其中一些图片格式为“有损”格式(如 JPEG)。对于采用这种有损格式的文件,如果减小其大小,则可能会导致图片质量下降,进而降低 Vision API 的准确性。

调整图片大小

要在 Cloud Vision API 内进行准确的图片检测,图片通常最低应为 640 x 480 像素(约 30 万像素)。下面显示了不同类型的 Vision API 特征请求的全部详细信息:

Vision API 特征 推荐大小* 备注
FACE_DETECTION 1600 x 1200 两眼之间的距离最重要
LANDMARK_DETECTION 640 x 480
LOGO_DETECTION 640 x 480
LABEL_DETECTION 640 x 480
TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 1024 x 768 OCR 需要更高的分辨率才能检测字符
SAFE_SEARCH_DETECTION 640 x 480

* 注意:通常,Vision API 要求图片具有足够的分辨率,才能轻松区分请求中的重要特征。如果图片分辨率大于或小于上述推荐大小,检测也可能有效。不过,分辨率较低可能会降低准确性;分辨率较高则可能会增加处理时间和带宽使用量,但无法同时在准确性方面提供同等的优势。

推荐大小因待检测的特征而异。例如,FACE_DETECTION 请求通常需要较高的图片分辨率,因为待检测的特征(人脸)小于图片本身。 另一方面,LABEL_DETECTION 请求通常会评估整张图片。

实际上,640 x 480 像素的标准大小在大多数情况下效果都很好;如果分辨率高于这一大小,准确性可能不会提高很多,但同时会大大减少吞吐量。如果可能的话,对您的图片进行预处理,将它们的分辨率减小到最低标准。

文件大小

发送到 Cloud Vision API 的文件大小不应超过 20MB。减小文件大小可显著增加吞吐量;不过,请注意不要在此过程中降低图片质量。请注意,Vision API 将 JSON 请求的大小限制为 10MB;如果文件较大,则应托管在 Cloud Storage 或网络中,而不是在 JSON 中作为 Base64 编码的内容传递。

此页内容是否有用?请给出您的反馈和评价:

发送以下问题的反馈:

此网页
Cloud Vision API 文档