支援的映像檔

檔案格式

Vision API 支援下列圖片類型:

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • GIF 動畫 (僅限第一個影格)
  • BMP
  • WEBP
  • RAW
  • ICO
  • PDF
  • TIFF

請注意,部分圖片格式為「有損」格式 (例如 JPEG)。縮減這類有損格式的檔案大小可能會導致圖片品質下降,進而影響 Vision API 的準確度。

圖片大小

如要在 Vision API 中啟用準確的圖片偵測功能,圖片一般應至少為 640 x 480 像素 (約 30 萬像素)。以下是不同類型的 Vision API 功能要求完整詳細資料:

Vision API 功能 建議大小 * 附註
FACE_DETECTION 1600 x 1200 雙眼間的距離最重要
LANDMARK_DETECTION 640 x 480
LOGO_DETECTION 640 x 480
LABEL_DETECTION 640 x 480
TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION 1024 x 768 光學字元辨識需要更高解析度才能偵測字元
SAFE_SEARCH_DETECTION 640 x 480

建議尺寸會因偵測到的特徵而異。舉例來說,FACE_DETECTION 要求通常需要較大的圖片大小,因為要偵測的特徵 (臉部) 比圖片本身小。LABEL_DETECTION 請求通常會評估整張圖片。

實務上,640 x 480 像素的標準大小在大多數情況下都適用;如果大小超過這個標準,準確度可能不會大幅提升,但輸送量會大幅降低。請盡可能預先處理圖片,將圖片大小縮減至這些最低標準。

檔案大小

傳送至 Vision API 的圖片檔不得超過 20 MB。如果檔案超過 20 MB,系統會產生錯誤。Vision API 不會調整這類大小的檔案。 縮減檔案大小可大幅提升輸送量,但請注意,縮減檔案大小時不要降低圖片品質。請注意,Vision API 的 JSON 要求大小上限為 10 MB;較大的檔案應託管在 Cloud Storage 或網路上,而不是以 base64 編碼內容的形式傳遞至 JSON 本身。