檔案格式
Vision API 支援下列圖片類型:
- JPEG
- PNG8
- PNG24
- GIF
- GIF 動畫 (僅限第一個影格)
- BMP
- WEBP
- RAW
- ICO
- TIFF
請注意,部分圖片格式為「有損」格式 (例如 JPEG)。縮減這類有損格式的檔案大小可能會導致圖片品質下降,進而影響 Vision API 的準確度。
圖片大小
如要在 Vision API 中啟用準確的圖片偵測功能,圖片一般應至少為 640 x 480 像素 (約 30 萬像素)。以下是不同類型的 Vision API 功能要求完整詳細資料:
Vision API 功能 | 建議大小 * | 附註 |
---|---|---|
FACE_DETECTION | 1600 x 1200 | 雙眼間的距離最重要 |
LANDMARK_DETECTION | 640 x 480 | |
LOGO_DETECTION | 640 x 480 | |
LABEL_DETECTION | 640 x 480 | |
TEXT_DETECTION 和 DOCUMENT_TEXT_DETECTION | 1024 x 768 | 光學字元辨識需要更高解析度才能偵測字元 |
SAFE_SEARCH_DETECTION | 640 x 480 |
建議尺寸會因偵測到的特徵而異。舉例來說,FACE_DETECTION
要求通常需要較大的圖片大小,因為要偵測的特徵 (臉部) 比圖片本身小。LABEL_DETECTION
請求通常會評估整張圖片。
實務上,640 x 480 像素的標準大小在大多數情況下都適用;如果大小超過這個標準,準確度可能不會大幅提升,但輸送量會大幅降低。請盡可能預先處理圖片,將圖片大小縮減至這些最低標準。
檔案大小
傳送至 Vision API 的圖片檔不得超過 20 MB。如果檔案超過 20 MB,系統會產生錯誤。Vision API 不會調整這類大小的檔案。 縮減檔案大小可大幅提升輸送量,但請注意,縮減檔案大小時不要降低圖片品質。請注意,Vision API 的 JSON 要求大小上限為 10 MB;較大的檔案應託管在 Cloud Storage 或網路上,而不是以 base64 編碼內容的形式傳遞至 JSON 本身。