파일 형식
Vision API는 다음 이미지 유형을 지원합니다.
- JPEG
- PNG8
- PNG24
- GIF
- 애니메이션 GIF(첫 번째 프레임만)
- BMP
- WEBP
- RAW
- ICO
- TIFF
이러한 이미지 형식 중 JPEG를 비롯한 일부는 '손실' 형식입니다. 이러한 손실 형식의 파일 크기를 줄이면 화질이 저하되어 Vision API의 정확성이 떨어질 수 있습니다.
이미지 크기 조정
Vision API의 이미지 인식 정확성을 높이기 위해 일반적으로 권장되는 최소 이미지 크기는 640 x 480 픽셀(약 300k 픽셀)입니다. Vision API 특징 요청의 유형별 세부정보는 아래와 같습니다.
Vision API 특징 | 권장 크기 * | 참고 |
---|---|---|
FACE_DETECTION | 1600 x 1200 | 눈 사이 거리가 가장 중요합니다. |
LANDMARK_DETECTION | 640 x 480 | |
LOGO_DETECTION | 640 x 480 | |
LABEL_DETECTION | 640 x 480 | |
TEXT_DETECTION 및 DOCUMENT_TEXT_DETECTION | 1024 x 768 | OCR의 경우 문자 감지를 위해 해상도가 더 높아야 합니다. |
SAFE_SEARCH_DETECTION | 640 x 480 |
이러한 권장 크기는 인식 대상 특징에 따라 다릅니다. 예를 들어 FACE_DETECTION
에는 일반적으로 더 큰 이미지가 필요하며, 그 이유는 인식 대상 특징(얼굴)이 이미지 자체보다 작기 때문입니다.
반면, LABEL_DETECTION
요청에서는 일반적으로 전체 이미지를 평가합니다.
실무에서는 대부분의 경우 표준 크기인 640 x 480 픽셀을 사용하면 문제가 없으며, 이보다 큰 이미지를 사용하면 정확성 개선 효과 없이 처리량만 대폭 감소할 수 있습니다. 가능하면 항상 이미지를 전처리하여 최소 기준 크기로 줄이시기 바랍니다.
파일 크기
Vision API로 전송되는 이미지 파일은 20MB를 초과 할 수 없습니다. 20MB를 초과하는 파일은 오류를 생성합니다. Vision API는 이 크기의 파일을 크기 조절하지 않습니다. 파일 크기를 줄이면 처리량이 크게 증가할 수 있지만, 이미지 품질이 저하되지 않는 선을 유지해야 합니다. Vision API는 JSON 요청 크기를 10MB로 제한합니다. 이보다 큰 파일은 JSON 자체에 base64 인코딩 콘텐츠로 전달하는 대신 Cloud Storage 또는 웹에 호스팅해야 합니다.