지원 이미지

파일 형식

Vision API는 다음 이미지 유형을 지원합니다.

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • 애니메이션 GIF(첫 번째 프레임만)
  • BMP
  • WEBP
  • RAW
  • ICO
  • PDF
  • TIFF

이러한 이미지 형식 중 JPEG를 비롯한 일부는 '손실' 형식입니다. 이러한 손실 형식의 파일 크기를 줄이면 화질이 저하되어 Vision API의 정확성이 떨어질 수 있습니다.

이미지 크기 조정

Vision API의 이미지 인식 정확성을 높이기 위해 일반적으로 권장되는 최소 이미지 크기는 640 x 480 픽셀(약 300k 픽셀)입니다. Vision API 특징 요청의 유형별 세부정보는 아래와 같습니다.

Vision API 특징 권장 크기 * 참고
FACE_DETECTION 1600 x 1200 눈 사이 거리가 가장 중요합니다.
LANDMARK_DETECTION 640 x 480
LOGO_DETECTION 640 x 480
LABEL_DETECTION 640 x 480
TEXT_DETECTION 및 DOCUMENT_TEXT_DETECTION 1024 x 768 OCR의 경우 문자 감지를 위해 해상도가 더 높아야 합니다.
SAFE_SEARCH_DETECTION 640 x 480

이러한 권장 크기는 인식 대상 특징에 따라 다릅니다. 예를 들어 FACE_DETECTION에는 일반적으로 더 큰 이미지가 필요하며, 그 이유는 인식 대상 특징(얼굴)이 이미지 자체보다 작기 때문입니다. 반면, LABEL_DETECTION 요청에서는 일반적으로 전체 이미지를 평가합니다.

실무에서는 대부분의 경우 표준 크기인 640 x 480 픽셀을 사용하면 문제가 없으며, 이보다 큰 이미지를 사용하면 정확성 개선 효과 없이 처리량만 대폭 감소할 수 있습니다. 가능하면 항상 이미지를 전처리하여 최소 기준 크기로 줄이시기 바랍니다.

파일 크기

Vision API로 전송되는 이미지 파일은 20MB를 초과 할 수 없습니다. 20MB를 초과하는 파일은 오류를 생성합니다. Vision API는 이 크기의 파일을 크기 조절하지 않습니다. 파일 크기를 줄이면 처리량이 크게 증가할 수 있지만, 이미지 품질이 저하되지 않는 선을 유지해야 합니다. Vision API는 JSON 요청 크기를 10MB로 제한합니다. 이보다 큰 파일은 JSON 자체에 base64 인코딩 콘텐츠로 전달하는 대신 Cloud Storage 또는 웹에 호스팅해야 합니다.