Imágenes admitidas

Formatos de archivo

La API de Vision admite los siguientes tipos de imágenes:

  • JPEG
  • PNG8
  • PNG24
  • GIF
  • GIF animado (solo el primer cuadro)
  • BMP
  • WEBP
  • RAW
  • ICO
  • PDF
  • TIFF

Ten en cuenta que algunos de estos formatos son “con pérdida” (por ejemplo, JPEG). Si reduces el tamaño de los archivos para los formatos con pérdida, puedes generar una degradación en la calidad de la imagen y, en consecuencia, en la exactitud de la API de Vision.

Tamaño de la imagen

Para habilitar la detección exacta de imágenes dentro de la API de Vision, las imágenes deben tener, en general, un mínimo de 640 × 480 píxeles (alrededor de 300,000 píxeles). A continuación, se muestran detalles completos de diferentes tipos de solicitudes de funciones de la API de Vision:

Función de la API de Vision Tamaño recomendado* Notas
FACE_DETECTION 1600 × 1200 La distancia entre los ojos es lo más importante.
LANDMARK_DETECTION 640 × 480
LOGO_DETECTION 640 × 480
LABEL_DETECTION 640 × 480
TEXT_DETECTION y DOCUMENT_TEXT_DETECTION 1024 × 768 OCR necesita más resolución para detectar caracteres.
SAFE_SEARCH_DETECTION 640 × 480

Estos tamaños recomendados difieren según la característica que se detecte. Por ejemplo, las solicitudes FACE_DETECTION, en general, necesitan tamaños de imagen más grandes debido a que las características que se detectan (rostros) son más pequeñas que la imagen en sí misma. En cambio, las solicitudes LABEL_DETECTION, en general, evalúan la imagen completa.

En la práctica, un tamaño estándar de 640 × 480 píxeles funciona bien en la mayoría de los casos; los tamaños mayores no son mucho más precisos, y disminuyen en gran cantidad la capacidad de procesamiento. Cuando sea posible, procesa tus imágenes antes para reducir el tamaño a los estándares mínimos.

Tamaño de los archivos

Los archivos de imagen enviados a la API de Vision no deben superar los 20 MB. Los archivos de más de 20 MB generan un error. La API de Vision no cambia el tamaño de los archivos de este tamaño. La reducción del tamaño del archivo puede mejorar la capacidad de procesamiento de forma significativa; sin embargo, ten cuidado de no reducir la calidad de la imagen durante el proceso. Ten en cuenta que la API de Vision impone un límite de tamaño de solicitud JSON de 10 MB; los archivos más grandes deben ser alojados en Cloud Storage o en la Web, en vez de pasarlos como contenido codificado en base64 en JSON.