Cloud Vision

Extrae información valiosa a partir de imágenes con nuestros potentes modelos de API ya preparados o prepara modelos de visión personalizados de forma sencilla con AutoML Vision BETA

Pruébalo gratis

Potente análisis de imágenes

La API Cloud Vision utiliza modelos ya preparados y permite crear modelos personalizados y flexibles que se adaptan a cada caso práctico a través de la función AutoML Vision.

La API Cloud Vision permite que los desarrolladores comprendan el contenido de una imagen mediante el encapsulado de potentes modelos de aprendizaje automático en una API REST fácil de usar. Esta API clasifica las imágenes rápidamente en miles de categorías (por ejemplo, "barco de vela"), detecta objetos y caras determinados dentro de dichas imágenes y es capaz de leer las palabras impresas que contengan. De este modo, puedes crear metadatos en tu catálogo de imágenes, moderar el contenido ofensivo o habilitar nuevas situaciones de marketing mediante el análisis de opinión en imágenes.

Gracias a la versión beta de AutoML Vision, los desarrolladores con una experiencia limitada en el ámbito del aprendizaje automático pueden preparar modelos personalizados de alta calidad. Una vez subidas y etiquetadas las imágenes, AutoML Vision prepara un modelo que puede escalarse según sea necesario para adaptarse a necesidades específicas. AutoML Vision ahorra tiempo a la hora de crear modelos que, además de ofrecer una mayor precisión, estén listos para la fase de producción.

Potente análisis de imágenes

Información valiosa a partir de imágenes

Detecta amplios conjuntos de objetos en tus imágenes de forma sencilla, como flores, animales, medios de transporte o miles de otras categorías de objetos habituales. La API Cloud Vision mejora a medida que añadimos conceptos nuevos y aumentamos la precisión. Con AutoML Vision, puedes crear modelos personalizados que realcen conceptos determinados de tus imágenes. Esta función permite realizar acciones muy variadas: desde categorizar las imágenes de los productos hasta diagnosticar enfermedades.

Información valiosa a partir de imágenes

Extracción de texto

El reconocimiento óptico de caracteres (OCR) te permite detectar texto en las imágenes y es compatible con la identificación automática de idiomas. Además, la API Vision es compatible con un amplio abanico de idiomas.

Extracción de texto

El poder de la Web

La API Cloud Vision utiliza la tecnología de la Búsqueda de imágenes de Google para encontrar entidades pertenecientes a una temática determinada, como personas famosas, logotipos o noticias. Esta API es compatible con millones de entidades, así que puedes tener la certeza de que las imágenes más recientes y relevantes siempre estarán disponibles. Además, puedes combinarla con la búsqueda de imágenes visualmente similares para encontrar imágenes parecidas en Internet.

El poder de la Web

Moderación de contenido

Gracias a la tecnología Búsqueda Segura de Google, podrás moderar fácilmente el contenido de las imágenes obtenidas con las aportaciones de otros usuarios y detectar el contenido inapropiado. Con la API Cloud Vision, podrás detectar diferentes tipos de contenido inapropiado, desde temas violentos hasta contenido para adultos.

Moderación de contenido

Casos prácticos de Cloud Vision

Búsqueda de imágenes

Utiliza la API Vision y la API AutoML Vision para que las imágenes se puedan buscar por un amplio abanico de temas y situaciones, incluidas las categorías personalizadas. Más información sobre esta solución

Búsqueda de imágenes

Clasificación de documentos

Consulta la información de forma eficaz mediante las APIs Vision y Natural Language para transcribir y clasificar documentos.

Clasificación de documentos

Búsqueda de productos

Encuentra productos que te interesen en las imágenes y busca catálogos de productos de forma visual con la API Cloud Vision.

Búsqueda de productos visual

Funciones de la API Cloud Vision

Extrae información valiosa de las imágenes con nuestra potente API Cloud Vision

Detección de etiquetas
Detecta amplios conjuntos de categorías en una imagen, desde medios de transporte hasta animales.
Detección web
Busca imágenes similares en Internet.
Reconocimiento óptico de caracteres
Detecta y extrae texto de una imagen. Esta función es compatible con un gran número de idiomas y con la identificación automática de idiomas. Puedes subir archivos PDF y TIFF e imágenes, como archivos PNG y GIF. Consulta la lista completa de archivos compatibles.
Reconocimiento de escritura a manobeta
Con la API Vision, además del texto impreso de forma mecánica, puedes reconocer textos escritos a mano.
Detección de logotipos
Detecta logotipos de productos muy conocidos dentro de una imagen.
Localizador de objetosbeta
Con la API Vision, además de identificar un objeto en una imagen, podrás identificar en qué parte de la imagen se encuentra dicho objeto y cuántos objetos de ese tipo hay en la imagen.
API REST integrada
Accede a la API Cloud Vision mediante la API REST para solicitar uno o varios tipos de anotación por imagen. Las imágenes pueden subirse en la solicitud o integrarse en Google Cloud Storage.
Detección de puntos de referencia
Detecta estructuras artificiales y naturales muy famosas dentro de una imagen.
Detección de caras
Detecta varias caras en una imagen, además de sus atributos faciales clave, como el estado emocional o las prendas que lleva en la cabeza. No admite el reconocimiento facial.
Moderación de contenido
Detecta contenido explícito, como el dirigido a adultos o el de carácter violento.
Integración del kit de aprendizaje automático
Integra tu dispositivo con el kit de aprendizaje automático, un SDK móvil que facilita la aplicación de la tecnología de aprendizaje automático de Google a las aplicaciones de Android e iOS en un paquete potente fácil de usar.
Búsqueda de productosbeta
Reconoce los productos de tu catálogo en fotos web y móviles, e incorpora funciones de búsqueda visual para que tus aplicaciones reconozcan productos en las imágenes.
Atributos de imagen
Detecta los atributos generales de la imagen, como el color dominante, y ofrece sugerencias de recorte pertinentes.

Funcionamiento de AutoML Visionbeta

Funcionamiento de AutoML Vision

Funciones de AutoML Visionbeta

Prepara modelos de visión personalizados de alta calidad de forma sencilla con AutoML Vision

Modelos personalizados
Prepara modelos de aprendizaje automático personalizados sin apenas esfuerzo ni conocimientos sobre este ámbito.
Rendimiento vanguardista
La precisión de predicción de los modelos de AutoML es líder en el sector, superando incluso a bases de datos como ImageNet.
Integración con el etiquetado humano
Si tienes imágenes pero ninguna etiqueta, nuestro equipo interno se encargará de revisar tus instrucciones particulares y de clasificar las imágenes en consonancia. De este modo, obtendrás datos de preparación con la misma calidad y el mismo rendimiento que aportamos a nuestros productos y, a la vez, mantendrás la privacidad de tus datos. Los datos del etiquetado humano sirven para preparar modelos personalizados sin contratiempos.
Tecnología de AutoML y del aprendizaje por transferencia de Google
Aprovecha la vanguardista tecnología de AutoML y del aprendizaje por transferencia de Google para generar modelos de alta calidad.
Totalmente integrado
El núcleo de Cloud AutoML se integra completamente con otros servicios de Google Cloud, por lo que proporciona a los clientes un método uniforme de acceso a toda su línea de servicios. Además, puedes almacenar tus datos de preparación en Google Cloud Storage. Para generar una predicción en el modelo que hayas preparado, consulta la API REST de AutoML.

Precios de la API Cloud Vision

Para obtener información más detallada, consulta la guía de precios.

  Precio por 1000 unidades, uso mensual
Función 1-1000 unidades al mes 1001-5.000.000 unidades al mes 5.000.001-20.000.000 unidades al mes
Detección de etiquetas Gratis 1,50 $ 1,00 $
Detección de texto Gratis 1,50 $ 0,60 $
Búsqueda Segura (detección de contenido explícito) Gratis Gratis con la detección de etiquetas, o bien 1,50 $ Gratis con la detección de etiquetas, o bien 0,60 $
Detección facial Gratis 1,50 $ 0,60 $
Detección de puntos de referencia Gratis 1,50 $ 0,60 $
Detección de logotipos Gratis 1,50 $ 0,60 $
Propiedades de la imagen Gratis 1,50 $ 0,60 $
Sugerencias de recorte Gratis Gratis con propiedades de la imagen, o bien 1,50 $ Gratis con propiedades de la imagen, o bien 0,60 $
Detección web Gratis 3,50 $ Ponte en contacto con nosotros para obtener más información
Detección de texto en documentos Gratis 1,50 $ 0,60 $
Localizador de objetos Gratis 2,25 $ 1,50 $

Predicción de la búsqueda de productos

1-100 unidades al día Más de 100 unidades al día
Gratis Ponte en contacto con nosotros

Almacenamiento de la búsqueda de productos

0,10 $ por 1000 imágenes

Ejemplo: si aplicas la detección de caras y la de etiquetas a una misma imagen, cada función se factura por separado. Es decir, pagarías una unidad de detección de etiquetas y otra de detección de caras, cada una al precio determinado por tu volumen mensual de unidades.

Límites: Si crees que vas a necesitar más de 20 millones de unidades al mes para tu proyecto, ponte en contacto con un representante de ventas para negociar una tarifa con descuento.

Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.

Precios de AutoML Visionbeta

Los precios de AutoML Vision se basan en la preparación y la predicción. La precisión del modelo depende normalmente de cuánto tiempo dedicas a la preparación, así como de la calidad de tu conjunto de datos de preparación. Solo pagas por el tiempo de procesamiento que utilices.

Preparación
Cada mes, obtendrás una hora de preparación gratuita por modelo para los 10 primeros modelos.
Las siguientes horas de preparación tienen un precio de 20 $ por hora. Muchos clientes consideran que una hora es suficiente para crear un modelo experimental y utilizan más horas de preparación para aumentar la precisión a nivel de producción.
Predicción
1-1000 imágenes Gratis
1001-5.000.000 imágenes* 3 $ por 1000 imágenes

* Ponte en contacto con nosotros para consultar los precios de las predicciones superiores a 5.000.000 de imágenes.

Los productos o las funciones mencionados en esta página están en fase beta. Obtén más información sobre las fases de lanzamiento de nuestros productos.

Enviar comentarios sobre...