Vision AI
Extrae información valiosa de tus imágenes en la nube o en el perímetro con AutoML Vision, o usa modelos previamente entrenados de la API de Vision para detectar emociones, interpretar texto y mucho más.

AES, una multinacional energética que forma parte de la lista Fortune 500, utiliza drones y AutoML Vision para acelerar la llegada de un futuro energético más verde y seguro.

La comprensión de imágenes líder en el sector
Google Cloud te ofrece dos productos de visión artificial que emplean el aprendizaje automático para ayudarte a comprender tus imágenes con la predicción más precisa del sector.
AutoML Vision
Automatiza el entrenamiento de tus propios modelos de aprendizaje automático. Sube imágenes y entrena modelos de imágenes personalizados de forma sencilla con la intuitiva interfaz gráfica de AutoML Vision. Optimiza la precisión, la latencia y el tamaño de tus modelos y expórtalos a tu aplicación en la nube o a un conjunto de dispositivos en el perímetro.
API de Vision
La API de Vision de Google Cloud ofrece modelos de aprendizaje automático entrenados previamente y muy potentes a través de las API REST y RPC. Asigna etiquetas a imágenes y clasifícalas rápidamente en millones de categorías predefinidas. Detecta objetos y caras, lee texto impreso y manuscrito, y consigue metadatos de gran valor para tu catálogo de imágenes.
Ventajas

Detecta objetos automáticamente
Detecta y clasifica distintos objetos, y consigue información como la posición de cada uno de ellos en la imagen. Consulta más información sobre la detección de objetos con la API de Vision y AutoML Vision.

Obtén información valiosa en el perímetro
Con AutoML Vision Edge puedes crear y desplegar modelos rápidos y de gran precisión para clasificar imágenes o detectar objetos en el perímetro, así como activar acciones en tiempo real en función de los datos locales. AutoML Vision Edge es compatible con diversos dispositivos perimetrales en caso de que se cuente con recursos limitados y la latencia sea muy importante. Más información

Aumenta la fluidez del proceso de venta
Gracias a la búsqueda visual de productos de la API Vision, los comercios pueden crear experiencias móviles atractivas que permitan a sus clientes subir la foto de un objeto y ver de inmediato una lista de objetos similares que pueden comprar.

Comprende el texto y actúa en consecuencia
La API de Vision utiliza la tecnología de reconocimiento óptico de caracteres (OCR) para detectar texto en imágenes en más de 50 idiomas y diferentes tipos de archivo. También forma parte de Document Understanding AI, que permite procesar rápidamente millones de documentos y automatizar los flujos de trabajo de los negocios.

Detecta contenido explícito
La API de Vision puede revisar tus imágenes mediante la función de búsqueda segura y estimar la probabilidad de que cualquiera de ellas incluya contenido para adultos, violento o similares.

Usa nuestro servicio de etiquetado de datos
Si tienes imágenes para AutoML Vision que todavía no se hayan etiquetado, Google cuenta con un equipo de personas que pueden ayudarte a anotar imágenes, vídeos y texto para conseguir datos de preparación de alta calidad. Más información
¿Qué producto de visión artificial es el más adecuado para ti?
Puedes trabajar con solo uno de los productos o aprovechar las ventajas que ofrecen los dos. Si te decides por esto último, puedes usar la API de Vision para categorizar rápidamente el contenido mediante miles de etiquetas predefinidas y utilizar AutoML Vision para crear otras etiquetas personalizadas que se adapten a tus necesidades concretas.
AutoML Vision | API de Vision | |
---|---|---|
Interfaz de usuario | ||
Uso de APIs
Uso de las APIs REST y RPC.
|
|
|
Uso de una interfaz de usuario gráfica
Uso de una interfaz de usuario gráfica.
|
|
|
Etiquetas predefinidas o personalizadas | ||
Clasificación de imágenes mediante etiquetas predefinidas
Los modelos entrenados previamente hacen uso de bibliotecas muy amplias de etiquetas predefinidas.
|
|
|
Clasificación de imágenes mediante etiquetas personalizadas
Entrena modelos para clasificar imágenes con las etiquetas que elijas.
|
|
|
Uso del servicio de etiquetado de datos de Google
Nuestro equipo puede ayudarte a anotar imágenes, vídeos y texto.
|
|
|
Despliegue en el perímetro | ||
Despliegue de modelos de aprendizaje automático en el perímetro
Despliega modelos de baja latencia y alta precisión optimizados para dispositivos perimetrales.
|
|
Se integra con ML Kit |
Más funciones | ||
Detección de objetos
Detecta objetos: descubre dónde están y cuántos son.
|
|
|
Búsqueda visual de productos
Compara fotos con las imágenes de tu catálogo de productos y devuelve una lista ordenada de objetos similares.
|
|
|
Detección de texto impreso y manuscrito
Utiliza el OCR e identifica automáticamente el idioma.
|
|
|
Detección de caras
Detecta caras y rasgos faciales (no compatible con el reconocimiento facial).
|
|
|
Identificación de lugares y logotipos de productos conocidos
Identifica automáticamente los puntos de referencia y logotipos de productos muy conocidos.
|
|
|
Asignación de atributos generales de imagen
Detecta los atributos generales y ofrece pistas de recorte adecuadas.
|
|
|
Detección de entidades y páginas web
Encuentra noticias, logotipos e imágenes similares en la Web.
|
|
|
Moderación de contenido
Detecta contenido explícito (contenido para adultos, de carácter violento, etc.) en las imágenes.
|
|
|
Reconocimiento de famosos
Identifica caras de famosos en imágenes (acceso limitado; consulta la documentación).
|
|
Clientes de la API de Vision


Clientes de AutoML Vision




Lo más destacado de Google Cloud Next ’19
Descubre cómo extraen los clientes empresariales información valiosa de datos de imágenes gracias a la IA de Google Cloud.
Usos
Inspección industrial
Con AutoML Vision Edge, puedes automatizar el proceso de control de calidad durante la fabricación al permitir que los dispositivos perimetrales identifiquen defectos.
Regístrate para obtener más información sobre nuestra solución de inspección industrial.
Product Search de Vision
Encuentra productos interesantes en las imágenes y busca de forma visual en los catálogos de productos con la API de Vision.
Clasificación de documentos
Utiliza las APIs de Vision y Natural Language para clasificar, extraer y enriquecer documentos y, así, acceder a la información de manera eficaz. Para obtener más información, consulta Document AI.
Búsqueda de imágenes
Utiliza la API de Vision y AutoML Vision para que las imágenes se puedan buscar por un amplio abanico de temas y situaciones, incluidas las categorías personalizadas. Más información sobre esta solución
Precio
Recursos
Cursos y experimentos prácticos

Primeros pasos
Integra la visión artificial en tus aplicaciones
Da el primer paso ahora mismo con AutoML Vision, AutoML Vision Edge, la API de Vision o Product Search de Vision.
Los productos o las funciones mencionados en esta página están en fase beta. Más información sobre nuestras fases de lanzamiento
Los productos de inteligencia artificial de Cloud cumplen las políticas de acuerdo de nivel de servicio de Google Cloud Platform. Pueden ofrecer garantías de latencia o disponibilidad diferentes respecto a otros servicios de Google Cloud.