Extrae texto y datos de imágenes y documentos, convierte contenido sin estructurar en datos estructurados de tu empresa y accede a información valiosa.
Integra las funciones de OCR en tus aplicaciones a través de APIs.
Los nuevos clientes reciben 300 USD en crédito gratis al registrarse para solicitar un documento que resuma las soluciones de OCR.
Información general
Google Cloud ofrece dos tipos de OCRs: OCR para documentos y OCR para las imágenes y los vídeos.
Aunque comparten una tecnología fundamental, Document AI es una plataforma de comprensión de documentos optimizada para el procesamiento de documentos. Su Extractor personalizado utiliza la tecnología de IA generativa , que procesa documentos genéricos y específicos de un dominio con mayor precisión y de forma más rápida, sin necesidad de elegir un procesador especializado.
Cloud Vision sirve para detectar texto, escritura a mano y una amplia variedad de objetos a partir de imágenes y vídeos.
Google Cloud potencia el OCR con una IA de primera categoría. Van más allá del reconocimiento de texto tradicional al entender, organizar y enriquecer los datos y, en última instancia, generar información valiosa para la empresa.
Te ofrece la flexibilidad de usar las herramientas de OCR como un paquete unificado para mejorar la eficiencia optimizada (por ejemplo, Document AI) o simplemente para llamar a las APIs disponibles directamente en la consola de Google Cloud para integrar las funciones de OCR en tus aplicaciones.
Todas las soluciones de OCR mencionadas anteriormente te permiten acceder a modelos de aprendizaje automático preentrenados que puedes desplegar directamente a través de una API, o bien mejorar la precisión para satisfacer tus necesidades específicas.
También puedes entrenar tus propios modelos personalizados con AutoML, sin necesidad de conocimientos avanzados en la materia.
Consulta la documentación de AutoML sobre cómo crear modelos personalizados de aprendizaje automático.
Si quieres analizar un documento o crear un flujo de procesamiento de documentos automatizado, utiliza Document AI. Además, se ocupa de todo el flujo de trabajo en un solo lugar, desde comprender los documentos hasta buscar, almacenar, gobernar y gestionar los documentos, junto con los datos extraídos.
Si quieres analizar y procesar imágenes, utiliza Cloud Vision junto con otros productos de Google Cloud para obtener los mejores resultados posibles. Consulta la sección Usos comunes para obtener más información y guías de inicio rápido.
Ambas APIs se pueden probar con una cuenta de Google Cloud de forma gratuita.
Comparar las ofertas de OCR
oferta de OCR | Usos recomendados | Características principales | |
---|---|---|---|
| Casos prácticos generales de extracción de textos que requieren una latencia baja y una gran capacidad. | Funciones predefinidas como etiquetado de imágenes, detección de caras y puntos de referencia, OCR y búsqueda segura. | |
Enterprise Document OCR | Digitaliza texto de documentos (PDF, documentos escaneados como imágenes o archivos de Microsoft DocX). | Extrae texto en más de 200 idiomas y 50 idiomas escritos a mano. Complementos para reconocer fórmulas matemáticas, estilos, etc. | |
| Workbench de Document AI | Extrae, clasifica y divide cualquier documento con la IA generativa (modelos básicos) | Extractor personalizado: usa modelos básicos para crear analizadores rápidamente sin un etiquetado ni entrenamiento de datos exhaustivos. Clasificador personalizado y divisor de documentos para un procesamiento eficiente. |
| Modelos entrenados previamente | Extracción de texto y campos de documentos específicos de cada dominio. | Extracción de texto y digitalización de varios documentos de aprovisionamiento, préstamos, identidad y contratos. |
Casos prácticos generales de extracción de textos que requieren una latencia baja y una gran capacidad.
Funciones predefinidas como etiquetado de imágenes, detección de caras y puntos de referencia, OCR y búsqueda segura.
Enterprise Document OCR
Digitaliza texto de documentos (PDF, documentos escaneados como imágenes o archivos de Microsoft DocX).
Extrae texto en más de 200 idiomas y 50 idiomas escritos a mano.
Complementos para reconocer fórmulas matemáticas, estilos, etc.
Workbench de Document AI
Extrae, clasifica y divide cualquier documento con la IA generativa (modelos básicos)
Extractor personalizado: usa modelos básicos para crear analizadores rápidamente sin un etiquetado ni entrenamiento de datos exhaustivos.
Clasificador personalizado y divisor de documentos para un procesamiento eficiente.
Modelos entrenados previamente
Extracción de texto y campos de documentos específicos de cada dominio.
Extracción de texto y digitalización de varios documentos de aprovisionamiento, préstamos, identidad y contratos.
Cómo funciona
Para comprender y procesar documentos, usa Document AI.
Para las imágenes, recomendamos utilizar Cloud Vision.
Ambos modelos te permiten acceder a modelos de aprendizaje automático preentrenados que puedes desplegar tal cual a través de APIs o de procesos de actualización. También puedes entrenar tus propios modelos personalizados desde cero con AutoML, sin necesidad de conocimientos de aprendizaje automático.
Las primeras 1000 unidades del mes son gratuitas cuando usas Cloud Vision o el OCR de documentos. Pruébalo con una simple llamada a la API.
Demo
Prueba la API de Document AI con solo arrastrar y soltar.
Usos habituales
El extractor personalizado de Document AI se basa en un modelo básico que extrae texto y datos de documentos genéricos y específicos de un dominio, de forma más rápida y precisa. Ajusta fácilmente entre 5 y 10 documentos para mejorar el rendimiento.
Si quieres entrenar tu propio modelo, etiqueta automáticamente tus conjuntos de datos con el modelo básico para agilizar la producción.
También puedes utilizar procesadores especializados entrenados previamente. Consulta la lista completa de procesadores.
El extractor personalizado de Document AI se basa en un modelo básico que extrae texto y datos de documentos genéricos y específicos de un dominio, de forma más rápida y precisa. Ajusta fácilmente entre 5 y 10 documentos para mejorar el rendimiento.
Si quieres entrenar tu propio modelo, etiqueta automáticamente tus conjuntos de datos con el modelo básico para agilizar la producción.
También puedes utilizar procesadores especializados entrenados previamente. Consulta la lista completa de procesadores.
Con la tecnología de GenAI, Document AI puede extraer datos con precisión de documentos con diferentes diseños y niveles de calidad. Puedes conectarlo con Cloud Storage para que los documentos no estructurados cumplan las normativas empresariales. BigQuery permite procesar y analizar los datos extraídos por lotes de la forma que quieras. Con Looker, puedes crear fácilmente visualizaciones basadas en tus tablas de BigQuery. Vertex AI Search te permite consultar y buscar tus documentos en Cloud Storage de forma conversacional o tradicional.
Configurar todo el flujo de procesamiento tal y como se indica lleva entre 60 y 90 minutos, mientras que la parte de Document AI tarda 10 minutos.
Con la tecnología de GenAI, Document AI puede extraer datos con precisión de documentos con diferentes diseños y niveles de calidad. Puedes conectarlo con Cloud Storage para que los documentos no estructurados cumplan las normativas empresariales. BigQuery permite procesar y analizar los datos extraídos por lotes de la forma que quieras. Con Looker, puedes crear fácilmente visualizaciones basadas en tus tablas de BigQuery. Vertex AI Search te permite consultar y buscar tus documentos en Cloud Storage de forma conversacional o tradicional.
Configurar todo el flujo de procesamiento tal y como se indica lleva entre 60 y 90 minutos, mientras que la parte de Document AI tarda 10 minutos.
Este proceso también se denomina "etiquetado de imágenes".
La API de Cloud Vision puede identificar y etiquetar en una imagen objetos generales, puntos de referencia, ubicaciones, logotipos, actividades, especies de animales, productos y mucho más. Una vez que las imágenes están etiquetadas con las etiquetas detectadas, la búsqueda, el procesamiento y la gestión de imágenes son automáticos y más sencillos.
Si necesitas etiquetas personalizadas de segmentación, usa Cloud AutoML para entrenar un modelo de aprendizaje automático personalizado.
Para utilizar las tecnologías de OCR de Google on-premise, utiliza OCR On-Prem, disponible en Cloud Marketplace.
Para ejecutar un flujo de procesamiento básico de imágenes que detecte etiquetas, tal y como se muestra a la derecha, el coste mensual sería de 27,36 USD.
Puedes consultar las suposiciones de uso que se han hecho para llegar a esta cifra con la calculadora de precios.
Las primeras 1000 unidades del mes son gratuitas.
Este proceso también se denomina "etiquetado de imágenes".
La API de Cloud Vision puede identificar y etiquetar en una imagen objetos generales, puntos de referencia, ubicaciones, logotipos, actividades, especies de animales, productos y mucho más. Una vez que las imágenes están etiquetadas con las etiquetas detectadas, la búsqueda, el procesamiento y la gestión de imágenes son automáticos y más sencillos.
Si necesitas etiquetas personalizadas de segmentación, usa Cloud AutoML para entrenar un modelo de aprendizaje automático personalizado.
Para utilizar las tecnologías de OCR de Google on-premise, utiliza OCR On-Prem, disponible en Cloud Marketplace.
Para ejecutar un flujo de procesamiento básico de imágenes que detecte etiquetas, tal y como se muestra a la derecha, el coste mensual sería de 27,36 USD.
Puedes consultar las suposiciones de uso que se han hecho para llegar a esta cifra con la calculadora de precios.
Las primeras 1000 unidades del mes son gratuitas.
La API de Cloud Vision permite detectar y extraer texto y escritura a mano de imágenes en diferentes idiomas. Además, es compatible con varias regiones , para las que puedes especificar el almacenamiento de datos y el procesamiento OCR a nivel continental.
Puedes obtener resultados inmediatos de un número reducido de imágenes (hasta 16 por solicitud) o procesar por lotes un número mayor de imágenes (hasta a 2000 por solicitud) de forma asíncrona para un resultado posterior.
Para ejecutar un flujo de procesamiento básico que extraiga texto de imágenes como se muestra a la derecha, el coste mensual sería de 27,36 USD.
Puedes consultar las suposiciones de uso que se han hecho para llegar a esta cifra con la calculadora de precios.
Las primeras 1000 unidades del mes son gratuitas.
La API de Cloud Vision permite detectar y extraer texto y escritura a mano de imágenes en diferentes idiomas. Además, es compatible con varias regiones , para las que puedes especificar el almacenamiento de datos y el procesamiento OCR a nivel continental.
Puedes obtener resultados inmediatos de un número reducido de imágenes (hasta 16 por solicitud) o procesar por lotes un número mayor de imágenes (hasta a 2000 por solicitud) de forma asíncrona para un resultado posterior.
Para ejecutar un flujo de procesamiento básico que extraiga texto de imágenes como se muestra a la derecha, el coste mensual sería de 27,36 USD.
Puedes consultar las suposiciones de uso que se han hecho para llegar a esta cifra con la calculadora de precios.
Las primeras 1000 unidades del mes son gratuitas.
Precios
¿Cuánto cuesta mi caso práctico? | Conoce el coste mensual que debes pagar para cubrir un caso práctico, con los productos que necesitas y las suposiciones clave sobre el uso. | ||
---|---|---|---|
Caso práctico | Productos usados | Suposiciones sobre el uso | Coste mensual estimado (USD) |
Etiquetado, procesamiento y búsqueda de imágenes | Cloud Vision Cloud Storage Pub/Sub Cloud Run | 1. 15.000 llamadas a la API de detección de etiquetas de Cloud Vision al mes 2. 100 GiB de almacenamiento mensual 3. Una CPU de 1,25 GiB 4. Cuatro GiB publicados diariamente a través de Pub/Sub | 27,36 $ |
Extraer texto e información valiosa de documentos | Document AI Cloud Storage BigQuery Cloud Functions | 1. 1000 llamadas a la API del analizador de formularios de Document AI al mes 2. 100 GiB de almacenamiento mensual 3. 1 TiB de consultas mensuales 4.RAM: 512 MB, CPU: 800 MHz | 71,87 $ |
Extraer texto de imágenes | Cloud Vision Cloud Storage Pub/Sub Cloud Run | 1. 15.000 llamadas mensuales a la API OCR de Cloud Vision 2. 100 GiB de almacenamiento mensual 3. Una CPU de 1,25 GiB 4. Cuatro GiB publicados diariamente a través de Pub/Sub | 27,36 $ |
Consulta todos los detalles del precio por unidad de Document AI, la API de Vision y AutoML.
¿Cuánto cuesta mi caso práctico?
Conoce el coste mensual que debes pagar para cubrir un caso práctico, con los productos que necesitas y las suposiciones clave sobre el uso.
Cloud Vision
Cloud Storage
Pub/Sub
Cloud Run
1. 15.000 llamadas a la API de detección de etiquetas de Cloud Vision al mes
2. 100 GiB de almacenamiento mensual
3. Una CPU de 1,25 GiB
4. Cuatro GiB publicados diariamente a través de Pub/Sub
27,36 $
Document AI
Cloud Storage
BigQuery
Cloud Functions
1. 1000 llamadas a la API del analizador de formularios de Document AI al mes
2. 100 GiB de almacenamiento mensual
3. 1 TiB de consultas mensuales
4.RAM: 512 MB, CPU: 800 MHz
71,87 $
Cloud Vision
Cloud Storage
Pub/Sub
Cloud Run
1. 15.000 llamadas mensuales a la API OCR de Cloud Vision
2. 100 GiB de almacenamiento mensual
3. Una CPU de 1,25 GiB
4. Cuatro GiB publicados diariamente a través de Pub/Sub
27,36 $
Consulta todos los detalles del precio por unidad de Document AI, la API de Vision y AutoML.