Los siguientes productos comparten capacidades con Document AI. Sin embargo, estos productos realizan una función específica de texto y análisis. Según tu caso de uso, estos productos pueden proporcionar las capacidades específicas que necesitas.
Convierte imágenes a texto
Puedes convertir el contenido de las imágenes en texto con las siguientes opciones:
- OCR de documentos empresariales.
API de Cloud Vision (con las enums
TEXT_DETECTION
oDOCUMENT_TEXT_DETECTION
) Consulta los siguientes vínculos:
Detecta artefactos visuales
Puedes usar la detección de objetos de AutoML Vision para convertir secciones de imágenes en documentos de texto. Para obtener más información, consulta Datos de imagen.
Clasifica documentos
Con el texto sin formato del documento y la ejecución previa del OCR, puedes categorizar y etiquetar los documentos con los siguientes productos:
- La API de Natural Language previamente entrenada te ayuda a clasificar el contenido con una lista generalizada de categorías.
- Usa la clasificación de AutoML Natural Language para crear un modelo de aprendizaje automático personalizado y clasificar el contenido con tus propias etiquetas de categoría.
Si bien puede haber excepciones, por lo general, no se recomienda la clasificación de AutoML Vision para la clasificación de documentos, ya que tiende a ser menos precisa que los métodos basados en texto. Sin embargo, puedes usarlo para clasificar el contenido de las imágenes.
- Por lo general, no es un método recomendado para la clasificación de documentos, ya que su precisión suele ser menor que la de los métodos basados en texto, pero puede haber excepciones.
API de Natural Language | |
Clasificación de AutoML Natural Language | |
Clasificación de AutoML Vision |
Analiza y extrae entidades
Puedes identificar entidades conocidas en documentos (nombres propios, como figuras públicas, desarrollo de la marca de la empresa, etcétera) y entidades que siguen patrones comunes, como números de teléfono y direcciones, con el analizador de formularios o cualquiera de los procesadores con entrenamiento previo para tu caso de uso.
- También puedes usar la API de Natural Language para identificar entidades públicas comunes.
- Los productos de AutoML Natural Language se usan para la extracción de entidades. Úsalos para crear un modelo de aprendizaje automático personalizado que identifique entidades específicas de tu empresa o caso de uso.
API de Natural Language | |
Extracción de entidades de AutoML Natural Language |
Otros productos
Integra estos productos complementarios con Document AI para crear una solución completa de análisis y procesamiento de documentos.
- Vertex AI: Combina AutoML y AI Platform en una API, una biblioteca cliente y una plataforma unificadas.
- API de Cloud Translation: Traduce texto de forma dinámica entre miles de pares de idiomas a través de modelos previamente entrenados. Proporciona una API de traducción de documentos para traducir directamente documentos en formatos como PDF y DOCX. Consulta Traduce documentos.
- Flujo de trabajo: Combina los servicios y las APIs de Google Cloud para compilar aplicaciones confiables, automatizar procesos y crear canalizaciones de datos y aprendizaje automático.
- Automatización de AppSheet: Crea aplicaciones y automatizaciones personalizadas con una nube abierta.
- Escáner de Drive de Google Drive: La app de Google Drive para Android te permite escanear y subir documentos a Google Drive, y ofrece sugerencias de títulos inteligentes potenciadas por Document AI.
- Google Traductor: Este servicio traduce al instante palabras, frases y páginas web del inglés a más de 100 idiomas.
Buscar un socio
Aprovecha nuestro creciente ecosistema de socios para crear y administrar tu solución de análisis de documentos. Para obtener una lista de socios y los servicios que proporcionan, consulta Socios de Document AI.
Próximos pasos
- Obtén información para configurar Document AI.
- Encuentra guías específicas en Instructivos.