Descripción general de Document AI

Este documento es una guía de los conceptos fundamentales del uso de Document AI. Debes leer esta página antes de continuar con cualquier otra documentación o guía de inicio rápido.

Automatiza los flujos de trabajo de procesamiento de documentos

Las empresas de todo el mundo dependen en gran medida de los documentos para almacenar y transmitir información. A menudo, esta información debe digitalizarse para que sea útil. Sin embargo, esto suele lograrse a través de procesos manuales que requieren mucho tiempo.

Por ejemplo:

  • Digitalización de libros para lectores electrónicos
  • Procesar formularios de admisión médica en consultorios médicos
  • Análisis de recibos y facturas para la validación de informes de gastos
  • Autentica la identidad en función de las tarjetas de ID.
  • Extraer información de ingresos de formularios fiscales para aprobar préstamos
  • Comprender los contratos para las condiciones clave de los acuerdos comerciales

Cada uno de estos flujos de trabajo implica obtener el texto sin procesar de los documentos y, luego, extraer texto específico de lo que corresponde a los datos necesarios (los campos o las entidades). Sin embargo, cada tipo de documento tiene una estructura y un diseño diferentes, y el patrón de campos varía según el caso de uso específico.

Componentes de Document AI

Document AI es una plataforma de comprensión y procesamiento de documentos que toma datos no estructurados de documentos y los transforma en datos estructurados (campos específicos, adecuados para una base de datos), lo que facilita su comprensión, análisis y consumo.

Document AI se basa en productos de Vertex AI con IA generativa para ayudarte a crear aplicaciones de procesamiento de documentos escalables, de extremo a extremo y basadas en la nube sin conocimientos especializados en aprendizaje automático.

Con Document AI, puedes hacer lo siguiente:

  • Digitaliza documentos con OCR para obtener texto, diseño y varios complementos, como la detección de calidad de imagen (para mejorar la legibilidad) y la corrección de la inclinación (completamente automática).
  • Extrae información de texto y diseño de archivos de documentos y normaliza las entidades.
  • Identifica pares clave-valor (kvp) en formularios estructurados y tablas normales. Por ejemplo, Name: Jill Smith es un kvp.
  • Clasifica los tipos de documentos para impulsar procesos posteriores, como la extracción y el almacenamiento.
  • Divide y clasifica los documentos por tipo. Por ejemplo, un archivo PDF con varios documentos reales).
  • Prepara conjuntos de datos para usarlos en el perfeccionamiento y las evaluaciones de modelos con funciones de etiquetado automático, administración de esquemas y administración de conjuntos de datos, como la revisión de documentos y predicciones.
  • Integrarlo en productos como Cloud Storage, BigQuery y la Búsqueda de Vertex AI para ayudarte a almacenar, buscar, organizar, administrar y analizar documentos y metadatos

En este diagrama, se ilustran todos los pasos clave de procesamiento de documentos que admite Document AI y cómo se pueden conectar entre sí.

docai-overview-1

Procesador

Un procesador de Document AI se encuentra entre el archivo de documento y un modelo de aprendizaje automático que realiza acciones de procesamiento y comprensión de documentos. Se pueden usar para clasificar, dividir, analizar o analizar un documento.

Cada proyecto de Google Cloud debe crear sus propias instancias de procesadores.

Los procesadores se incluyen en una de las siguientes categorías:

  • Digitalizar: OCR.
  • Extraer: Extractor personalizado, analizador de formularios, analizador de diseño y analizadores previamente entrenados.
  • Clasificar: Clasificador y divisor personalizados.

Consulta la lista completa de procesadores y detalles para obtener información sobre todos los tipos de procesadores disponibles para Document AI.

¿Qué procesador debo usar?

Para decidir qué tipo de procesador usar para una aplicación específica, ten en cuenta los siguientes lineamientos generales:

Categoría Caso práctico Tipo de procesador
Digitalizar Extrae información de texto y diseño de documentos. Enterprise Document OCR
Analiza la calidad de la imagen escaneada (legibilidad) de un documento. Enterprise Document OCR con el análisis de calidad de imagen habilitado
Extraer entidades de un documento personalizado que no cumple con los criterios del procesador personalizado
Extraer Extrae tablas o kvp de un formulario estructurado en un documento. Analizador de formularios
Extrae elementos como texto, tablas y listas en un documento y muestra fragmentos con contexto. Analizador de diseño
Extrae entidades de un documento personalizado que cumpla con los criterios del procesador personalizado. Cómo crear un extractor personalizado
Extrae entidades de un tipo de documento especializado. Un procesador previamente entrenado (entrena para mejorar la calidad).
Clasificar Clasifica documentos. Cómo crear un clasificador personalizado
Dividir documentos Cómo crear un divisor personalizado

Este diagrama ayuda a determinar qué procesador funciona mejor para cada caso de uso.

docai-overview-2

Usa procesadores de Document AI

Estos son los pasos principales para usar Document AI y comenzar a procesar documentos:

  1. Elige un procesador que sea adecuado para tu caso de uso.

  2. Crea un procesador con la consola de Google Cloud o la API de Document AI.

    • Document AI crea un extremo de predicción al que puedes enviar tus documentos.

    • Para obtener instrucciones detalladas, consulta Cómo crear un procesador.

  3. Entrena un procesador con datos de entrenamiento y prueba desde cero, o bien entrena una versión nueva (entrenada previamente) del procesador en función de una existente.

  4. Envía tus documentos para su procesamiento.