Análisis de formularios

Form Parser extrae pares clave-valor, tablas, marcas de selección (como casillas de verificación), campos genéricos y texto para mejorar y automatizar el procesamiento de documentos.

Se puede considerar el uso de Análisis de formularios en lugar de otros analizadores cuando el caso práctico implique lo siguiente:

  • Tratar con formularios estructurados: destaca por extraer pares clave-valor de formularios bien definidos que tienen el aspecto de formularios convencionales con espacios en blanco etiquetados para rellenar, como name: __. El modelo preentrenado de Form Parser ofrece una alta precisión en campos habituales, como nombres, fechas y direcciones.
  • Se necesita una extracción de tablas flexible: el analizador de formularios extrae datos de tablas sencillas (sin celdas que abarquen filas o columnas) que tienen el aspecto de tablas. No es necesario (ni posible) recibir formación. En el caso de la extracción de tablas entrenadas, el extractor personalizado se puede usar con un campo principal que contenga campos secundarios de columna (celda).
  • Necesidad de eficiencia: evita crear y mantener analizadores de extracción, sobre todo para tareas de extracción de gran volumen y variadas.

Funciones de extracción de datos

Las funciones de Analizador de formularios incluyen lo siguiente:

  • Par clave-valor: se trata de conjuntos de dos elementos de un documento: una etiqueta o clave y los datos correspondientes (un valor). Puede usar directamente los pares clave-valor (si las claves son coherentes) o crear una lógica personalizada para convertir las claves variadas en información estructurada coherente.

  • Entidades genéricas: analiza 11 campos diferentes de documentos de forma predeterminada. Por ejemplo:

    • email
    • phone
    • url
    • date_time
    • address
    • person
    • organization
    • quantity
    • price
    • id
    • page_number
  • Texto y diseño: usa nuestro motor de reconocimiento óptico de caracteres más reciente para extraer texto e información sobre el diseño. Esto incluye el texto insertado de PDFs digitales (solo en la versión 2.1) o el texto de imágenes.

  • Tablas: detecta y extrae tablas de imágenes y PDFs.

  • Casillas de verificación: detector de marcas de selección de alta calidad que extrae casillas de verificación de imágenes y archivos PDF como pares clave-valor. Para ello, usa el texto más cercano a la casilla de verificación, con un valueType que indica si está marcada o no.

Idiomas y regiones

Versiones del modelo

Las siguientes versiones de procesador son compatibles con esta función. Para obtener más información, consulta Gestionar versiones del procesador.

Limitaciones

  • No se admiten las compresiones JPEG anteriores para TIFF. Tipo de encapsulación JPEG definido por la especificación de la versión 6.0 de TIFF.

  • El modelo de casilla de verificación no admite el análisis de botones de radio. Es posible que algunas casillas de verificación detectadas no tengan claves correspondientes.

  • El modelo no analiza de forma fiable un KVP con un valor sin rellenar, como un formulario en blanco.

  • El análisis de KVP en documentos en determinados idiomas puede tener una calidad inferior a la de los idiomas latinos.

Procesar documentos con Form Parser

En esta guía de inicio rápido se presenta la función Analizador de formularios de Document AI. En este inicio rápido, usarás la Google Cloud consola para configurar tu proyecto Google Cloud y la autorización, crear un analizador de formularios y, a continuación, enviar una solicitud a Document AI para que procese un formulario PDF.

Descubre cómo:

  1. Habilita Document AI en un Google Cloud proyecto.

  2. Crea un procesador de analizador de formularios, que puede identificar y extraer texto, pares clave-valor, tablas y entidades genéricas de muchos tipos de documentos.

  3. Usa el procesador para anotar un documento de muestra.


Para seguir las instrucciones paso a paso de esta tarea directamente en la Google Cloud consola, haga clic en Ayúdame:

Guíame


  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Document AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Document AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  8. Crear un procesador de analizador de formularios

    Usa la consola Google Cloud para crear un procesador de análisis de formularios. Consulta más información sobre cómo crear y gestionar procesadores.

    1. En el menú de navegación de la consola, haz clic en Document AI y selecciona Galería de procesadores. Google Cloud

      Procesador Galería

    2. En la galería de procesadores, busca Analizador de formularios y selecciona Crear.

      Opción Analizador de formularios en la interfaz de usuario

    3. En la ventana lateral, introduce un nombre de procesador, como quickstart-form-processor.

    4. Selecciona la región más cercana.

    5. Haz clic en el botón Crear.

    Se te redirigirá a la página Detalles del procesador del nuevo procesador de análisis de formularios.

    Procesador de prueba

    Una vez que hayas creado el procesador, podrás enviarle solicitudes de anotación.

    1. Descarga el documento de muestra.

      Se trata de un archivo PDF que contiene un ejemplo de formulario médico manuscrito. Este documento está almacenado en un segmento de Cloud Storage de acceso público.

    2. Haz clic en el botón Subir documento de prueba y selecciona el documento que acabas de descargar.

    3. Ahora debería estar en la página Análisis del analizador de formularios. Puedes ver el texto detectado por el OCR, los pares clave-valor, las tablas y las entidades genéricas extraídas del documento.

      Pares clave-valor de formulario de muestra en la interfaz de usuario Formulario de ejemplo de entidades genéricas en la interfaz de usuario

    Limpieza

    Para evitar cargos innecesarios de Google Cloud , usa el Google Cloud console para eliminar tu procesador y tu proyecto si no los necesitas.

    Siguientes pasos