Se usó la API de Cloud Translation para traducir esta página.

Mecanismos de extracción personalizados

Puedes crear extractores personalizados que se adaptan específicamente a tus documentos, entrenados y evaluados con tus datos. Este procesador identifica y extrae entidades de tus documentos. Luego, puedes usarlo en documentos adicionales.

Antes de comenzar

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Document AI, Cloud Storage APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Document AI, Cloud Storage APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

Crea un procesador

En la Google Cloud consola, en la sección Document AI, ve a la página Workbench.

Workbench
En Extractor personalizado, selecciona Crear procesador.
En el menú Crear procesador, escribe un nombre para tu procesador, como my-custom-document-extractor.
Selecciona la región más cercana a ti.
Opcional: Abre Opciones avanzadas.
- Puedes optar por dejar que Google cree un bucket de Cloud Storage por ti o puedes crear el tuyo. En este instructivo, selecciona Almacenamiento administrado por Google.
- También tienes la opción de usar claves de encriptación administradas por el cliente (CMEK) o administradas por Google. En este instructivo, selecciona Google-managed encryption key.
Selecciona Crear para crear tu procesador.

Define los campos del procesador

Ahora te encuentras en la página Descripción general del procesador del procesador que acabas de crear.

Puedes especificar los campos que quieres que el procesador extraiga y comience a etiquetar documentos.

Selecciona la pestaña Comenzar. Aparecerá el menú Campos.
Selecciona Crear nuevo campo.
Ingresa el nombre en el campo. Selecciona el Tipo de datos y el Caso. Asigna a la etiqueta una Descripción explicativa y distinta. La descripción de la propiedad te permite proporcionar contexto, información y conocimientos previos adicionales para cada entidad para mejorar la precisión y el rendimiento de la extracción.

Selecciona Crear. Consulta Define el procesador del esquema para obtener instrucciones detalladas para crear y editar un esquema.

Crea cada una de las siguientes etiquetas para el esquema del procesador.

Nombre	Tipo de datos	Caso
`control_number`	Número	Opcional varias veces
`employees_social_security_number`	Número	Obligatoria varias veces
`employer_identification_number`	Número	Obligatoria varias veces
`employers_name_address_and_zip_code`	Dirección	Obligatoria varias veces
`federal_income_tax_withheld`	Dinero	Obligatoria varias veces
`social_security_tax_withheld`	Dinero	Obligatoria varias veces
`social_security_wages`	Dinero	Obligatoria varias veces
`wages_tips_other_compensation`	Dinero	Obligatoria varias veces

También puedes crear y usar otros tipos de etiquetas en el esquema del procesador, como casillas de verificación y entidades tabulares. Por ejemplo, los formularios W-2 incluyen las casillas de verificación Empleado legal, Plan de jubilación y Pago por enfermedad de terceros, que también podrías agregar el esquema.

updated-cde-2.0-path-to-docai-4

Sube un documento de muestra

Realiza pruebas con un documento de muestra.

Selecciona Subir documento de muestra.
En la barra lateral, selecciona Importar documentos desde Cloud Storage.
Para este ejemplo, ingresa el nombre de este bucket en Ruta de origen. Esta vincula directamente a un documento.
```
cloud-samples-data/documentai/Custom/W2/PDF/W2_XL_input_clean_2950.pdf
```
Selecciona Importar.

Se te redireccionará a la consola de etiquetado.

Etiqueta un documento

El proceso de seleccionar texto en un documento y aplicar etiquetas se conoce como anotación o etiquetado.

Cuando estés en la consola de etiquetado, verás que muchas de las etiquetas ya se propagaron. Esto se debe a que el tipo de modelo de extractor personalizado predeterminado es un modelo de base, que puede realizar predicciones sin ejemplos, es decir, sin entrenamiento.

Nota: Es posible que los resultados se vean un poco diferentes a la imagen de muestra.
Para usar las etiquetas sugeridas, mantén el puntero sobre cada etiqueta en el panel lateral y selecciona la marca de verificación para confirmar que la etiqueta sea correcta. No edites el texto, incluso si el OCR lee el texto de forma incorrecta.
En este ejemplo, los valores en la parte inferior del documento no se identificaron automáticamente, por lo que deberás etiquetarlos de forma manual.
Usa los íconos de la barra de herramientas que se encuentran sobre el documento para etiquetar. De forma predeterminada, usa la herramienta Cuadro delimitador o la herramienta Seleccionar texto para valores de varias líneas para seleccionar el contenido y aplicarle la etiqueta.

Nota: La herramienta Seleccionar texto no funciona con todos los valores de texto, por lo que debes usar el cuadro delimitador si corresponde. También puedes seleccionar campos que no sean de texto, como casillas de verificación, con la herramienta Cuadro delimitador.
Después de seleccionar el texto, aparecerá un menú desplegable con todos los campos definidos (entidades) para que selecciones uno. En este ejemplo, se seleccionó el valor de wages_tips_other_compensation con la herramienta de cuadro delimitador y se aplicó esa etiqueta.
Revisa los valores de texto detectados con el objetivo de asegurarte de que reflejen la ubicación correcta del texto para cada campo. El documento W2 etiquetado debería verse de la siguiente manera cuando se complete:

Nota: Si etiquetamos con fines de revisión de producción, se debería editar el OCR incorrecto.
Si es necesario, puedes hacer clic en Crear campo nuevo para agregar un campo nuevo al esquema desde esta página.
Selecciona Marcar como etiquetado cuando termines de anotar el documento. Se te redireccionará a la pestaña Comenzar.

Compila la versión del procesador con el modelo de base

Después de etiquetar un solo documento, puedes crear una versión del procesador con el modelo de base previamente entrenado para extraer entidades.

Selecciona la pestaña Compilar.
En Modelo de base de llamadas, selecciona Crear versión nueva.
Ingresa un nombre para la versión del procesador, como w2-foundation-model.
Selecciona Crear versión. La creación tarda unos minutos.

Nota: Después de crear una versión del procesador, no puedes cambiar ni borrar los campos que creaste. Si ya no los necesitas, puedes inhabilitarlos en la página de campos.
Selecciona la pestaña Implementar y uso (opcional). En esta página, puedes ver las versiones de procesadores disponibles y el estado de implementación de la versión nueva.

Usa la IA generativa para etiquetar documentos automáticamente

El modelo de base puede extraer campos con exactitud para una variedad de tipos de documentos, pero también puedes proporcionar datos de entrenamiento adicionales para mejorar la precisión del modelo para estructuras de documentos específicas.

El extractor personalizado usa los nombres de etiquetas que definas y las anotaciones anteriores para que sea más rápido y fácil etiquetar documentos a gran escala con el etiquetado automático.

Ve a la página Compilar.
Selecciona Importar documentos.
En la barra lateral, selecciona Importar documentos desde Google Cloud Storage.
Escribe el nombre de este bucket que contenga tus documentos.
En la lista División de datos, selecciona División automática. Esto divide automáticamente los documentos para tener un 80% en el conjunto de entrenamiento y un 20% en el conjunto de prueba.
En la sección Etiquetado automático, selecciona la casilla de verificación Importar con etiquetado automático.
Selecciona la versión del procesador del modelo de base para etiquetar los documentos.
Selecciona Importar y espera a que los documentos se importen. Puedes salir de esta página y volver más tarde.
Debes verificar los documentos etiquetados automáticamente antes de poder usarlos para entrenamiento o pruebas. Selecciona Comenzar etiquetado para ver los documentos etiquetados automáticamente.
Para usar las etiquetas sugeridas, mantén el puntero sobre cada anotación y selecciona la marca de verificación para confirmar que la etiqueta sea correcta. Por fines de entrenamiento, no edites los valores si no coinciden con el texto del documento. Solo cambia el cuadro delimitador si se seleccionó el texto incorrecto.
Selecciona Marcar como etiquetado cuando termines de anotar el documento.
Repite el proceso para cada documento etiquetado automáticamente.

Importa documentos de entrenamiento etiquetados previamente

Ve a la página Compilar.
Selecciona Importar documentos.
En la barra lateral, selecciona Importar documentos desde Cloud Storage.
Escribe la ruta de acceso en Ruta de acceso del origen que contiene tus documentos. Este bucket debe contener documentos etiquetados previamente en formato Document JSON.
En la lista División de datos, selecciona División automática. Esto divide automáticamente los documentos para tener un 80% en el conjunto de entrenamiento y un 20% en el conjunto de prueba. Deje desmarcada la opción Importar con etiquetado automático.
Selecciona Importar. La importación tarda varios minutos.

Opcional: Visualiza y administra el conjunto de datos

En la página Compilar, puedes acceder a la consola de Administrar conjunto de datos para ver y editar todos los documentos y etiquetas del conjunto de datos.

Entrena un procesador basado en modelos personalizados

Dado que el entrenamiento puede tardar varias horas, asegúrese de haber configurado el procesador con los datos y las etiquetas correspondientes antes de comenzar el entrenamiento.

Para obtener información sobre los requisitos del conjunto de datos, en Entrenar un modelo personalizado, selecciona Crear versión nueva o Ver requisitos completos. Este no es un modelo de IA generativa. Se requieren al menos 10 instancias de entrenamiento y 10 instancias de prueba de cada campo para un procesador basado en modelos personalizados.
En el campo Nombre de la versión, escribe un nombre para esta versión del procesador, como w2-custom-model.
Opcional: selecciona Ver estadísticas de etiquetas para buscar información sobre las etiquetas de documentos. Esto puede ayudarte a determinar tu cobertura. Selecciona Cerrar para volver a la configuración de entrenamiento.
En Método de entrenamiento de modelos, selecciona Basado en modelos.
Selecciona Iniciar entrenamiento. El entrenamiento tarda unas horas en completarse. Puedes cerrar esta página y volver más tarde.
Selecciona la pestaña Implementar y uso (opcional). En esta página, puedes ver las versiones de procesadores disponibles y el estado de entrenamiento de la versión nueva.

Implementa la versión del procesador

Cuando se complete el entrenamiento, selecciona la pestaña Implementar y usar.
Selecciona la casilla de verificación a la izquierda de la versión que deseas implementar y selecciona Implementar.
Selecciona Implementar en la ventana de diálogo. La implementación tarda unos minutos.
Cuando se implementa la versión, puedes establecerla como la Versión predeterminada o puedes proporcionar el ID de la versión cuando proceses documentos con la API.

Evalúa y prueba el procesador

Selecciona la pestaña Evaluar para probar la versión del procesador. En esta página, puedes ver las métricas de evaluación, incluidas la puntuación F1, la precisión y recuperación del documento completo, y las etiquetas individuales. Para obtener más información sobre la evaluación y las estadísticas, consulta Evalúa el procesador.
Selecciona el selector Versión y selecciona la versión con el modelo de base.
Descarga un documento que no haya participado en pruebas ni entrenamientos anteriores para que puedas usarlo para evaluar la versión del procesador. Si usas tus propios datos, debes usar un documento que se reserve para ello.

Descargar PDF
Selecciona Subir documento de prueba y selecciona el documento que acabas de descargar. Se abrirá la página Análisis de extractores personalizados de documentos. El resultado de la pantalla muestra qué tan bien se extrajo el documento.
Vuelve a probar el documento usando la versión con un modelo entrenado de forma personalizada.

Usar el procesador

Creaste y entrenaste correctamente un procesador extractor personalizado.

Puedes administrar tus versiones de procesador con entrenamiento personalizado como cualquier otra versión de procesador. Para obtener más información, consulta Administra versiones de procesadores.

Para usar la API de Document AI, sigue estos pasos:

Sigue las muestras de código que aparecen en Cómo enviar una solicitud de procesamiento para usar el procesamiento en línea o por lotes.
- Consulta Cuotas y límites para conocer la cantidad de páginas admitidas para el procesamiento en línea y por lotes.
Sigue la muestra de código del extractor de documentos personalizado en Cómo controlar la respuesta de procesamiento para obtener las entidades extraídas del procesador.

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en esta página.

Para evitar cargos Google Cloud innecesarios, usa Google Cloud console para borrar el procesador y el proyecto si no los necesitas.

Si creaste un proyecto nuevo para aprender sobre Document AI y ya no lo necesitas, bórralo.

Si usaste un proyecto Google Cloud existente, borra los recursos que creaste para evitar que se generen cargos en tu cuenta.

En el menú de navegación de la Google Cloud consola, selecciona Document AI y, luego, Mis procesadores.
Selecciona Más accionesen la misma fila del procesador que quieres borrar.
Selecciona Borrar procesador, escribe el nombre del procesador y, luego, vuelve a seleccionar Borrar para confirmar.

¿Qué sigue?

Para obtener detalles, consulta las Guías.

Descripción general del extractor personalizado

Extracción basada en la personalización