Crea una herramienta para resumir documentos en la Google Cloud consola

Puedes crear un procesador de resumen con Document AI para resumir el contenido de los documentos. El resultado se puede personalizar en función de la longitud y el formato.

A continuación, se muestra un ejemplo de salida JSON de la entidad resultante:

{
  "type": "summary",
  "mentionText": " Superconductivity is a phenomenon in which a material conducts
  electricity with no resistance. It was discovered in 1911 by Dutch physicist Heike
  Kamerlingh Onnes. In 1986, a new class of materials was discovered that can superconduct
  at much higher temperatures. These materials are called high-temperature superconductors.
  They have the potential to revolutionize the way we use electricity. However,
  high-temperature superconductors are still very expensive to produce. Scientists
  are working on ways to make them more affordable.",
  "normalizedValue": {
    "text": " Superconductivity is a phenomenon in which a material conducts
    electricity with no resistance. It was discovered in 1911 by Dutch physicist
    Heike Kamerlingh Onnes. In 1986, a new class of materials was discovered that
    can superconduct at much higher temperatures. These materials are called
    high-temperature superconductors. They have the potential to revolutionize
    the way we use electricity. However, high-temperature superconductors are
    still very expensive to produce. Scientists are working on ways to make
    them more affordable."
  }
}

Procedimiento

En esta guía de inicio rápido, crearás un procesador para resumir documentos, subirás un documento de ejemplo para procesarlo y crearás una versión personalizada del procesador para ajustar la estructura del resumen.


Para seguir las instrucciones paso a paso de esta tarea directamente en la Google Cloud consola, haga clic en Ayúdame:

Guíame


Antes de empezar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Document AI, Cloud Storage APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Document AI, Cloud Storage APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  8. Crear un procesador de resumen

    Usa la consola de Google Cloud para crear un procesador de resumen. Consulta más información sobre cómo crear y gestionar procesadores.

    1. En la Google Cloud consola, en la sección Document AI, ve a la página Workbench.

      Espacio de trabajo

    2. En Resumidor, selecciona Crear procesador. summarizer-1

    3. En el menú Crear procesador, escribe el nombre del procesador, como quickstart-summarizer.

    4. Selecciona la región más cercana.

    5. Selecciona Crear.

    Se ha creado tu procesador.

    Test Processor

    Te encuentras en la página Resumen del procesador del procesador que acabas de crear.

    summarizer-2

    1. Selecciona la pestaña Personalizar y crear para experimentar con el procesador.

      summarizer-3

    2. Descargar un documento de muestra

      Se trata de un archivo PDF que contiene la página de Wikipedia sobre la superconductividad.

    3. Selecciona Subir documento de prueba y elige el documento que acabas de descargar.

    4. Ahora estás en la página Resumen. Puedes ver el texto detectado por OCR y el resumen del documento.

      summarizer-4

    5. Ajusta la configuración de Longitud y formato a Moderado y Con viñetas, respectivamente. A continuación, selecciona Reescribir y observa los resultados.

    6. Vuelve a la página Personalizar y crear.

    Desplegar una versión de un procesador

    Si quieres usar ajustes de resumen específicos al procesar documentos con la API, crea una versión del procesador para esos ajustes.

    1. Los ajustes de resumen se definen con los últimos valores que usaste en la página anterior.

    2. Selecciona Crear nueva versión para crear una versión del procesador con los ajustes de resumen especificados.

    3. Escribe un nombre para la versión del procesador, como quickstart-moderate-bulleted, y selecciona Crear versión.

    4. Ve a la pestaña Implementar y usar para ver el estado de la implementación. El despliegue tarda unos minutos.

    5. Cuando se implementa la versión, puedes definirla como la versión predeterminada o proporcionar el ID de la versión al procesar documentos con la API.

    6. Para usar la API de Document AI, sigue estos pasos:

    Has usado Document AI para extraer texto de un documento y resumirlo.

    Limpieza

    Para evitar que se apliquen cargos en tu cuenta de Google Cloud por los recursos utilizados en esta página, sigue estos pasos.

    Para evitar cargos innecesarios de Google Cloud , usa la Google Cloud console para eliminar tu procesador y tu proyecto si no los necesitas.

    Siguientes pasos