Créer un outil de synthèse de documents dans la console Google Cloud

Vous pouvez créer un outil de synthèse à l'aide de Document AI pour résumer le contenu des documents. La sortie peut être personnalisée en fonction de la longueur et du format.

Voici un exemple de sortie JSON à partir de l'entité obtenue :

{
  "type": "summary",
  "mentionText": " Superconductivity is a phenomenon in which a material conducts
  electricity with no resistance. It was discovered in 1911 by Dutch physicist Heike
  Kamerlingh Onnes. In 1986, a new class of materials was discovered that can superconduct
  at much higher temperatures. These materials are called high-temperature superconductors.
  They have the potential to revolutionize the way we use electricity. However,
  high-temperature superconductors are still very expensive to produce. Scientists
  are working on ways to make them more affordable.",
  "normalizedValue": {
    "text": " Superconductivity is a phenomenon in which a material conducts
    electricity with no resistance. It was discovered in 1911 by Dutch physicist
    Heike Kamerlingh Onnes. In 1986, a new class of materials was discovered that
    can superconduct at much higher temperatures. These materials are called
    high-temperature superconductors. They have the potential to revolutionize
    the way we use electricity. However, high-temperature superconductors are
    still very expensive to produce. Scientists are working on ways to make
    them more affordable."
  }
}

Procédure

Dans ce guide de démarrage rapide, vous allez créer un outil de synthèse de documents, importer un exemple de document à traiter, puis créer une version personnalisée de l'outil pour ajuster la structure des résumés.


Pour obtenir des instructions détaillées sur cette tâche directement dans la console Google Cloud, cliquez sur Visite guidée :

Visite guidée


Avant de commencer

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Document AI, Cloud Storage APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Document AI, Cloud Storage APIs.

    Enable the APIs

Créer un outil de synthèse

Utilisez la console Google Cloud pour créer un outil de synthèse. Pour en savoir plus, consultez la section Créer et gérer des outils de traitement.

  1. Dans la section Document AI de la console Google Cloud, accédez à la page Workbench.

    Workbench

  2. Dans Outil de synthèse, sélectionnez Créer un processeur. summarizer-1

  3. Dans le menu Créer un processeur, saisissez le nom de votre processeur (par exemple, quickstart-summarizer).

  4. Sélectionnez la région la plus proche de vous.

  5. Sélectionnez Créer.

Votre processeur a bien été créé.

Tester l'outil de traitement

Vous êtes sur la page de Présentation de l'outil de traitement de l'outil que vous venez de créer.

summarizer-2

  1. Sélectionnez l'onglet Personnaliser et créer pour tester l'outil de traitement.

    summarizer-3

  2. Télécharger un exemple de document

    Il s'agit d'un fichier PDF contenant la page Wikipédia sur la superconductivité.

  3. Sélectionnez Importer le document de test , puis sélectionnez le document que vous venez de télécharger.

  4. Vous êtes maintenant sur la page récapitulative. Vous pouvez afficher les synthèses de texte et de document détectées avec la reconnaissance optique des caractères.

    summarizer-4

  5. Réglez les paramètres Longueur et Format sur Modéré et À puces, puis sélectionnez Réécrire et observez les résultats.

  6. Revenez à la page Personnaliser et créer.

Déployer la version de l'outil de traitement

Si vous souhaitez utiliser des paramètres de synthèse spécifiques lors du traitement de documents avec l'API, créez une version de l'outil de traitement pour ces paramètres.

  1. Les paramètres de synthèse sont définis sur les dernières valeurs que vous avez utilisées sur la page précédente.

  2. Sélectionnez Créer une version pour créer une version de l'outil de traitement avec les paramètres de synthèse spécifiés.

  3. Attribuez un nom à la version de l'outil de traitement, par exemple quickstart-moderate-bulleted, puis sélectionnez Créer une version.

  4. Accédez à l'onglet Déployer et utiliser pour afficher l'état du déploiement. Le déploiement prend quelques minutes.

  5. Une fois la version déployée, vous pouvez la définir comme Version par défaut ou fournir l'ID de version lors du traitement des documents avec l'API.

  6. Pour utiliser l'API Document AI :

    • Suivez les exemples de code décrits dans la section Envoyer une requête de traitement pour utiliser le traitement en ligne et par lot.
      • Reportez-vous à la section Quotas et limites pour connaître le nombre de pages compatibles avec le traitement en ligne et par lot.
    • Suivez les exemples de code dans le guide Gérer la réponse de traitement pour obtenir la réponse synthétisée auprès de l'outil de traitement.

Vous avez utilisé Document AI pour extraire du texte d'un document et le résumer.

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page ne soient facturées sur votre compte Google Cloud , suivez les étapes ci-dessous.

Pour éviter que des frais liés à Google Cloud ne vous soient facturés inutilement, supprimez votre outil de traitement et votre projet à l'aide de la console Google Cloud si vous n'en avez plus besoin.

Étape suivante