En esta página, se muestra cómo comenzar a usar las bibliotecas cliente de Cloud para la API de Document AI Toolbox. Las bibliotecas cliente facilitan el acceso a las APIs deGoogle Cloud desde un lenguaje compatible. Si bien puedes usar las APIs deGoogle Cloud directamente mediante solicitudes sin procesar al servidor, las bibliotecas cliente proporcionan simplificaciones que reducen de manera significativa la cantidad de código que debes escribir.
Obtén más información sobre las bibliotecas cliente de Cloud y las bibliotecas cliente de las API de Google anteriores en Explicación de las bibliotecas cliente.
Instala la biblioteca cliente
Python
pip install --upgrade google-cloud-documentai-toolbox
Para obtener más información, consulta Configura un entorno de desarrollo de Python.
Configura la autenticación
Para autenticar las llamadas a las APIs de Google Cloud , las bibliotecas cliente admiten las credenciales predeterminadas de la aplicación (ADC). Las bibliotecas buscan credenciales en un conjunto de ubicaciones definidas y las usan para autenticar solicitudes a la API. Con ADC, puedes hacer que las credenciales estén disponibles para tu aplicación en una variedad de entornos, como el de desarrollo o producción local, sin necesidad de modificar el código de la aplicación.Para los entornos de producción, la forma en que configuras ADC depende del servicio y el contexto. Para obtener más información, consulta Configura credenciales predeterminadas de la aplicación.
Para un entorno de desarrollo local, puedes configurar ADC con las credenciales asociadas con tu cuenta de Google:
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
Aparecerá una pantalla de acceso. Después de acceder, tus credenciales se almacenan en el archivo de credenciales local que usa ADC.
Usa la biblioteca cliente
Document AI Toolbox es un SDK para Python que proporciona funciones de utilidad para administrar, manipular y extraer información de la respuesta del documento.
Crea un objeto de documento "unido" a partir de una respuesta de documento procesada de archivos JSON en
Cloud Storage, archivos JSON locales o salida directamente del método process_document()
.
Puede realizar las siguientes acciones:
- Combina los archivos JSON
Document
fragmentados del procesamiento por lotes en un solo documento "unido". - Exporta fragmentos como un
Document
unificado. -
Obtén el resultado de
Document
de las siguientes fuentes: - Accede al texto de
Pages
,Lines
,Paragraphs
,FormFields
yTables
sin controlar la información deLayout
. - Busca un
Pages
que contenga una cadena objetivo o que coincida con una expresión regular. - Busca
FormFields
por nombre. - Busca
Entities
por tipo. - Convierte
Tables
en un DataFrame o CSV de Pandas. - Inserta
Entities
yFormFields
en una tabla de BigQuery. - Divide un archivo PDF según el resultado de un procesador de divisor o clasificador.
- Extrae la imagen
Entities
de los cuadros de límiteDocument
. -
Convierte
Documents
a formatos de uso general y viceversa:- API de Cloud Vision
AnnotateFileResponse
- hOCR
- Formatos de procesamiento de documentos de terceros
- API de Cloud Vision
- Crea lotes de documentos para procesarlos desde una carpeta de Cloud Storage.
Muestras de código
En las siguientes muestras de código, se muestra cómo usar Document AI Toolbox.
Guía de inicio rápido
Tablas
Exportación a BigQuery
División de PDF
Extracción de imágenes
Conversión de visión
Conversión a hOCR
Conversión de terceros
Lotes de documentos
Combina fragmentos de documentos
Recursos adicionales
Python
La siguiente lista contiene vínculos a más recursos relacionados con la biblioteca cliente para Python: