Nesta página, mostramos como começar a usar as bibliotecas de cliente do Cloud para a API Document AI Toolbox. As bibliotecas de cliente facilitam o acesso a APIs do Google Cloud em uma linguagem com suporte. É possível usar as APIs Google Cloud diretamente fazendo solicitações brutas ao servidor, mas as bibliotecas de cliente oferecem simplificações que reduzem significativamente a quantidade de código que você precisa escrever.
Saiba mais sobre as bibliotecas de cliente do Cloud e as bibliotecas de cliente de APIs do Google mais antigas em Explicação sobre as bibliotecas de cliente.
Instale a biblioteca de cliente
Python
pip install --upgrade google-cloud-documentai-toolbox
Para mais informações, consulte Como configurar um ambiente de desenvolvimento em Python.
Configurar a autenticação
Para autenticar chamadas feitas às APIs Google Cloud , as bibliotecas de cliente oferecem suporte a Application Default Credentials (ADC). As bibliotecas procuram credenciais em um conjunto de locais definidos e as usam para autenticar solicitações à API. Com o ADC, é possível disponibilizar credenciais ao aplicativo em uma variedade de ambientes, como de desenvolvimento ou produção local, sem precisar modificar o código do aplicativo.Em ambientes de produção, a maneira como você configura o ADC depende do serviço e do contexto. Para mais informações, consulte Configurar o Application Default Credentials.
Para um ambiente de desenvolvimento local, é possível configurar o ADC com as credenciais associadas à sua Conta do Google:
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
Uma tela de login será exibida. Após o login, suas credenciais são armazenadas no arquivo de credenciais local usado pelo ADC.
Usar a biblioteca de cliente
A Document AI Toolbox é um SDK para Python que oferece funções de utilitário
para gerenciar, manipular e extrair informações da resposta do documento.
Ele cria um objeto de documento "encapsulado" a partir de uma resposta de documento processada de arquivos JSON no
Cloud Storage, arquivos JSON locais ou saída diretamente do método
process_document()
.
Ele pode realizar as seguintes ações:
- Combine arquivos JSON fragmentados
Document
do processamento em lote em um único documento "encapsulado". - Exporte os fragmentos como um
Document
unificado. -
Receba a saída de
Document
de: - Acesse o texto de
Pages
,Lines
,Paragraphs
,FormFields
eTables
sem processar informaçõesLayout
. - Pesquise um
Pages
que contenha uma string de destino ou que corresponda a uma expressão regular. - Pesquise
FormFields
pelo nome. - Pesquise
Entities
por tipo. - Converta
Tables
em um Dataframe ou CSV do Pandas. - Insira
Entities
eFormFields
em uma tabela do BigQuery. - Divida um arquivo PDF com base na saída de um processador de classificação/separação.
- Extraia a imagem
Entities
dasDocument
caixas delimitadoras. -
Converta
Documents
para e de formatos usados com frequência:- API Cloud Vision
AnnotateFileResponse
- hOCR
- Formatos de processamento de documentos de terceiros
- API Cloud Vision
- Crie lotes de documentos para processamento em uma pasta do Cloud Storage.
Exemplos de código
Os exemplos de código abaixo demonstram como usar a Document AI Toolbox.
Guia de início rápido
Tabelas
Exportação para o BigQuery
PDF dividido
Extração de imagem
Conversão de visão
Conversão de hOCR
Conversão de terceiros
Lotes de documentos
Mesclar fragmentos de documentos
Outros recursos
Python
Confira na lista a seguir os links para mais recursos relacionados à biblioteca de cliente para Python: