Nesta página, mostramos como começar a usar as bibliotecas de cliente do Cloud para a API Document AI Toolbox. As bibliotecas de cliente facilitam o acesso a Google Cloud APIs em uma linguagem com suporte. É possível usar as APIsGoogle Cloud diretamente fazendo solicitações brutas ao servidor, mas as bibliotecas de cliente oferecem simplificações que reduzem significativamente a quantidade de código que você precisa escrever.
Saiba mais sobre as bibliotecas de cliente do Cloud e as bibliotecas de cliente de APIs do Google mais antigas em Explicação sobre as bibliotecas de cliente.
Instale a biblioteca de cliente
Python
pip install --upgrade google-cloud-documentai-toolbox
Para mais informações, consulte Como configurar um ambiente de desenvolvimento em Python.
Configurar a autenticação
Para autenticar chamadas para Google Cloud APIs, as bibliotecas de cliente oferecem suporte a Application Default Credentials (ADC). As bibliotecas procuram credenciais em um conjunto de locais definidos e as usam para autenticar solicitações à API. Com o ADC, é possível disponibilizar credenciais ao aplicativo em uma variedade de ambientes, como de desenvolvimento ou produção local, sem precisar modificar o código do aplicativo.Em ambientes de produção, a maneira como você configura o ADC depende do serviço e do contexto. Para mais informações, consulte Configurar o Application Default Credentials.
Para um ambiente de desenvolvimento local, é possível configurar o ADC com as credenciais associadas à sua Conta do Google:
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
Uma tela de login será exibida. Após o login, suas credenciais são armazenadas no arquivo de credenciais local usado pelo ADC.
Usar a biblioteca de cliente
A Document AI Toolbox é um SDK para Python que oferece funções de utilitário
para gerenciar, manipular e extrair informações da resposta do documento.
Ele cria um objeto de documento "encapsulado" a partir de uma resposta de documento processada de arquivos JSON no
Cloud Storage, arquivos JSON locais ou saída diretamente do método
process_document()
.
Ele pode realizar as seguintes ações:
- Combine arquivos JSON fragmentados
Document
do processamento em lote em um único documento "encapsulado". - Exporte os fragmentos como um
Document
unificado. -
Receba a saída
Document
de: - Acesse o texto de
Pages
,Lines
,Paragraphs
,FormFields
eTables
sem processar informaçõesLayout
. - Pesquise um
Pages
que contenha uma string de destino ou que corresponda a uma expressão regular. - Pesquise
FormFields
pelo nome. - Pesquise
Entities
por tipo. - Converta
Tables
em um Dataframe ou CSV do Pandas. - Insira
Entities
eFormFields
em uma tabela do BigQuery. - Divida um arquivo PDF com base na saída de um processador de classificação/separação.
- Extraia a imagem
Entities
dasDocument
caixas delimitadoras. -
Converta
Documents
para e de formatos usados com frequência:- API Cloud Vision
AnnotateFileResponse
- hOCR
- Formatos de processamento de documentos de terceiros
- API Cloud Vision
- Crie lotes de documentos para processamento em uma pasta do Cloud Storage.
Exemplos de código
Os exemplos de código abaixo demonstram como usar a Document AI Toolbox.
Guia de início rápido
Tabelas
BigQuery Export
PDF dividido
Extração de imagem
Conversão de visão
Conversão de hOCR
Conversão de terceiros
Lotes de documentos
Mesclar fragmentos de documentos
Outros recursos
Python
Confira na lista a seguir os links para mais recursos relacionados à biblioteca de cliente para Python: