このページでは、Document AI Toolbox API の Cloud クライアント ライブラリの使用を開始する方法について説明します。クライアント ライブラリを使用すると、サポートされている言語からGoogle Cloud API に簡単にアクセスできます。サーバーにリクエストを送信してGoogle Cloud API を直接利用することもできますが、クライアント ライブラリを使用すると、記述するコードの量を大幅に削減できます。
Cloud クライアント ライブラリと以前の Google API クライアント ライブラリの詳細については、クライアント ライブラリの説明をご覧ください。
クライアント ライブラリをインストールする
Python
pip install --upgrade google-cloud-documentai-toolbox
詳細については、Python 開発環境の設定をご覧ください。
認証を設定する
Google Cloud API の呼び出しを認証するために、クライアント ライブラリではアプリケーションのデフォルト認証情報(ADC)がサポートされています。このライブラリは、一連の定義済みロケーションの中から認証情報を探し、それらの認証情報を使用して API へのリクエストを認証します。ADC を使用すると、アプリケーション コードを変更することなく、ローカルでの開発や本番環境など、さまざまな環境のアプリケーションで認証情報を使用できるようになります。本番環境では、ADC の設定方法はサービスとコンテキストによって異なります。詳細については、アプリケーションのデフォルト認証情報を設定するをご覧ください。
ローカル開発環境では、Google アカウントに関連付けられている認証情報を使用して ADC を設定できます。
-
Install the Google Cloud CLI. After installation, initialize the Google Cloud CLI by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
ログイン画面が表示されます。ログインすると、 ADC で使用されるローカル認証情報ファイルに認証情報が保存されます。
クライアント ライブラリを使用する
Document AI Toolbox は、ドキュメント レスポンスの情報の管理、操作、抽出を行うユーティリティ関数を提供する Python 用の SDK です。Cloud Storage の JSON ファイル、ローカル JSON ファイル、または process_document()
メソッドから直接出力された処理済みドキュメント レスポンスから「ラップされた」ドキュメント オブジェクトを作成します。
次の操作を行うことができます。
- バッチ処理の断片化された
Document
JSON ファイルを 1 つの「ラップされた」ドキュメントに結合します。 - シャードを統合された
Document
としてエクスポートします。 -
次のコマンドから
Document
出力を取得します。 Layout
情報を処理せずに、Pages
、Lines
、Paragraphs
、FormFields
、Tables
からテキストにアクセスします。- ターゲット文字列を含むか、正規表現に一致する
Pages
を検索します。 FormFields
を名前で検索します。- タイプ別に
Entities
を検索します。 Tables
を Pandas Dataframe または CSV に変換します。Entities
とFormFields
を BigQuery テーブルに挿入します。- Splitter/Classifier プロセッサの出力に基づいて PDF ファイルを分割します。
Document
境界ボックスから画像Entities
を抽出します。-
Documents
を一般的な形式に変換する、または一般的な形式から変換する:- Cloud Vision API
AnnotateFileResponse
- hOCR
- サードパーティのドキュメント処理形式
- Cloud Vision API
- Cloud Storage フォルダから処理するドキュメントのバッチを作成します。
コードサンプル
次のコードサンプルは、Document AI Toolbox の使用方法を示しています。
クイックスタート
テーブル
BigQuery Export
PDF 分割
画像抽出
ビジョン コンバージョン
hOCR 変換
サードパーティのコンバージョン
ドキュメント バッチ
ドキュメント シャードをマージする
参考情報
Python
次のリストは、Python のクライアント ライブラリに関連するその他のリソースへのリンクを示します。