このページでは、Document AI Toolbox API の Cloud クライアント ライブラリの使用を開始する方法について説明します。クライアント ライブラリを使用すると、サポートされている言語からGoogle Cloud API に簡単にアクセスできます。サーバーにリクエストを送信してGoogle Cloud API を直接利用することもできますが、クライアント ライブラリを使用すると、記述するコードの量を大幅に削減できます。
Cloud クライアント ライブラリと以前の Google API クライアント ライブラリの詳細については、クライアント ライブラリの説明をご覧ください。
クライアント ライブラリをインストールする
Python
pip install --upgrade google-cloud-documentai-toolbox
詳細については、Python 開発環境の設定をご覧ください。
認証を設定する
Google Cloud API の呼び出しを認証するために、クライアント ライブラリではアプリケーションのデフォルト認証情報(ADC)がサポートされています。このライブラリは、一連の定義済みのロケーションの中から認証情報を探し、その認証情報を使用して API へのリクエストを認証します。ADC を使用すると、アプリケーション コードを変更することなく、ローカルでの開発や本番環境など、さまざまな環境のアプリケーションで認証情報を使用できるようになります。本番環境では、ADC の設定方法はサービスとコンテキストによって異なります。詳細については、アプリケーションのデフォルト認証情報を設定するをご覧ください。
ローカル開発環境では、Google アカウントに関連付けられている認証情報を使用して ADC を設定できます。
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
ログイン画面が表示されます。ログインすると、ADC で使用されるローカル認証情報ファイルに認証情報が保存されます。
クライアント ライブラリの使用
Document AI Toolbox は、ドキュメント レスポンスからの情報の管理、操作、抽出のためのユーティリティ関数を提供する Python 用 SDK です。Cloud Storage の JSON ファイル、ローカル JSON ファイル、または process_document()
メソッドから直接出力された処理済みドキュメント レスポンスから、「ラップされた」ドキュメント オブジェクトを作成します。
次の操作を行うことができます。
- バッチ処理から分割された
Document
JSON ファイルを 1 つの「ラップされた」ドキュメントに結合します。 - シャードを統合された
Document
としてエクスポートします。 -
次のコマンドから
Document
の出力を取得します。 Layout
情報を処理せずに、Pages
、Lines
、Paragraphs
、FormFields
、Tables
のテキストにアクセスします。- ターゲット文字列を含む、または正規表現に一致する
Pages
を検索します。 FormFields
を名前で検索します。- 種類で
Entities
を検索します。 Tables
を Pandas Dataframe または CSV に変換します。Entities
とFormFields
を BigQuery テーブルに挿入します。- Splitter/Classifier プロセッサの出力に基づいて PDF ファイルを分割します。
Document
の境界ボックスから画像Entities
を抽出します。-
Documents
を一般的な形式と相互に変換します。- Cloud Vision API
AnnotateFileResponse
- hOCR
- サードパーティのドキュメント処理形式
- Cloud Vision API
- Cloud Storage フォルダから処理するドキュメントのバッチを作成する。
コードサンプル
次のコードサンプルは、Document AI Toolbox の使用方法を示しています。
クイックスタート
テーブル
BigQuery Export
PDF 分割
画像抽出
ビジョン コンバージョン
hOCR 変換
サードパーティのコンバージョン
ドキュメントのバッチ
ドキュメント シャードを統合する
参考情報
Python
次のリストは、Python のクライアント ライブラリに関連するその他のリソースへのリンクを示します。