次のプロダクトは Document AI と機能を共有しています。ただし、これらのプロダクトは特定のテキストと分析機能を実行します。ユースケースによっては、これらのプロダクトが必要な機能を提供している場合があります。
画像をテキストに変換する
画像内のコンテンツをテキストに変換するには、次のいずれかを使用します。
- Enterprise Document OCR。
Cloud Vision API(
TEXT_DETECTION
またはDOCUMENT_TEXT_DETECTION
列挙型を使用)。参照:
視覚的なアーティファクトを検出する
AutoML Vision オブジェクト検出を使用して、画像の一部をテキスト ドキュメントに変換できます。詳しくは、画像データをご覧ください。
ドキュメントを分類する
ドキュメントの書式なしテキストと事前に実行した OCR を使用して、次のプロダクトを使用してドキュメントを分類してラベル付けできます。
- 事前トレーニング済みの Natural Language API を使用すると、一般的なカテゴリのリストを使用してコンテンツを分類できます。
- AutoML Natural Language 分類を使用してカスタム機械学習モデルを作成し、独自のカテゴリラベルでコンテンツを分類します。
例外はあるものの、AutoML Vision 分類はテキストベースの方法よりも精度が低い傾向があるため、ドキュメント分類には一般的におすすめしません。ただし、画像コンテンツの分類には使用できます。
- 通常、この方法はドキュメントの分類には推奨されません。テキストベースの方法よりも精度が低くなる傾向があるためです。ただし、例外もあります。
Natural Language API | |
AutoML Natural Language 分類 | |
AutoML Vision 分類 |
エンティティを分析して抽出する
ドキュメント内の既知のエンティティ(著名人、企業のブランディングなどの固有名詞)や、電話番号や住所などの一般的なパターンに従うエンティティは、Form パーサーまたはユースケースに応じた事前トレーニング済みプロセッサを使用して識別できます。
- Natural Language API を使用して、一般的な公開エンティティを識別することもできます。
- AutoML Natural Language プロダクトはエンティティ抽出用です。これらのエンティティを使用して、会社またはユースケースに固有のエンティティを特定するカスタム機械学習モデルを作成します。
Natural Language API | |
AutoML Natural Language Entity Extraction |
その他のサービス
これらの補完的なプロダクトを Document AI と統合して、完全なドキュメント処理と分析ソリューションを構築します。
- Vertex AI: AutoML と AI Platform を統合された API、クライアント ライブラリ、プラットフォームにまとめます。
- Cloud Translation API: 事前トレーニング済みモデルを使用して、数千もの言語ペア間でテキストを動的に翻訳します。PDF や DOCX などの形式のドキュメントを直接翻訳するための Document Translation API を提供します。ドキュメントを翻訳するをご覧ください。
- ワークフロー: Google Cloud サービスと API を組み合わせて、信頼性の高いアプリケーション、プロセス自動化、データ パイプラインと ML パイプラインを構築します。
- AppSheet Automation: オープン クラウドでカスタム自動化とアプリケーションを作成します。
- Google ドライブの Drive スキャナ: Android 版 Google ドライブ アプリでは、ドキュメントをスキャンして Google ドライブにアップロードできます。また、Document AI を活用したインテリジェントなタイトルの候補も提案されます。
- Google 翻訳: 単語、フレーズ、ウェブページを英語から 100 以上の他言語にすぐに翻訳できるサービスです。
パートナーを探す
拡大を続ける Google のパートナー エコシステムを活用して、ドキュメント分析ソリューションを作成、管理できます。パートナーと提供しているサービスの一覧については、Document AI パートナーをご覧ください。