このページは Cloud Translation API によって翻訳されました。

関連する Google Cloud プロダクト

次のプロダクトは、Document AI と機能を共有しています。ただし、これらのプロダクトは特定のテキストと分析の機能を実行します。ユースケースによっては、これらのプロダクトで必要な特定の機能を利用できる場合があります。

画像をテキストに変換する

画像内のコンテンツをテキストに変換するには、次のいずれかの方法を使用します。

AutoML Vision オブジェクト検出を使用すると、画像の一部をテキストドキュメントに変換できます。詳しくは、画像データをご覧ください。

ドキュメントの書式なしテキストと OCR を事前に実行することで、次のプロダクトを使用してドキュメントを分類し、ラベル付けできます。

事前トレーニング済みの Natural Language API を使用すると、カテゴリの一般化されたリストを使用してコンテンツを分類できます。
AutoML Natural Language 分類を使用してカスタム機械学習モデルを作成し、独自のカテゴリラベルでコンテンツを分類します。
例外がある場合もありますが、一般的に、AutoML Vision 分類はテキストベースの方法よりも精度が低くなる傾向があるため、ドキュメント分類にはおすすめしません。ただし、画像コンテンツの分類には使用できます。
- 一般的に、この方法はドキュメントの分類には推奨されません。精度がテキストベースの方法よりも低くなる傾向があるためです。ただし、例外もあります。

Natural Language API	Cloud Natural Language API クイックスタートコンテンツの分類
AutoML Natural Language 分類	テキストモデルのタイプ
AutoML Vision 分類	画像モデルタイプ

フォームパーサーまたはユースケースの事前トレーニング済みプロセッサのいずれかを使用して、ドキュメント内の既知のエンティティ（著名人、会社のブランディングなどの固有名詞）と、電話番号や住所などの一般的なパターンに従うエンティティを識別できます。

Natural Language API を使用して、一般的な公開エンティティを識別することもできます。
AutoML Natural Language プロダクトはエンティティ抽出用です。これらを使用して、会社やユースケースに固有のエンティティを識別するカスタム機械学習モデルを作成します。

Natural Language API	Natural Language API クイックスタートエンティティの分析
AutoML Natural Language Entity Extraction	テキストモデルのタイプ

これらの補完的なプロダクトを Document AI と統合して、完全なドキュメント処理と分析ソリューションを作成します。

Vertex AI: AutoML と AI Platform を統合された API、クライアントライブラリ、プラットフォームにまとめます。
Cloud Translation API: 事前トレーニング済みモデルを使用して、数千もの言語ペアでテキストを動的に翻訳します。PDF や DOCX などの形式のドキュメントを直接翻訳する Document Translation API を提供します。ドキュメントを翻訳するをご覧ください。
Workflows: Google Cloud サービスと API を組み合わせて、信頼性の高いアプリケーション、プロセス自動化、データパイプラインと機械学習パイプラインを構築します。
AppSheet Automation: オープンクラウドでカスタム自動化とアプリケーションを作成します。
Google ドライブのドライブスキャナ: Google ドライブの Android アプリでは、ドキュメントをスキャンして Google ドライブにアップロードできます。また、Document AI を活用したインテリジェントなタイトルの候補も表示されます。
Google 翻訳: 単語、フレーズ、ウェブページを英語から 100 以上の他言語にすぐに翻訳できるサービスです。

拡大を続ける Google のパートナーエコシステムを活用して、ドキュメント分析ソリューションの作成と管理を行いましょう。パートナーのリストと提供しているサービスについては、Document AI パートナーをご覧ください。