OCR(光学式文字認識)

世界トップクラスの Google Cloud AI による OCR(光学式文字認識)

画像やドキュメントからテキストやデータを抽出し、非構造化コンテンツをビジネスにすぐに使える構造化データに変換し、価値ある分析情報を引き出します。

OCR 機能を API でアプリケーションに統合します。

新規のお客様には、ドキュメント要約 OCR ソリューションへのお申込みに使用できる無料クレジット$300 分を、登録時に差し上げます。

概要

OCR とは何ですか。

光学式文字認識(OCR)は、入力、手書き、印刷されたテキストを画像からマシンでエンコードされたテキストに変換する基本的な技術です。

Google Cloud が提供する OCR はどのような種類ですか。

Google Cloud には、ドキュメントの OCR と、画像と動画の OCR という 2 種類の OCR があります。

Document AI は基本的なテクノロジーを共有していますが、ドキュメント処理向けに最適化されたドキュメント理解プラットフォームです。そのカスタム エクストラクタは生成 AI を活用 しており、専用プロセッサを選択する必要なく、汎用ドキュメントとドメイン固有ドキュメントの両方を高精度かつ迅速に処理します。

Cloud Vision は、画像や動画からテキスト、手書き文字、さまざまなオブジェクトを検出するために広く使用されています。

Google Cloud での OCR の仕組みは。

Google Cloud は最高水準の AI で OCR を強化します。データを理解、整理、拡充することで、従来のテキスト認識にとどまらず、最終的にはビジネスですぐに使える分析情報を生成します。

OCR ツールを統合スイートとして使用して合理化された効率を実現することも(Document AI など)、Google Cloud コンソールで直接利用可能な関連 API を呼び出すだけで OCR 機能をアプリケーションに統合することもできる柔軟性が得られます。

Google Cloud AI と OCR の連携の仕組みは。

上記のすべての OCR ソリューションでは、事前トレーニング済みの ML モデルを利用できます。このモデルは、API を介して直ちにデプロイすることも、特定のニーズに対する精度を高めるためにアップトレーニングすることもできます。

AutoML では独自のカスタムモデルをトレーニングすることもできます。機械学習の専門知識は必要ありません。

カスタム ML モデルの構築については AutoML のドキュメントをご覧ください。

最適な OCR ソリューションは。

ドキュメントを分析する場合や、自動化されたドキュメント処理パイプラインを構築する場合は、Document AI を使用します。これは、ドキュメントの理解から、ドキュメントと抽出されたデータの検索、保存、運営、管理まで、ワークフロー全体をすべて 1 か所で処理します。

画像を分析して処理する場合は、最良の結果を得るために Cloud Vision と他の Google Cloud プロダクトを併用します。詳細とクイックスタート ガイドについては、一般的な使用方法のセクションを参照してください。

どちらの API も Google Cloud アカウントで無料で試用できます

OCR サービスの比較

OCR サービス最適な用途主な機能

低レイテンシと大容量を必要とする一般的なテキスト抽出のユースケース。

画像のラベル付け、顔検出、ランドマーク検出、OCR、セーフサーチなどの事前構築済み機能。

Enterprise Document OCR

ドキュメント(PDF、画像としてスキャンしたドキュメント、Microsoft DocX ファイル)のテキストをデジタル化します。

200 以上の言語(50 の手書き言語)でテキストを抽出します。

数式やスタイルなどを認識するためのアドオン。



Document AI Workbench

生成 AI(基盤モデル)であらゆるドキュメントを抽出、分類、分割します

カスタム エクストラクタ: 基盤モデルを使用して、データの大規模なラベル付けやトレーニングなしでパーサーをすばやく作成します。

処理を効率化するカスタム分類とドキュメント スプリッター。

事前トレーニング済みモデル

ドメイン固有のドキュメントからのテキストとフィールドの抽出。

調達融資身分証明書契約書など、さまざまなドキュメントにわたるテキストの抽出とデジタル化。

最適な用途

主な機能

低レイテンシと大容量を必要とする一般的なテキスト抽出のユースケース。

画像のラベル付け、顔検出、ランドマーク検出、OCR、セーフサーチなどの事前構築済み機能。

最適な用途

Enterprise Document OCR

主な機能

ドキュメント(PDF、画像としてスキャンしたドキュメント、Microsoft DocX ファイル)のテキストをデジタル化します。

200 以上の言語(50 の手書き言語)でテキストを抽出します。

数式やスタイルなどを認識するためのアドオン。



最適な用途

Document AI Workbench

主な機能

生成 AI(基盤モデル)であらゆるドキュメントを抽出、分類、分割します

カスタム エクストラクタ: 基盤モデルを使用して、データの大規模なラベル付けやトレーニングなしでパーサーをすばやく作成します。

処理を効率化するカスタム分類とドキュメント スプリッター。

最適な用途

事前トレーニング済みモデル

主な機能

ドメイン固有のドキュメントからのテキストとフィールドの抽出。

調達融資身分証明書契約書など、さまざまなドキュメントにわたるテキストの抽出とデジタル化。

仕組み

ドキュメントを理解して処理するには、Document AI を使用します。

画像には Cloud Vision を使用することをおすすめします

いずれを使用する場合も、API を介してそのままデプロイすることも、アップトレーニングすることもできる、事前トレーニング済みの機械学習モデルにアクセスできます。AutoML を使用して、独自のカスタムモデルをゼロからトレーニングすることもできます。ML の専門知識は必要ありません。

Cloud Vision または Document OCR を使用すると、毎月最初の 1,000 ユニットが無料になります。シンプルな API 呼び出しでお試しください。

クラウド プロダクトの連携を示す画像
Cloud Vision が画像を認識して分類する仕組み

デモ

ご自身のドキュメントを使用して Document OCR をご覧ください

簡単なドラッグ&ドロップで Document AI API を試してみましょう。

一般的な使用例

生成 AI を使用してドキュメントからテキストを抽出します

Document AI で微妙なニュアンスを含むドキュメントから分析情報を引き出す

基盤モデルを活用した Document AI カスタム エクストラクタは、汎用的および分野固有のドキュメントからテキストとデータを迅速かつ正確に抽出します。わずか 5~10 個のドキュメントで簡単に微調整できるため、パフォーマンスがさらに向上します。

独自のモデルをトレーニングする場合は、基盤モデルを使用してデータセットに自動的にラベル付けを行い、本番環境への移行までの時間を短縮します。

事前トレーニング済みの専用プロセッサを使用することもできます。詳しくは、プロセッサの一覧をご覧ください。


Document AI API をデプロイする

Document AI で微妙なニュアンスを含むドキュメントから分析情報を引き出す

基盤モデルを活用した Document AI カスタム エクストラクタは、汎用的および分野固有のドキュメントからテキストとデータを迅速かつ正確に抽出します。わずか 5~10 個のドキュメントで簡単に微調整できるため、パフォーマンスがさらに向上します。

独自のモデルをトレーニングする場合は、基盤モデルを使用してデータセットに自動的にラベル付けを行い、本番環境への移行までの時間を短縮します。

事前トレーニング済みの専用プロセッサを使用することもできます。詳しくは、プロセッサの一覧をご覧ください。


Document AI API をデプロイする

エンドツーエンドのドキュメント ソリューションを構築します

パイプラインを処理および理解するドキュメントを構築します

生成 AI を搭載した Document AI は、さまざまなレイアウトや品質のドキュメントから高い精度でデータを抽出します。Cloud Storage と接続すれば、非構造化ドキュメントにエンタープライズ クラスのコンプライアンスを確保できます。BigQuery を使用すると、抽出したデータのバッチ処理と分析を自由に行うことができます。Looker を使用すると、BigQuery テーブルに基づいて簡単に可視化できます。Vertex AI Search を使用すると、会話形式または従来の方法で、Cloud Storage 内のドキュメントに対してクエリを実行し、検索できます。

Document AI API をデプロイする
複数の Google Cloud プロダクトを使用した、エンドツーエンドのドキュメント ソリューションのリファレンス アーキテクチャ

ご覧のようにパイプライン全体の設定には 60~90 分かかり、Document AI の部分には 10 分かかります。

パイプラインを処理および理解するドキュメントを構築します

生成 AI を搭載した Document AI は、さまざまなレイアウトや品質のドキュメントから高い精度でデータを抽出します。Cloud Storage と接続すれば、非構造化ドキュメントにエンタープライズ クラスのコンプライアンスを確保できます。BigQuery を使用すると、抽出したデータのバッチ処理と分析を自由に行うことができます。Looker を使用すると、BigQuery テーブルに基づいて簡単に可視化できます。Vertex AI Search を使用すると、会話形式または従来の方法で、Cloud Storage 内のドキュメントに対してクエリを実行し、検索できます。

Document AI API をデプロイする
複数の Google Cloud プロダクトを使用した、エンドツーエンドのドキュメント ソリューションのリファレンス アーキテクチャ

ご覧のようにパイプライン全体の設定には 60~90 分かかり、Document AI の部分には 10 分かかります。

画像からテキストを抽出する

Cloud Vision API を使用して画像からテキストを抽出する

Cloud Vision API を使用すると、さまざまな言語の画像からテキストや手書き文字を検出して抽出できます。また、マルチリージョンをサポートしており、大陸レベルのデータ ストレージや OCR 処理を指定できます。

少数の画像(リクエストごとに最大 16 件)を選択してすぐに結果を取得するか、多数の画像(リクエストごとに最大 2,000 件)を非同期でバッチ処理して後で結果を取得するかを選択できます。

Cloud Vision API をデプロイする
Cloud Vision API リファレンス アーキテクチャ

Cloud Vision API を使用して画像からテキストを抽出する

Cloud Vision API を使用すると、さまざまな言語の画像からテキストや手書き文字を検出して抽出できます。また、マルチリージョンをサポートしており、大陸レベルのデータ ストレージや OCR 処理を指定できます。

少数の画像(リクエストごとに最大 16 件)を選択してすぐに結果を取得するか、多数の画像(リクエストごとに最大 2,000 件)を非同期でバッチ処理して後で結果を取得するかを選択できます。

Cloud Vision API をデプロイする
Cloud Vision API リファレンス アーキテクチャ

料金の例

右側に示されている画像からテキストを抽出する基本的な処理パイプラインを実行する場合、月額費用$27.36 になります。

この数値に到達するまでの想定使用量は、料金計算ツールで確認できます。

毎月最初の 1,000 ユニットは無料です。

より複雑な設定については、Google までお問い合わせください
イメージ プロセス

    料金

    ユースケースの費用はいくらですか。ユースケースを解決するための月額費用を把握し、必要なプロダクトと主な利用条件を提示します。
    使用例使用するプロダクト利用条件推定月額費用(米ドル)
    画像のタグ付け、処理、検索

    Cloud Vision

    Cloud Storage

    Pub/Sub

    Cloud Run

    1. 毎月 15,000 回の Cloud Vision ラベル検出 API 呼び出し

    2. 100 GiB の月間保存容量

    3. 1.25 GiB CPU 1 個

    4. Pub/Sub を介して毎日 4 GiB をパブリッシュする

    電卓で計算の詳細を表示する

    $27.36

    ドキュメントからテキストと分析情報を抽出する

    Document AI

    Cloud Storage

    BigQuery

    Cloud Functions

    1. Document AI のフォーム パーサー API 呼び出しが毎月 1,000 回

    2. 100 GiB の月間保存容量

    3. 1 TiB の月次クエリ

    4. RAM: 512 MB、CPU: 800 MHz

    電卓で計算の詳細を表示する

    $71.87

    画像からテキストを抽出する

    Cloud Vision

    Cloud Storage

    Pub/Sub

    Cloud Run

    1. Cloud Vision OCR の API 呼び出しが毎月 15,000 回

    2. 100 GiB の月間保存容量

    3. 1.25 GiB CPU 1 個

    4. Pub/Sub を介して毎日 4 GiB をパブリッシュする

    電卓で計算の詳細を表示する

    $27.36

    Document AIVision APIAutoML の単価の詳細を確認します。

    ユースケースの費用はいくらですか。

    ユースケースを解決するための月額費用を把握し、必要なプロダクトと主な利用条件を提示します。

    画像のタグ付け、処理、検索
    使用するプロダクト

    Cloud Vision

    Cloud Storage

    Pub/Sub

    Cloud Run

    利用条件

    1. 毎月 15,000 回の Cloud Vision ラベル検出 API 呼び出し

    2. 100 GiB の月間保存容量

    3. 1.25 GiB CPU 1 個

    4. Pub/Sub を介して毎日 4 GiB をパブリッシュする

    電卓で計算の詳細を表示する

    推定月額費用(米ドル)

    $27.36

    ドキュメントからテキストと分析情報を抽出する
    使用するプロダクト

    Document AI

    Cloud Storage

    BigQuery

    Cloud Functions

    利用条件

    1. Document AI のフォーム パーサー API 呼び出しが毎月 1,000 回

    2. 100 GiB の月間保存容量

    3. 1 TiB の月次クエリ

    4. RAM: 512 MB、CPU: 800 MHz

    電卓で計算の詳細を表示する

    推定月額費用(米ドル)

    $71.87

    画像からテキストを抽出する
    使用するプロダクト

    Cloud Vision

    Cloud Storage

    Pub/Sub

    Cloud Run

    利用条件

    1. Cloud Vision OCR の API 呼び出しが毎月 15,000 回

    2. 100 GiB の月間保存容量

    3. 1.25 GiB CPU 1 個

    4. Pub/Sub を介して毎日 4 GiB をパブリッシュする

    電卓で計算の詳細を表示する

    推定月額費用(米ドル)

    $27.36

    Document AIVision APIAutoML の単価の詳細を確認します。

    料金計算ツール

    必要なすべてのツールを 1 か所に集めて、プロジェクトの費用を見積もります。

    カスタム見積もり

    セールスチームにご相談いただき、組織固有のニーズに応じたカスタム見積もりを入手してください。

    概念実証を開始する

    新規のお客様には、Google Cloud プロダクトをお試しいただける無料クレジットを最大 $300 分差し上げます

    大規模なプロジェクトがある場合は、

    OCR ソリューションとユースケースのコードサンプルを見る

    Cloud Vision API でラベルを検出する方法を確認する

    Google AI でドキュメント処理パイプラインを自動化する方法を確認する

    Google Cloud
    • ‪English‬
    • ‪Deutsch‬
    • ‪Español‬
    • ‪Español (Latinoamérica)‬
    • ‪Français‬
    • ‪Indonesia‬
    • ‪Italiano‬
    • ‪Português (Brasil)‬
    • ‪简体中文‬
    • ‪繁體中文‬
    • ‪日本語‬
    • ‪한국어‬
    コンソール
    • Google Cloud プロダクト
    • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
    Google Cloud