輕鬆擷取圖片和文件中的文字與資料、將非結構化內容轉換為符合企業需求的結構化資料,並取得寶貴的洞察資訊。
您可以透過 API 將 OCR 功能整合至應用程式。
新客戶註冊時可以獲得價值 $300 美元的免費抵免額,用於申請文件摘要製作 OCR 解決方案。
總覽
Google Cloud 提供兩種 OCR 解決方案,分別適用於文件和圖片/影片。
雖然兩者採用相同的基礎技術,但 Document AI 是經過最佳化調整的文件解讀平台,適合用來處理文件。Document AI 的 Custom Extractor 採用生成式 AI 技術,有了這項工具,不需要選用專用處理器,就能以更精確、更快的方式處理一般和特定領域的文件。
Cloud Vision 通常會用來偵測圖片和影片中的文字、手寫內容和各種物體。
Google Cloud 採用業界一流的 AI 技術來支援 OCR。這項解決方案不僅能識別傳統文字內容,還可以解讀、整理並充實資料,進而產生符合企業需求的洞察資訊。
您可自由選擇使用整合式 OCR 工具套件 (例如 Document AI),以簡便的方式提高效率,也可以直接在 Google Cloud 控制台中呼叫相關 API,將 OCR 功能整合至自家應用程式。
上述所有 OCR 解決方案都可讓您透過 API 立即部署預先訓練的機器學習模型,或是依據特定需求展開進階訓練,藉此提高準確度。
您還可以利用 AutoML 訓練專屬自訂模型,即使不具備機器學習專業知識也沒問題。
請參閱 AutoML 說明文件,瞭解如何建構自訂機器學習模型。
如果想分析文件或建立自動化文件處理管道,建議您使用 Document AI。這項解決方案會集中處理整個工作流程,從解讀文件到搜尋、儲存及控管文件與擷取的資料,都能輕鬆完成。
若要分析及處理圖片,則可搭配使用 Cloud Vision 與其他 Google Cloud 產品,這樣就能獲得最佳效果。如需詳細說明和快速入門導覽課程指南,請查看「常見用途」部分。
擁有 Google Cloud 帳戶的使用者皆可免費試用這兩個 API。
比較 OCR 產品
OCR 產品 | 適用情境 | 主要功能與特色 | |
---|---|---|---|
| 需要低延遲和高容量的一般文字擷取用途。 | 內建多項功能,例如為圖片加上標籤、偵測臉部和地標、OCR、安全搜尋。 | |
Enterprise Document OCR | 將文件 (PDF、掃描成圖片的文件或 Microsoft DocX 檔案) 中的文字數位化。 | 擷取超過 200 種語言和 50 種手寫語言的文字。 透過外掛程式辨識數學公式、樣式等等。 | |
| Document AI Workbench | 運用生成式 AI (基礎模型) 擷取、分類及分割各種文件 | 自訂擷取器:使用基礎模型快速建立剖析器,不需要執行大量的資料標籤或訓練作業。 處理效率極高的自訂分類器和文件分割器。 |
| 預先訓練的模型 | 擷取特定領域文件中的文字和欄位。 |
Enterprise Document OCR
將文件 (PDF、掃描成圖片的文件或 Microsoft DocX 檔案) 中的文字數位化。
擷取超過 200 種語言和 50 種手寫語言的文字。
透過外掛程式辨識數學公式、樣式等等。
Document AI Workbench
運用生成式 AI (基礎模型) 擷取、分類及分割各種文件
自訂擷取器:使用基礎模型快速建立剖析器,不需要執行大量的資料標籤或訓練作業。
處理效率極高的自訂分類器和文件分割器。
運作方式
如要解讀並處理文件,請使用 Document AI。
如為圖片,則建議使用 Cloud Vision。
兩者都能讓您透過 API 依原樣部署預先訓練的機器學習模型,或是展開進階訓練。您還可以利用 AutoML 訓練專屬自訂模型,即使不具備機器學習專業知識也沒問題。
只要透過簡單的的 API 呼叫,即可使用 Cloud Vision 或 Document OCR,每個月前 1,000 個單位免費。
示範
透過簡單的拖曳動作試用 Document AI API。
常見用途
Document AI Custom Extractor 採用基礎模型,能以更快、更準確的方式從文件中擷取出文字和資料 (無論是一般或特定領域的內容)。只要利用 5 到 10 份文件輕鬆微調,即可提高成效。
如要訓練自己的模型,請使用基礎模型為資料集自動加上標籤,藉此縮短導入實際工作環境的時間。
您也可以選擇使用預先訓練的專用處理器。如要查看完整的處理器清單,請按這裡。
Document AI Custom Extractor 採用基礎模型,能以更快、更準確的方式從文件中擷取出文字和資料 (無論是一般或特定領域的內容)。只要利用 5 到 10 份文件輕鬆微調,即可提高成效。
如要訓練自己的模型,請使用基礎模型為資料集自動加上標籤,藉此縮短導入實際工作環境的時間。
您也可以選擇使用預先訓練的專用處理器。如要查看完整的處理器清單,請按這裡。
Document AI 採用生成式 AI 技術,可從各種品質和採用不同版面配置的文件中以極為準確的方式擷取出資料。您可以將 Document AI 與 Cloud Storage 連結,讓非結構化文件達到企業級法規遵循要求。BigQuery 可讓您按照自己想要的方式,批次處理及分析擷取的資料。有了 Looker,您就能輕鬆根據 BigQuery 資料表建立圖表。Vertex AI Search 可讓您透過對話或傳統方式查詢及搜尋 Cloud Storage 中的文件。
設定整個管道 (如圖所示) 需要 60 至 90 分鐘的時間,而 Document AI 的部分則需要 10 分鐘。
Document AI 採用生成式 AI 技術,可從各種品質和採用不同版面配置的文件中以極為準確的方式擷取出資料。您可以將 Document AI 與 Cloud Storage 連結,讓非結構化文件達到企業級法規遵循要求。BigQuery 可讓您按照自己想要的方式,批次處理及分析擷取的資料。有了 Looker,您就能輕鬆根據 BigQuery 資料表建立圖表。Vertex AI Search 可讓您透過對話或傳統方式查詢及搜尋 Cloud Storage 中的文件。
設定整個管道 (如圖所示) 需要 60 至 90 分鐘的時間,而 Document AI 的部分則需要 10 分鐘。
圖片標記也稱為圖片標籤加註。
Cloud Vision API 可辨識圖片中的一般物體、地標、位置、標誌、活動、動物物種和產品等內容,並加上適當的標籤。系統使用偵測到的標籤來標記圖片後,就可以簡化並自動執行圖片的搜尋、處理和管理作業。
如要使用指定的自訂標籤,建議使用 Cloud AutoML 訓練自訂機器學習模型。
您可以前往 Cloud Marketplace 取得 OCR On-Prem 解決方案,在地端部署環境中使用 Google OCR 技術。
如果是使用基本的圖片處理管道來偵測標籤 (如右圖),月費為 $27.36 美元。
您可以透過 Pricing Calculator,查看根據這個金額做出的假設用量。
每個月前 1,000 個單位免費。
圖片標記也稱為圖片標籤加註。
Cloud Vision API 可辨識圖片中的一般物體、地標、位置、標誌、活動、動物物種和產品等內容,並加上適當的標籤。系統使用偵測到的標籤來標記圖片後,就可以簡化並自動執行圖片的搜尋、處理和管理作業。
如要使用指定的自訂標籤,建議使用 Cloud AutoML 訓練自訂機器學習模型。
您可以前往 Cloud Marketplace 取得 OCR On-Prem 解決方案,在地端部署環境中使用 Google OCR 技術。
如果是使用基本的圖片處理管道來偵測標籤 (如右圖),月費為 $27.36 美元。
您可以透過 Pricing Calculator,查看根據這個金額做出的假設用量。
每個月前 1,000 個單位免費。
您可以透過 Cloud Vision API,偵測並擷取圖片中不同語言的文字和手寫內容。另外,這項解決方案還提供多區域支援,可讓您指定洲際資料儲存空間和 OCR 處理作業。
您可選擇處理少量圖片 (每個要求最多 16 張),即時取得相關結果,也可以非同步批次處理大量圖片 (每個要求最多 2,000 張),並於稍後查看結果。
如果是使用基本的處理管道來擷取圖片中的文字(如右圖),月費為 $27.36 美元。
您可以透過 Pricing Calculator,查看根據這個金額做出的假設用量。
每個月前 1,000 個單位免費。
您可以透過 Cloud Vision API,偵測並擷取圖片中不同語言的文字和手寫內容。另外,這項解決方案還提供多區域支援,可讓您指定洲際資料儲存空間和 OCR 處理作業。
您可選擇處理少量圖片 (每個要求最多 16 張),即時取得相關結果,也可以非同步批次處理大量圖片 (每個要求最多 2,000 張),並於稍後查看結果。
如果是使用基本的處理管道來擷取圖片中的文字(如右圖),月費為 $27.36 美元。
您可以透過 Pricing Calculator,查看根據這個金額做出的假設用量。
每個月前 1,000 個單位免費。
定價
個別應用實例的費用 | 瞭解滿足特定應用實例所需的月費,並掌握必要產品和關鍵用量假設。 | ||
---|---|---|---|
用途 | 使用的產品 | 用量假設 | 預估每月費用 (美元) |
標記、處理和搜尋圖片 | Cloud Vision Cloud Storage Pub/Sub Cloud Run | 1. 每月呼叫 15,000 次 Cloud Vision 標籤偵測 API 2. 每月 100 GiB 的儲存空間 3. 一個 1.25 GiB CPU 4. 每天透過 Pub/Sub 發布 4 GiB 內容 | $27.36 美元 |
從文件中擷取文字和深入分析結果 | Document AI Cloud Storage BigQuery Cloud Functions | 1. 每月 1,000 次 Document AI 表單剖析器 API 呼叫 2. 每月 100 GiB 的儲存空間 3. 每月 1 TiB 的查詢量 4.RAM:512 MB,CPU:800 MHz | $71.87 美元 |
擷取圖片中的文字 | Cloud Vision Cloud Storage Pub/Sub Cloud Run | 1. 每月 15,000 次 Cloud Vision OCR API 呼叫 2. 每月 100 GiB 的儲存空間 3. 一個 1.25 GiB CPU 4. 每天透過 Pub/Sub 發布 4 GiB 內容 | $27.36 美元 |
歡迎參閱 Document AI、Vision API 和 AutoML 的完整單位定價詳細資料。
個別應用實例的費用
瞭解滿足特定應用實例所需的月費,並掌握必要產品和關鍵用量假設。
Cloud Vision
Cloud Storage
Pub/Sub
Cloud Run
1. 每月呼叫 15,000 次 Cloud Vision 標籤偵測 API
2. 每月 100 GiB 的儲存空間
3. 一個 1.25 GiB CPU
4. 每天透過 Pub/Sub 發布 4 GiB 內容
$27.36 美元
Document AI
Cloud Storage
BigQuery
Cloud Functions
1. 每月 1,000 次 Document AI 表單剖析器 API 呼叫
2. 每月 100 GiB 的儲存空間
3. 每月 1 TiB 的查詢量
4.RAM:512 MB,CPU:800 MHz
$71.87 美元
Cloud Vision
Cloud Storage
Pub/Sub
Cloud Run
1. 每月 15,000 次 Cloud Vision OCR API 呼叫
2. 每月 100 GiB 的儲存空間
3. 一個 1.25 GiB CPU
4. 每天透過 Pub/Sub 發布 4 GiB 內容
$27.36 美元
歡迎參閱 Document AI、Vision API 和 AutoML 的完整單位定價詳細資料。