Document AI 總覽

本文是使用 Document AI 的基本概念指南。在繼續瀏覽其他文件或快速入門導覽課程之前,建議您先詳閱這個頁面。

自動執行文件處理工作流程

世界各地的企業都非常依賴文件來儲存和傳達資訊。這類資訊通常需要數位化才能發揮效用。不過,這通常需要耗費大量時間的手動程序才能完成。

例如:

  • 將書籍數位化,方便在電子閱讀器上閱讀。
  • 在診所處理醫療攝取表單。
  • 剖析收據和發票,驗證費用報表。
  • 根據身分證件驗證身分。
  • 從稅務表單中擷取所得資訊,以核准貸款。
  • 瞭解主要業務協議條款的合約。

這些工作流程都包含從文件中取得原始文字,然後從中擷取與所需資料 (欄位或實體) 相符的特定文字。不過,每種文件類型都有不同的結構和版面配置,欄位模式也會因特定用途而異。

Document AI 元件

Document AI 是文件處理與解讀平台,可將文件中的非結構化資料轉為結構化資料 (特定欄位,適用於資料庫),讓您輕鬆瞭解、分析和使用資料。

Document AI 是以 Vertex AI 產品為基礎,並採用生成式 AI 技術,可協助您建立可擴充的端對端雲端文件處理應用程式,不必具備機器學習專業知識。

使用 Document AI,您可以:

  • 使用 OCR 技術將文件數位化,取得文字、版面配置和各種外掛程式,例如圖片品質偵測 (確保可讀性) 和自動校正傾斜。
  • 擷取文件檔案中的文字和版面配置資訊,並正規化實體。
  • 找出結構化表單和一般表格中的鍵/值組合 (kvp)。例如:Name: Jill Smith 是鍵值組。
  • 分類文件類型,以便執行擷取和儲存等下游程序。
  • 分割文件並依類型分類。例如包含多份真實文件的 PDF 檔案。
  • 準備資料集,以便使用自動標記、結構定義管理和資料集管理功能 (例如文件和預測結果審查) 進行微調和模型評估。
  • 與 Cloud Storage、BigQuery 和 Vertex AI Search 等產品整合,協助您儲存、搜尋、整理、管理及分析文件和中繼資料。

下圖說明 Document AI 支援的所有重要文件處理步驟,以及這些步驟之間的連結方式。

docai-overview-1

處理器

Document AI 處理器位於文件檔案和機器學習模型之間,可執行文件處理和解讀動作。可用於分類、分割、剖析或分析文件。

每個 Google Cloud 專案都需要建立自己的處理器執行個體。

處理器可分為下列幾類:

  • 數位化:OCR。
  • 擷取:自訂擷取器、表單剖析器、版面配置剖析器和預先訓練的剖析器。
  • 分類:自訂分類器和自訂分割器。

如要瞭解 Document AI 的所有可用處理器類型,請參閱完整處理器和詳細資料清單

我該使用哪種處理器?

如要決定特定應用程式要使用的處理器類型,請參考下列一般準則:

類別 用途 處理器類型
數位化 從文件中擷取文字和版面配置資訊。 Enterprise Document OCR
分析文件的掃描影像品質 (可讀性)。 啟用 影像品質分析 Enterprise Document OCR
從不符合自訂處理器條件的自訂文件中擷取實體。
擷取 從文件中的結構化表單擷取表格或鍵值對。 表單剖析器
從文件中擷取文字、表格和清單等元素,並傳回內容認知分塊。 版面配置剖析器
從符合自訂處理器條件的自訂文件中擷取實體。 建立自訂擷取工具
從特定類型的文件中擷取實體。 預先訓練的處理器 (進階訓練可提升品質)。
分類 將文件分類。 建立自訂分類器
分割文件。 建立自訂分割器

這張圖表有助於判斷哪種處理器最適合各個用途。

docai-overview-2

使用 Document AI 處理器

如要使用 Document AI 開始處理文件,主要步驟如下:

  1. 選擇適合用途的處理器

  2. 使用 Google Cloud 控制台或 Document AI API 建立處理器

    • Document AI 會建立預測端點,供您傳送文件。

    • 如需詳細操作說明,請參閱「建立處理器」一文。

  3. 訓練處理器:從頭開始使用訓練和測試資料訓練處理器,或根據現有處理器,對新的 (預先訓練) 處理器版本進行進階訓練。

  4. 傳送文件以供處理。