本文是使用 Document AI 的基本概念指南。在繼續瀏覽其他文件或快速入門導覽課程之前,建議您先詳閱這個頁面。
自動執行文件處理工作流程
世界各地的企業都非常依賴文件來儲存和傳達資訊。這類資訊通常需要數位化才能發揮效用。不過,這通常需要耗費大量時間的手動程序才能完成。
例如:
- 將書籍數位化,方便在電子閱讀器上閱讀。
- 在診所處理醫療攝取表單。
- 剖析收據和發票,驗證費用報表。
- 根據身分證件驗證身分。
- 從稅務表單中擷取所得資訊,以核准貸款。
- 瞭解主要業務協議條款的合約。
這些工作流程都包含從文件中取得原始文字,然後從中擷取與所需資料 (欄位或實體) 相符的特定文字。不過,每種文件類型都有不同的結構和版面配置,欄位模式也會因特定用途而異。
Document AI 元件
Document AI 是文件處理與解讀平台,可將文件中的非結構化資料轉為結構化資料 (特定欄位,適用於資料庫),讓您輕鬆瞭解、分析和使用資料。
Document AI 是以 Vertex AI 產品為基礎,並採用生成式 AI 技術,可協助您建立可擴充的端對端雲端文件處理應用程式,不必具備機器學習專業知識。
使用 Document AI,您可以:
- 使用 OCR 技術將文件數位化,取得文字、版面配置和各種外掛程式,例如圖片品質偵測 (確保可讀性) 和自動校正傾斜。
- 擷取文件檔案中的文字和版面配置資訊,並正規化實體。
- 找出結構化表單和一般表格中的鍵/值組合 (kvp)。例如:
Name: Jill Smith
是鍵值組。 - 分類文件類型,以便執行擷取和儲存等下游程序。
- 分割文件並依類型分類。例如包含多份真實文件的 PDF 檔案。
- 準備資料集,以便使用自動標記、結構定義管理和資料集管理功能 (例如文件和預測結果審查) 進行微調和模型評估。
- 與 Cloud Storage、BigQuery 和 Vertex AI Search 等產品整合,協助您儲存、搜尋、整理、管理及分析文件和中繼資料。
下圖說明 Document AI 支援的所有重要文件處理步驟,以及這些步驟之間的連結方式。
處理器
Document AI 處理器位於文件檔案和機器學習模型之間,可執行文件處理和解讀動作。可用於分類、分割、剖析或分析文件。
每個 Google Cloud 專案都需要建立自己的處理器執行個體。
處理器可分為下列幾類:
- 數位化:OCR。
- 擷取:自訂擷取器、表單剖析器、版面配置剖析器和預先訓練的剖析器。
- 分類:自訂分類器和自訂分割器。
如要瞭解 Document AI 的所有可用處理器類型,請參閱完整處理器和詳細資料清單。
我該使用哪種處理器?
如要決定特定應用程式要使用的處理器類型,請參考下列一般準則:
類別 | 用途 | 處理器類型 |
---|---|---|
數位化 | 從文件中擷取文字和版面配置資訊。 | Enterprise Document OCR |
分析文件的掃描影像品質 (可讀性)。 | 啟用 影像品質分析 的 Enterprise Document OCR | |
從不符合自訂處理器條件的自訂文件中擷取實體。 | ||
擷取 | 從文件中的結構化表單擷取表格或鍵值對。 | 表單剖析器 |
從文件中擷取文字、表格和清單等元素,並傳回內容認知分塊。 | 版面配置剖析器 | |
從符合自訂處理器條件的自訂文件中擷取實體。 | 建立自訂擷取工具 | |
從特定類型的文件中擷取實體。 | 預先訓練的處理器 (進階訓練可提升品質)。 | |
分類 | 將文件分類。 | 建立自訂分類器 |
分割文件。 | 建立自訂分割器 |
這張圖表有助於判斷哪種處理器最適合各個用途。
使用 Document AI 處理器
如要使用 Document AI 開始處理文件,主要步驟如下:
選擇適合用途的處理器。
- 如需各處理方的完整資訊,請參閱完整處理方與詳細資料清單。
使用 Google Cloud 控制台或 Document AI API 建立處理器。
Document AI 會建立預測端點,供您傳送文件。
如需詳細操作說明,請參閱「建立處理器」一文。
訓練處理器:從頭開始使用訓練和測試資料訓練處理器,或根據現有處理器,對新的 (預先訓練) 處理器版本進行進階訓練。
- 如需詳細操作說明,請參閱「訓練處理器」。
傳送文件以供處理。