使用生成式 AI 的自訂擷取器

衍生欄位和簽章偵測

公開測試版衍生欄位功能可讓 Document AI 客戶設定欄位,根據文件內容透過智慧型推論或生成方式填入資料,而非直接擷取文字。

這個版本也新增一項功能,可偵測文件中的簽名。您可以使用新的 signature 實體類型,為這類實體指定結構定義。簽名實體是根據文件中的視覺提示衍生而來。

自訂擷取器中的衍生欄位

自訂擷取器支援下列模型中的衍生欄位:

  • pretrained-foundation-model-v1.4-2025-02-05 正式發布(GA)
  • pretrained-foundation-model-v1.5-2025-05-05 預覽
  • pretrained-foundation-model-v1.5-pro-2025-06-20 預覽

在文件結構定義中建立或編輯標籤時,您可以在控制台 UI 中啟用這些功能。

衍生欄位是一項強大功能,可讓您從文件中擷取未明確寫出的資訊。您可以設定欄位,根據文件的整體脈絡,透過智慧推論或生成功能填入內容。這項功能不僅能擷取基本文字,還支援進階用途,例如:

  • 從地址推斷國家/地區。
  • 計算資料表中的項目總數。
  • 偵測身分證是否為「Real ID」。

建立結構定義的範例

以下範例說明如何為這類用途建立衍生欄位的結構定義,以及預期輸出內容 (使用美國駕照)。

  1. 建立結構定義元素時,請選取 Derived 方法。

    cde-signature-detection-derived-field-1

  2. 加入說明性標籤,提升成效。

    cde-signature-detection-derived-field-2

  3. 標記文件時,簽名等衍生欄位不需要設定邊界方塊。在「值」部分,選取「偵測到的值」

    cde-signature-detection-derived-field-3

  4. 對於簽章以外的衍生欄位,您可以輸入任何 Value 做為標記的一部分,以定義可能的輸出內容。

    cde-signature-detection-derived-field-4

預期輸出內容會與下列內容相似,其中簽章會以「Detected」或「""」的形式傳回,衍生欄位則會以文字形式傳回,做為標籤的說明提示要求。

cde-signature-detection-derived-field-5

擷取與衍生總覽

在處理器結構定義實體時,您可以選擇值填入方式。

  • 擷取:這是預設方法。如果實體的值應直接從文件文字中擷取,這項功能就派得上用場。系統會識別文字,並填入 textAnchorpageAnchor 等欄位,顯示文字位置。

  • 衍生:如果實體的值需要從文件內容推斷,則使用這個方法。由於文字中沒有直接顯示值,因此系統不會填入 textAnchorpageAnchor 欄位。

使用案例範例:尋找貨幣代碼

假設您需要找出文件中交易的貨幣代碼 (例如 USD、CAD、EUR)。

  • 何時使用 Extract:如果文件一律包含明確的貨幣符號或代碼 (例如「USD」或「€」),請使用 Extract 方法找出並擷取該確切文字。

  • 何時使用 Derived:如果文件使用模稜兩可的符號 (例如「$」,可能代表美元、加元、澳元等),或完全沒有符號,請使用 Derived 方法。模型會分析文件內容 (例如帳單地址或公司所在地),推斷正確的 ISO 4217 貨幣代碼。

設定最佳做法

如要讓衍生欄位發揮最佳效果,強烈建議您在標記期間,為結構定義中的屬性撰寫清楚的指示 description。這有助於引導模型執行衍生作業。

在貨幣代碼範例中,您可以建立名為 currency_code 的欄位,並提供下列說明:「使用文件中出現的內容相關信號 (例如貨幣符號和地址),找出文件中金額值的 ISO 4217 貨幣代碼。」

限制

衍生欄位是根據每個網頁產生。也就是說,如果使用案例需要多個網頁的資訊,則不完全支援。舉例來說,如果您設定衍生欄位來摘要文件,系統會為每個頁面分別產生摘要,而不是為整份文件產生連貫的摘要。這項限制適用於任何必須使用跨頁面資訊衍生值的欄位。

自訂擷取器中的簽章偵測

Document AI 的自訂擷取器支援自訂擷取器模型 pretrained-foundation-model-v1.4-2025-02-05pretrained-foundation-model-v1.5-2025-05-05 中的簽名偵測功能。在文件結構定義中建立或編輯標籤時,您可以在控制台 UI 中啟用這項功能。

簽名偵測功能可判斷文件中是否含有簽名。這項功能會分析視覺提示,而非擷取文字,藉此驗證簽名是否存在。

簽章偵測功能的運作方式

如要啟用這項功能,請在定義處理器結構定義時使用 signature 資料類型。處理器的行為取決於文件是否偵測到簽名。

如果找到簽名,擷取器會在回應中傳回簽名實體。 如果是名為 has_signed 的欄位,回應物件的結構如下:

"has_signed": {
  "mention_text": "Detected",
  "confidence": <confidence_score_between 0 to 1>,
  "normalized_value": {
    "text": "Detected",
    "signature_value": true
  }
}

如果找不到簽章,處理器的回應就不會傳回實體。

設定及滿足主要需求

如要設定簽名偵測功能,請按照下列步驟操作:

  1. 定義結構定義:在處理器結構定義中,為要偵測的簽章新增實體。
  2. 設定資料類型:為這個新實體選取「簽名」做為資料類型。
  3. 將方法設為衍生:資料類型為 signature 的實體只能使用 Derived 方法。由於模型會以視覺方式推斷簽名是否存在,因此不會擷取文字值。因此,簽章實體不會填入 textAnchorpageAnchor 等欄位。

用途範例

假設您正在處理合約,需要確認合約是否已簽署。您可以建立名為 is_contract_signed 的結構定義欄位,並將其資料類型設為 signature。處理已簽署的合約時,回應會包含 is_contract_signed 實體,確認簽名存在。如果沒有簽章,回應中就不會出現這個實體。方便您快速標記未簽署的文件以供審查。

後續步驟

瞭解如何進階訓練特殊處理器