衍生欄位和簽章偵測
公開測試版衍生欄位功能可讓 Document AI 客戶設定欄位,根據文件內容透過智慧型推論或生成方式填入資料,而非直接擷取文字。
這個版本也新增一項功能,可偵測文件中的簽名。您可以使用新的 signature
實體類型,為這類實體指定結構定義。簽名實體是根據文件中的視覺提示衍生而來。
自訂擷取器中的衍生欄位
自訂擷取器支援下列模型中的衍生欄位:
pretrained-foundation-model-v1.4-2025-02-05
正式發布(GA)pretrained-foundation-model-v1.5-2025-05-05
預覽pretrained-foundation-model-v1.5-pro-2025-06-20
預覽
在文件結構定義中建立或編輯標籤時,您可以在控制台 UI 中啟用這些功能。
衍生欄位是一項強大功能,可讓您從文件中擷取未明確寫出的資訊。您可以設定欄位,根據文件的整體脈絡,透過智慧推論或生成功能填入內容。這項功能不僅能擷取基本文字,還支援進階用途,例如:
- 從地址推斷國家/地區。
- 計算資料表中的項目總數。
- 偵測身分證是否為「Real ID」。
建立結構定義的範例
以下範例說明如何為這類用途建立衍生欄位的結構定義,以及預期輸出內容 (使用美國駕照)。
建立結構定義元素時,請選取
Derived
方法。加入說明性標籤,提升成效。
標記文件時,簽名等衍生欄位不需要設定邊界方塊。在「值」部分,選取「偵測到的值」。
對於簽章以外的衍生欄位,您可以輸入任何 Value 做為標記的一部分,以定義可能的輸出內容。
預期輸出內容會與下列內容相似,其中簽章會以「Detected」或「""」的形式傳回,衍生欄位則會以文字形式傳回,做為標籤的說明提示要求。
擷取與衍生總覽
在處理器結構定義實體時,您可以選擇值填入方式。
擷取:這是預設方法。如果實體的值應直接從文件文字中擷取,這項功能就派得上用場。系統會識別文字,並填入
textAnchor
和pageAnchor
等欄位,顯示文字位置。衍生:如果實體的值需要從文件內容推斷,則使用這個方法。由於文字中沒有直接顯示值,因此系統不會填入
textAnchor
和pageAnchor
欄位。
使用案例範例:尋找貨幣代碼
假設您需要找出文件中交易的貨幣代碼 (例如 USD、CAD、EUR)。
何時使用
Extract
:如果文件一律包含明確的貨幣符號或代碼 (例如「USD」或「€」),請使用Extract
方法找出並擷取該確切文字。何時使用
Derived
:如果文件使用模稜兩可的符號 (例如「$」,可能代表美元、加元、澳元等),或完全沒有符號,請使用Derived
方法。模型會分析文件內容 (例如帳單地址或公司所在地),推斷正確的 ISO 4217 貨幣代碼。
設定最佳做法
如要讓衍生欄位發揮最佳效果,強烈建議您在標記期間,為結構定義中的屬性撰寫清楚的指示 description
。這有助於引導模型執行衍生作業。
在貨幣代碼範例中,您可以建立名為 currency_code
的欄位,並提供下列說明:「使用文件中出現的內容相關信號 (例如貨幣符號和地址),找出文件中金額值的 ISO 4217 貨幣代碼。」
限制
衍生欄位是根據每個網頁產生。也就是說,如果使用案例需要多個網頁的資訊,則不完全支援。舉例來說,如果您設定衍生欄位來摘要文件,系統會為每個頁面分別產生摘要,而不是為整份文件產生連貫的摘要。這項限制適用於任何必須使用跨頁面資訊衍生值的欄位。
自訂擷取器中的簽章偵測
Document AI 的自訂擷取器支援自訂擷取器模型 pretrained-foundation-model-v1.4-2025-02-05
和 pretrained-foundation-model-v1.5-2025-05-05
中的簽名偵測功能。在文件結構定義中建立或編輯標籤時,您可以在控制台 UI 中啟用這項功能。
簽名偵測功能可判斷文件中是否含有簽名。這項功能會分析視覺提示,而非擷取文字,藉此驗證簽名是否存在。
簽章偵測功能的運作方式
如要啟用這項功能,請在定義處理器結構定義時使用 signature
資料類型。處理器的行為取決於文件是否偵測到簽名。
如果找到簽名,擷取器會在回應中傳回簽名實體。
如果是名為 has_signed
的欄位,回應物件的結構如下:
"has_signed": {
"mention_text": "Detected",
"confidence": <confidence_score_between 0 to 1>,
"normalized_value": {
"text": "Detected",
"signature_value": true
}
}
如果找不到簽章,處理器的回應就不會傳回實體。
設定及滿足主要需求
如要設定簽名偵測功能,請按照下列步驟操作:
- 定義結構定義:在處理器結構定義中,為要偵測的簽章新增實體。
- 設定資料類型:為這個新實體選取「簽名」做為資料類型。
- 將方法設為衍生:資料類型為
signature
的實體只能使用Derived
方法。由於模型會以視覺方式推斷簽名是否存在,因此不會擷取文字值。因此,簽章實體不會填入textAnchor
和pageAnchor
等欄位。
用途範例
假設您正在處理合約,需要確認合約是否已簽署。您可以建立名為 is_contract_signed
的結構定義欄位,並將其資料類型設為 signature
。處理已簽署的合約時,回應會包含 is_contract_signed
實體,確認簽名存在。如果沒有簽章,回應中就不會出現這個實體。方便您快速標記未簽署的文件以供審查。
後續步驟
瞭解如何進階訓練特殊處理器。