資源:Chunk
區塊會擷取項目所有原始中繼資料資訊,以便在區塊模式中推薦或搜尋項目。
JSON 表示法 |
---|
{ "name": string, "id": string, "content": string, "documentMetadata": { object ( |
欄位 | |
---|---|
name |
區塊的完整資源名稱。格式: 這個欄位必須是 UTF-8 編碼的字串,長度上限為 1024 個字元。 |
id |
目前區塊的專屬區塊 ID。 |
content |
內容是文件中的字串 (已剖析的內容)。 |
documentMetadata |
目前區塊的文件中繼資料。 |
derivedStructData |
僅供輸出。這個欄位為 OUTPUT_ONLY。當中包含原始輸入文件中沒有的衍生資料。 |
pageSpan |
區塊的頁面範圍。 |
chunkMetadata |
僅供輸出。目前區塊的中繼資料。 |
dataUrls[] |
僅供輸出。如果目前的區塊包含圖片,則為圖片資料網址。資料 URL 由四個部分組成:前置字元 (data:)、指出資料類型的 MIME 類型、非文字資料的選用 base64 權杖,以及資料本身:data:[ |
annotationContents[] |
僅供輸出。如果目前的區塊包含註解,則為註解內容。 |
annotationMetadata[] |
僅供輸出。註解中繼資料包含目前區塊中的結構化內容。 |
relevanceScore |
僅供輸出。代表根據相似度計算出的關聯性分數。分數越高,表示區塊關聯性越高。分數範圍為 [-1.0, 1.0]。只會在 |
DocumentMetadata
文件的中繼資料包含目前區塊的文件資訊。
JSON 表示法 |
---|
{ "uri": string, "title": string, "mimeType": string, "structData": { object } } |
欄位 | |
---|---|
uri |
文件 URI。 |
title |
文件標題。 |
mimeType |
文件的 MIME 類型。https://www.iana.org/assignments/media-types/media-types.xhtml。 |
structData |
資料顯示。文件的結構化 JSON 資料。這項屬性應符合已註冊的 |
PageSpan
區塊的頁面範圍。
JSON 表示法 |
---|
{ "pageStart": integer, "pageEnd": integer } |
欄位 | |
---|---|
pageStart |
區塊的起始頁面。 |
pageEnd |
區塊的結尾頁面。 |
ChunkMetadata
目前區塊的中繼資料。這個欄位只會在 SearchService.Search
API 中填入。
JSON 表示法 |
---|
{ "previousChunks": [ { object ( |
欄位 | |
---|---|
previousChunks[] |
目前區塊的前幾個區塊。這項數字是由 |
nextChunks[] |
目前區塊的下一個區塊。這項數字是由 |
AnnotationMetadata
註解中繼資料包含目前區塊中的結構化內容。
JSON 表示法 |
---|
{
"structuredContent": {
object ( |
欄位 | |
---|---|
structuredContent |
僅供輸出。結構化內容資訊。 |
imageId |
僅供輸出。如果結構化內容是以圖片為基礎,系統會提供圖片 ID。 |
StructuredContent
結構化內容資訊。
JSON 表示法 |
---|
{
"structureType": enum ( |
欄位 | |
---|---|
structureType |
僅供輸出。結構化內容的結構類型。 |
content |
僅供輸出。結構化內容的內容。 |
StructureType
定義可擷取的結構化內容類型。
列舉 | |
---|---|
STRUCTURE_TYPE_UNSPECIFIED |
預設值。 |
SHAREHOLDER_STRUCTURE |
股東結構。 |
SIGNATURE_STRUCTURE |
簽章結構。 |
CHECKBOX_STRUCTURE |
核取方塊結構。 |
方法 |
|
---|---|
|
取得 Document 。 |
|
取得 Chunk 清單。 |