资源:Chunk
块会捕获以块模式推荐或搜索的项的所有原始元数据信息。
| JSON 表示法 |
|---|
{ "name": string, "id": string, "content": string, "documentMetadata": { object ( |
| 字段 | |
|---|---|
name |
块的完整资源名称。格式: 此字段必须是采用 UTF-8 编码的字符串,长度限制为 1024 个字符。 |
id |
当前块的唯一块 ID。 |
content |
内容是文档中的字符串(已解析的内容)。 |
documentMetadata |
当前块中相应文档的元数据。 |
derivedStructData |
仅限输出。此字段为 OUTPUT_ONLY。它包含不在原始输入文档中的派生数据。 |
pageSpan |
块的页面 span。 |
chunkMetadata |
仅限输出。当前块的元数据。 |
dataUrls[] |
仅限输出。当前块所含图片的图片数据网址。数据网址由四部分组成:前缀 (data:)、指示数据类型的 MIME 类型、可选的 base64 令牌(如果是非文本数据)和数据本身:data:[ |
annotationContents[] |
仅限输出。当前块所含注解的内容。 |
annotationMetadata[] |
仅限输出。注解元数据包含当前块中的结构化内容。 |
relevanceScore |
仅限输出。表示基于相似度的相关性得分。得分越高,表示块的相关性越高。得分在 [-1.0, 1.0] 范围内。仅会针对 |
DocumentMetadata
文档元数据包含当前块的文档信息。
| JSON 表示法 |
|---|
{ "uri": string, "title": string, "mimeType": string, "structData": { object } } |
| 字段 | |
|---|---|
uri |
文档的 URI。 |
title |
文档的标题。 |
mimeType |
文档的 MIME 类型。https://www.iana.org/assignments/media-types/media-types.xhtml。 |
structData |
数据表示形式。文档的结构化 JSON 数据。它应符合已注册的 |
PageSpan
块的页面 span。
| JSON 表示法 |
|---|
{ "pageStart": integer, "pageEnd": integer } |
| 字段 | |
|---|---|
pageStart |
块的起始页。 |
pageEnd |
块的结束页。 |
ChunkMetadata
当前块的元数据。此字段仅会针对 SearchService.Search API 进行填充。
| JSON 表示法 |
|---|
{ "previousChunks": [ { object ( |
| 字段 | |
|---|---|
previousChunks[] |
当前块之前的块。该数量由 |
nextChunks[] |
当前块的后续块。该数量由 |
AnnotationMetadata
注解元数据包含当前块中的结构化内容。
| JSON 表示法 |
|---|
{
"structuredContent": {
object ( |
| 字段 | |
|---|---|
structuredContent |
仅限输出。结构化内容信息。 |
imageId |
仅限输出。如果结构化内容基于图片,则系统会提供图片 ID。 |
StructuredContent
结构化内容信息。
| JSON 表示法 |
|---|
{
"structureType": enum ( |
| 字段 | |
|---|---|
structureType |
仅限输出。结构化内容的结构类型。 |
content |
仅限输出。结构化内容的内容。 |
StructureType
定义可提取的结构化内容的类型。
| 枚举 | |
|---|---|
STRUCTURE_TYPE_UNSPECIFIED |
默认值。 |
SHAREHOLDER_STRUCTURE |
股东结构。 |
SIGNATURE_STRUCTURE |
签名结构。 |
CHECKBOX_STRUCTURE |
复选框结构。 |
方法 |
|
|---|---|
|
获取 Document。 |
|
获取 Chunk 的列表。 |