从多个区域提取沿袭链接

以下伪代码概述了您可以使用 Data Lineage API 从所有可用区域提取数据沿袭链接的过程。

  1. 输入设置:
    • linksToFetch = 5(要从所有区域提取的链接的数量)
    • regionalPageToken = ""(用于分页的上次收到的区域页面令牌)
  2. 创建:
    1. 要扇出的所有区域的列表,名为 regions
    2. 无法访问的区域列表,名为 unreachable
    3. 发现的空链接列表,名为 foundLinks
    4. 空变量 nextPageTokennextRegionalPageToken
    5. 空变量 lastRegion
    6. 空变量 lastRegionLinksCount
  3. 按字母顺序排序 regions
  4. 解析 regionalPageToken
    1. 如果为空,请继续执行第 5 步
    2. 如果不为空,请执行以下操作:
      1. 通过按第一个点拆分为两个段来解析 regionalPageToken
      2. 通过仅获取解析后的 regionalPageToken 中第一个段之后的(按字母顺序)区域来过滤掉区域。
      3. 存储第二个段以便在所有 projects.locations.searchLinks 调用中使用。
  5. 并行调用 regions 列表中的每个区域的 projects.locations.searchLinks
  6. 等待所有请求完成。
  7. 过滤掉成功响应,并将失败的区域名称存储在 unreachable 列表中。
  8. 对于每个响应(从按字母顺序排列的第一个区域开始)
    1. 如果没有返回任何链接,但返回了非空页面令牌
      1. 将区域名称存储在 lastRegion 中。
      2. 将收到的 pageToken 保存到 nextPageToken 中。
      3. 忽略其余响应。
    2. 否则
      1. 将区域名称存储在 lastRegion 中。
      2. foundLinks 中保存收到的链接(最多 linksToFetch 个)。
      3. 将收到的 pageToken 保存到 nextPageToken 中。
      4. 将响应中已获取的链接数量存储在 lastRegionLinksCount 中。
      5. 如果 foundLinks 小于 linksToFetch
        1. 继续按字母顺序使用下一个收到的响应来编写伪代码。
      6. 如果 foundLinks 等于 linksToFetch
        1. 再次向同一区域中的 projects.locations.searchLinks 端点发出请求,但将 pageSize 参数设置为 lastRegionLinksCount 的值。
        2. 将收到的 pageToken 存储在 nextPageToken 中。
        3. 继续执行第 9 步
  9. nextPageToken 前面添加 lastRegion(即 [region].[receivedNextPageToken]),以创建 nextRegionalPageToken 来处理连续调用中的分页。