连接第三方数据源

本页介绍了如何将第三方数据源连接到 Vertex AI Search。

当您连接第三方数据源时,Vertex AI Search 会创建一个数据连接器,并为您指定的实体将数据存储区(称为实体数据存储区)与该连接器相关联。实体类型因您要连接的数据源而异。例如,Jira Cloud 实体包括问题、附件、评论和工作日志。

第三方数据源仅适用于一般搜索应用。聊天、推荐和客服应用无法使用第三方数据源。

第三方连接器不符合 CMEK 标准。

要改为从 Google 数据源导入数据,请参阅创建搜索数据 商店

准备工作

  1. 请与您的 Google 客户支持团队联系,请求将您添加到以下项目的许可名单中: 第三方数据源连接器。

  2. 转到您要使用的来源对应的部分:

连接 Confluence Cloud

按照以下步骤将数据从 Confluence Cloud 同步到 Vertex AI Search。

设置数据源并首次导入数据后,数据存储区 会按照您在设置期间选择的频率同步来自该来源的数据。

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。如需了解如何设置访问权限控制,请参阅使用数据源访问权限控制

  • 请准备好以下身份验证信息:

    • 实例网址。在表单中 https://EXAMPLE.atlassian.net - 例如, https://google.atlassian.net

    • 实例 ID。这是 cloudid,可前往 更改为 https://EXAMPLE.atlassian.net/_edge/tenant_info 并复制 cloudId 的值。

  • 启用 OAuth 2.0 并获取客户端 ID 和客户端密钥。

    使用 https://vertexaisearch.cloud.google.com/console/oauth/confluence_oauth.html 作为回调网址。有关如何为 Confluence 启用 OAuth 2.0 的信息 并获取客户端 ID 和客户端密钥,请参阅 OAuth 2.0 (3LO) 应用一文。

  • 设置 OAuth 2.0 权限范围时,请配置以下范围:

  • 为了正确应用用户权限,每位 Confluence Cloud 用户 必须向所有用户显示其电子邮件地址。为此, 更改 Confluence Cloud 中的电子邮件公开范围设置,以及 将可见性设为 Anyone。如需了解详情,请参阅 在以下位置设置您的电子邮件公开范围: Atlassian 文档。

控制台

如需使用 Google Cloud 控制台将数据从 Confluence Cloud 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击 Data Stores

  3. 点击新建数据存储区

  4. 选择数据源页面上,前往第三方来源部分,然后选择 Confluence

  5. 输入您的身份验证信息,然后点击身份验证

  6. 系统随即会打开一个新窗口。输入实例用户名和密码。 在返回到指定 数据存储区的 Confluence 来源页面。

  7. 选择要同步的实体,然后点击继续

  8. 为数据连接器选择一个区域。

  9. 为数据连接器输入名称。

  10. 选择同步频率。

  11. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  12. 如需查看数据注入状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看相关详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。注入完成后,状态将更改为 活跃:表示已设置与数据源的连接,并且 正在等待下一次预定的同步。

    根据数据的大小,数据注入可能需要花费数天时间 几分钟或几小时。

后续步骤

关联 Jira Cloud

按照以下步骤将数据从 Jira Cloud 同步到 Vertex AI Search。

设置数据源并首次导入数据后,您可以选择数据存储区与该来源的同步频率。

准备工作

在设置连接之前,请执行以下操作:

  • 设置访问权限控制。确保已针对数据源正确配置了访问权限控制。此步骤可确保只有获得授权的用户才能访问和管理数据。如需了解详情,请参阅使用数据源访问权限控制文档。
  • 为了正确应用用户权限,Jira Cloud 用户必须同意共享。
  • 确保您拥有 Atlassian 账号、Jira 实例和项目。
  • 验证您是否拥有 Jira 实例和项目的管理员访问权限。

在 Jira 中设置身份验证和权限

按照以下部分中的说明操作,确保您拥有对 Jira 实例的必要身份验证详细信息和管理员访问权限。通过 Atlassian Developer Console 创建客户端 ID 和客户端密钥,配置所需的 OAuth 2.0 范围,并为用户设置权限。最后,检索您的实例网址和 ID、配置角色并进行身份验证,以便在 Jira Cloud 与 Vertex AI Search 之间同步数据。

创建客户端 ID 和客户端密钥

注意:要启用 OAuth 2.0 并获取客户端 ID 和密钥,请参见 OAuth 2.0 (3LO) 应用一文。

  1. 登录 developer.atlassian.com
  2. 点击右上角的个人资料图标,然后选择开发者控制台
  3. 点击创建,然后选择 OAuth 2.0 集成
  4. 输入应用的名称。
    • 勾选条款及条件复选框。
    • 点击创建
  5. 您会看到五个选项:概览分发权限授权设置。从授权开始:

    a. 点击授权

    b. 在授权类型表格中,针对 OAuth 2.0 (3LO) 选择添加

  6. 回调网址字段中,输入 https://vertexaisearch.cloud.google.com/console/oauth/jira_oauth.html,然后点击保存更改

    注意:如果您看到以下警告:您的应用没有任何 API。将 API 添加到您的应用。,此问题将在下一部分中解决。

  7. 选择权限

    a. 前往 Jira API,点击添加,然后点击配置

    注意:点击 Add(添加)后,按钮会变为 Configure(配置)。

    b. 转到传统范围标签页,然后点击修改范围。选择以下范围:

    确认已选择 7 个范围,然后保存更改。

  8. 点击分发,选择修改,然后执行以下操作:

    • 请先选择共享单选按钮,以便修改其他字段。
    • 填写其余字段。
    • 当系统提示时,选择Does your app store personal data?
  9. 选择设置以复制客户端 ID客户端密钥

检索实例网址和实例 ID

如需获取实例网址,请执行以下操作:

  1. 转到 atlassian.net,然后使用您的管理员账号登录。
  2. 选择要同步的应用。例如,同步第一个应用。
  3. 找到实例网址,即地址栏中的子网域。该路径类似于 Assign appropriate permissions

如需获取实例 ID,请执行以下操作:

  1. 打开一个新标签页,复制实例网址,然后将 /_edge/tenant_info 附加到实例网址。例如 https://YOUR-INSTANCE.atlassian.net/_edge/tenant_info
  2. 前往该链接,找到 cloudId 值。cloudId 是您的实例 ID。

设置权限和角色

  1. 使用您的管理员账号登录 atlassian.com
  2. 点击左上角的菜单图标或访问 admin.atlassian.com
  3. 管理页面上,点击管理用户,然后转到群组页面。

  4. 点击创建群组。输入群组名称并创建群组。

  5. 在新群组页面的群组产品访问权限部分,点击向群组添加产品

  6. 对于 Jira,请选择 User access admin 作为产品角色。

  7. 对于 Jira Admin,请选择 Product admin 作为产品角色,然后保存更改。

  8. 群组页面上,点击添加群组成员,然后添加连接器将要进行身份验证的用户或账号。

创建 Jira Cloud 连接器

控制台

如需使用 Google Cloud 控制台将数据从 Jira Cloud 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储区

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源部分,然后选择 Jira

  5. 输入您的身份验证信息,然后点击身份验证

  6. 系统随即会打开一个新窗口。输入实例用户名和密码。 请先检查身份验证是否成功,然后再返回为数据存储区指定 Jira 来源页面。

  7. 选择要同步的实体,然后点击继续

  8. 为您的数据存储区选择一个区域。

  9. 输入数据存储区的名称。

  10. 选择同步频率。

  11. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  12. 如需查看数据注入状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看相关详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。注入完成后,状态将更改为 活跃:表示已设置与数据源的连接,并且 正在等待下一次预定的同步。

    根据数据的大小,数据注入可能需要花费数天时间 几分钟或几小时。

后续步骤

连接 Salesforce

请按以下步骤将数据从 Salesforce 同步到 Vertex AI Search。

设置数据源并首次导入数据后,数据存储区 会按照您在设置期间选择的频率同步来自该来源的数据。

在设置连接之前,请执行以下操作:

存在以下限制:

  • 如需将用户同步为实体,用户必须提供分享同意声明。

控制台

要使用 Google Cloud 控制台将数据从 Salesforce 同步到 Vertex AI Search,请按以下步骤操作:

  1. 将 Google Cloud 添加到 Salesforce CORS 许可名单。如果您 请跳到下一步。

    1. 按照 Salesforce 文档中的说明配置 CORS 许可名单

    2. 输入 https://console.cloud.google.com/ 作为来源网址,然后保存配置。

  2. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  3. 在导航菜单中,点击 Data Stores

  4. 点击创建数据存储区

  5. 选择数据源页面上,前往第三方来源。 部分,然后选择 Salesforce

  6. 输入您的 Salesforce 身份验证信息。

  7. 选择要同步的实体,然后点击继续

  8. 为您的数据存储区选择一个区域。

  9. 输入数据存储区的名称。

  10. 选择同步频率。

  11. 点击创建。Vertex AI Search 会创建您的数据存储区, 在数据存储区页面上显示您的数据存储区。

  12. 如需查看注入的状态,请前往数据存储区页面 点击数据存储区名称,在数据页面上查看相关详情。 连接器开始同步数据时,连接器状态会从“正在创建”更改为“正在运行”。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。

    根据数据的大小,数据注入可能需要花费数天时间 几分钟或几小时。

后续步骤

连接 ServiceNow

请按以下步骤将数据从 ServiceNow 同步到 Vertex AI Search。

设置数据源并首次导入数据后,数据存储区 会按照您在设置期间选择的频率同步来自该来源的数据。

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。相关信息 有关如何设置访问权限控制的信息,请参阅 使用数据源访问权限控制

  • 请准备好以下身份验证信息:

    • 实例网址,格式为 https://<domain-name>.service-now.com/
    • 客户端 ID 和客户端密钥。有关端点设置和 获取客户端 ID 和客户端密钥,请参阅为 访问实例的 ServiceNow 文档。
    • 以下任一 ServiceNow 角色类型的用户名和密码:

      • 管理员角色。请参阅基本系统角色 ServiceNow 文档。
      • 自定义 ServiceNow 角色。这是一种替代使用管理员角色的方法。如需使用自定义 ServiceNow 角色,请创建访问权限 控制规则

        如需了解详情,请参阅 创建角色并 在 ServiceNow 文档中创建 ACL 规则

控制台

要使用 Google Cloud 控制台将数据从 ServiceNow 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击 Data Stores

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源。 部分,然后选择 ServiceNow

  5. 输入您的 ServiceNow 身份验证信息。

  6. 选择要同步的实体,然后点击继续

  7. 为数据连接器选择一个区域。

  8. 为数据连接器输入名称。

  9. 选择同步频率。

  10. 点击创建。Vertex AI Search 会创建数据存储区,并在数据存储区页面上显示您的数据存储区。

  11. 如需查看数据注入的状态,请前往数据存储区页面,然后点击数据连接器名称,在其数据页面上查看相关详细信息。连接器开始同步数据时,连接器状态会从“正在创建”更改为“正在运行”。注入完成后,状态将更改为 活跃:表示已设置与数据源的连接,并且 正在等待下一次预定的同步。

    根据数据的大小,数据注入可能需要花费数天时间 几分钟或几小时。

后续步骤

连接 Sharepoint Online

请按照以下步骤将数据从 Sharepoint Online 同步到 Vertex AI Search。

设置数据源并首次导入数据后,数据存储区 会按照您在设置期间选择的频率同步来自该来源的数据。

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。相关信息 有关如何设置访问权限控制的信息,请参阅 使用数据源访问权限控制

  • 必须为 Sharepoint 账号关闭双重身份验证 (2FA)。仅支持基本的 Oauth2 密码身份验证。

  • 授予管理员同意。如需了解如何表示同意,请参阅 向应用授予整个租户范围内的管理员同意声明

  • 准备要使用的以下 Sharepoint Online 身份验证信息 在设置期间执行以下操作:

    • 实例网址。在表单中 http://DOMAIN_OR_SERVER/[sites/]WEBSITE。 如需详细了解网址,请参阅 SharePoint 文档中的 SharePoint 中的网址和令牌
    • 租户 ID、客户端 ID 和客户端密钥。如需注册该应用,请按以下步骤操作: 选择仅限此组织目录中的账号进行登录 受众群体,然后找到此身份验证信息。如需了解详情,请参阅 Microsoft 文档中的快速入门:向 Microsoft Identity Platform 注册应用
    • 用户名和密码。这些项目必须与 Sharepoint 网站相对应 管理员或停用了 2FA 的 Sharepoint Site Collection 管理员。
  • 下表介绍了建议配置的角色及其限制。

控制台

要使用 Google Cloud 控制台将数据从 Sharepoint Online 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击 Data Stores

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源。 部分,然后选择 Sharepoint Online

  5. 输入您的 Sharepoint Online 身份验证信息。

  6. 选择要同步的实体,然后点击继续

  7. 为您的数据存储区选择一个区域。

  8. 输入数据存储区的名称。

  9. 为数据存储区选择同步频率。

  10. 点击创建。Vertex AI Search 会创建您的数据存储区, 在数据存储区页面上显示您的数据存储区。

  11. 如需查看数据注入状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看相关详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。注入完成后,状态将更改为 活跃:表示已设置与数据源的连接,并且 正在等待下一次预定的同步。

    根据数据的大小,数据注入可能需要花费数天时间 几分钟或几小时。

后续步骤

连接 Slack

请按照以下步骤将数据从 Slack 同步到 Vertex AI Search。

设置数据源并首次导入数据后,数据存储区 会按照您在设置期间选择的频率同步来自该来源的数据。

在设置连接之前,请执行以下操作:

存在以下限制:

  • Slack 的默认行为会限制抓取和同步私密渠道、多方即时消息和一对一即时消息中的内容。

控制台

如需使用 Google Cloud 控制台将数据从 Slack 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击 Data Stores

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源部分,然后选择 Slack

  5. 输入您的 Slack 身份验证信息。

  6. 选择要同步的实体,然后点击继续

  7. 为您的数据存储区选择一个区域。

  8. 输入数据存储区的名称。

  9. 为数据存储区选择同步频率。

  10. 点击创建。Vertex AI Search 会创建您的数据存储区, 在数据存储区页面上显示您的数据存储区。

  11. 如需查看数据注入状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看相关详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。注入完成后,状态将更改为 活跃:表示已设置与数据源的连接,并且 正在等待下一次预定的同步。

    根据数据的大小,数据注入可能需要花费数天时间 几分钟或几小时。

后续步骤

关联 Dropbox

请按以下步骤将数据从 Dropbox 同步到 Vertex AI Search。

您首次设置数据源并导入数据后,数据存储区会按照您在设置期间选择的频率同步来自该数据源的数据。

准备工作

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。如需更多信息 请参阅使用数据源访问权限控制

  • 准备好以下 Dropbox 身份验证信息。如需了解如何设置这些参数,请参阅 Dropbox 文档中的 OAuth 指南

    • 客户端 ID
    • 客户端密钥

控制台

如需使用 Google Cloud 控制台将数据从 Dropbox 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击 Data Stores

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源。 部分,然后选择 Dropbox

  5. 输入您的 Dropbox 身份验证信息,然后点击身份验证。答 新窗口。

  6. 对您的账号进行身份验证并确认 操作成功后,返回为 您的数据存储区页面。

  7. 选择要同步的实体,然后点击继续

  8. 为数据存储区选择位置。

  9. 为数据存储区输入名称。

  10. 为数据存储区选择同步频率。

  11. 点击创建。Vertex AI Search 会创建您的数据存储区, 在数据存储区页面上显示您的数据存储区。

  12. 如需查看数据注入的状态,请前往数据存储区页面,然后点击数据存储区名称,在其数据页面上查看其详细信息。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。查看文档标签页,确保实体已正确提取。

    根据数据的大小,数据注入可能需要花费数天时间 几分钟或几小时。

后续步骤

连接盒

请按照以下步骤将数据从 Box 同步到 Vertex AI Search。

您首次设置数据源并导入数据后,数据存储区会按照您在设置期间选择的频率同步来自该数据源的数据。

准备工作

在设置连接之前,请执行以下操作:

  • 为数据源设置访问权限控制。如需了解如何设置访问权限控制,请参阅使用数据源访问权限控制

  • 准备好以下 Box 身份验证信息。相关信息 如需了解如何设置这些参数,请参阅 Box 中的 JWT 身份验证 开发者文档。

    • 企业 ID
    • 客户端 ID
    • 客户端密钥
    • 公钥 ID
    • 私钥
    • 口令
  • 创建 JWT 端点时,请配置以下范围:

存在以下限制:

  • 评论的增量更改的同步时间可能会超过配置的频率间隔。
  • 如果复制或移动包含实体的文件夹,增量更改的同步时间可能会超过配置的频率间隔。

控制台

要使用 Google Cloud 控制台将数据从 Box 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储空间

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源。 部分,然后选择 Box

  5. 输入您的身份验证信息。

  6. 选择要同步的实体,然后点击继续

  7. 为您的数据存储区选择一个区域。

  8. 输入数据存储区的名称。

  9. 为数据存储区选择同步频率。

  10. 点击创建。Vertex AI Search 会创建您的数据存储区, 在数据存储区页面上显示您的数据存储区。

  11. 如需查看注入的状态,请前往数据存储区页面,然后 点击数据存储区名称,在数据页面上查看相关详情。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。

    根据数据的大小,数据注入可能需要花费数天时间 几分钟或几小时。

后续步骤

关联 OneDrive

请按以下步骤将数据从 OneDrive 同步到 Vertex AI Search。

您首次设置数据源并导入数据后,数据存储区会按照您在设置期间选择的频率同步来自该数据源的数据。

准备工作

在设置连接之前,请执行以下操作:

控制台

要使用 Google Cloud 控制台将数据从 OneDrive 同步到 Vertex AI Search,请按以下步骤操作:

  1. 在 Google Cloud 控制台中,前往 Agent Builder 页面。

    Agent Builder

  2. 在导航菜单中,点击数据存储区

  3. 点击创建数据存储区

  4. 选择数据源页面上,前往第三方来源。 部分,然后选择 OneDrive

  5. 输入您的 OneDrive 身份验证信息。

  6. 选择要同步的实体,然后点击继续

  7. 为您的数据存储区选择一个区域。

  8. 输入数据存储区的名称。

  9. 为数据存储区选择同步频率。

  10. 点击创建。Vertex AI Search 会创建您的数据存储区, 在数据存储区页面上显示您的数据存储区。

  11. 如需查看注入的状态,请前往数据存储区页面,然后 点击数据存储区名称,在数据页面上查看相关详情。当连接器开始同步数据时,连接器状态会从正在创建变为正在运行。提取完成后,状态会变为有效,表示已设置与数据源的连接,并正在等待下一次预定的同步。

    根据数据的大小,数据注入可能需要花费数天时间 几分钟或几小时。

后续步骤