Acerca das apps e das lojas de dados

Esta página descreve as apps e os repositórios de dados do Gemini Enterprise.

Com o Gemini Enterprise, cria uma app e associa-a a um repositório de dados. Um determinado projeto pode conter várias apps. Google Cloud

Palavras-chave:

  • App: uma app Gemini Enterprise fornece resultados da pesquisa, ações e agentes aos seus utilizadores finais. O termo app pode ser usado alternadamente com o termo motor no contexto das APIs.

  • Armazenamento de dados: um armazenamento de dados é uma entidade que contém os dados carregados a partir de uma origem de dados originais, como o Cloud Storage, ou aplicações de terceiros, como o Jira ou o Salesforce. Os armazenamentos de dados que contêm dados de aplicações de terceiros também são denominados conetores de dados.

Relação entre apps e arquivos de dados

Uma app tem de estar associada a um repositório de dados para usar os respetivos dados para apresentar resultados da pesquisa, respostas ou ações.

As apps têm uma relação de muitos-para-muitos com os armazenamentos de dados. Quando várias lojas de dados estão ligadas a uma única app, isto é denominado pesquisa combinada. Para aceder a informações sobre as limitações da ligação de uma app de pesquisa a mais do que um repositório de dados, consulte o artigo Acerca da pesquisa combinada.

Método de criação de apps e carregamento de dados

A forma como cria uma app e carrega dados depende do tipo de dados que tem:

  • Para dados de terceiros, usa a Google Cloud consola, e não a API, para criar a sua app e carregar dados.

  • Para outros dados, pode usar a Google Cloud consola ou a API.

Documentos

Cada arquivo de dados tem um ou mais registos de dados, denominados documentos. O que um documento representa varia consoante o tipo de dados no arquivo de dados:

  • Dados para origens de dados de terceiros. Um documento é uma entidade específica da origem de dados de terceiros, como um problema do Jira ou um espaço do Confluence.

  • Dados estruturados. Um documento é uma linha numa tabela ou um registo JSON que segue um esquema específico. Pode fornecer este esquema ou permitir que o Gemini Enterprise derive o esquema dos dados carregados.

  • Dados não estruturados. Um documento é um ficheiro no formato HTML, PDF com texto incorporado ou TXT. Os formatos PPTX e DOCX estão disponíveis na pré-visualização.

Armazenamentos de dados e apps

No Gemini Enterprise, existem vários tipos de arquivos de dados. Um arquivo de dados só pode conter um tipo de dados.

Dados estruturados para armazenamentos de dados de terceiros

Os seguintes conetores de origens de dados de terceiros estão disponíveis na pré-visualização com lista de autorizações:

  • Confluência
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

Os dados destes terceiros são considerados dados estruturados.

Quando configura um novo conetor, seleciona uma frequência de sincronização. Também pode selecionar as entidades a sincronizar. As entidades variam consoante a origem, como problemas para o Jira e conteúdo e espaços para o Confluence. É criado um armazenamento de dados exclusivo para cada entidade. Os armazenamentos de dados de entidades são agrupados por instância do conetor.

O que se segue?

Dados estruturados

Um repositório de dados com dados estruturados permite a pesquisa semântica ou recomendações sobre dados estruturados. Pode importar dados do BigQuery ou do Cloud Storage. Também pode carregar manualmente dados JSON estruturados através da API.

Por exemplo, pode ativar a pesquisa ou as recomendações num catálogo de produtos para a sua experiência de comércio eletrónico ou num diretório de médicos para a pesquisa de fornecedores ou recomendações.

O Gemini Enterprise deteta automaticamente o esquema dos dados que importa. Opcionalmente, pode fornecer um esquema para os seus dados. Fornecer um esquema para os seus dados melhora normalmente a qualidade dos resultados.

O que se segue?

Dados não estruturados

Um armazenamento de dados não estruturados permite a pesquisa semântica ou recomendações sobre dados, como documentos e imagens.

Os armazenamentos de dados não estruturados suportam documentos nos formatos HTML, PDF com texto incorporado e TXT. Os formatos PPTX e DOCX estão disponíveis na pré-visualização.

A Pesquisa fornece resultados sob a forma de 10 URLs e respostas resumidas para consultas de linguagem natural. Os documentos têm de ser carregados para um contentor do Cloud Storage com as autorizações de acesso adequadas. Por exemplo, uma instituição financeira pode ativar a pesquisa ou as recomendações no respetivo conjunto de dados privado de publicações de investigação financeira, ou uma empresa de biotecnologia pode ativar a pesquisa ou as recomendações no respetivo repositório privado de investigação médica.

O que se segue?

Acerca da pesquisa mista

Com a pesquisa combinada, é possível ligar várias bases de dados a uma única app. Isto permite que a app pesquise em várias origens e tipos de dados.

Para criar uma app de pesquisa combinada, selecione várias bases de dados quando criar uma nova app. Se não selecionar várias bases de dados durante a criação, não pode adicionar bases de dados adicionais mais tarde.

Quando recebe resultados da pesquisa, pode pesquisar em todas as lojas de dados ou filtrar os resultados de uma única loja de dados.

A pesquisa combinada tem as seguintes limitações:

  • Adicionar e remover armazenamentos de dados:
    • Para ativar a pesquisa mista para uma app, tem de associar, pelo menos, duas lojas de dados à mesma durante a criação da app.
    • Pode adicionar ou remover arquivos de dados de uma app de pesquisa combinada, mas a app não pode ter menos de dois arquivos de dados associados em qualquer altura.
    • Se associar um único arquivo de dados a uma app de pesquisa durante a criação da app, não pode adicionar nem remover esse arquivo de dados.
  • Os armazenamentos de dados que contêm dados não estruturados importados através do BigQuery não são suportados.
  • A pesquisa combinada permite os seguintes campos em pedidos de pesquisa:
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • A pesquisa combinada permite os seguintes campos em dataStoreSpecs:
    • dataStore
    • boostSpec: se existirem especificações de aumento especificadas para SearchRequest e dataStoreSpecs, ambas as especificações de aumento são aplicadas aos resultados da pesquisa
    • filter: se existirem filtros especificados para SearchRequest e dataStoreSpecs, ambos os filtros são aplicados aos resultados da pesquisa
  • As operações de criação, leitura, atualização e eliminação (CRUD) em configurações de publicação são suportadas para apps misturadas. Só é possível adicionar ou atualizar os seguintes campos numa configuração de publicação:
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig:
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • As operações CRUD nos seguintes controlos são suportadas para apps de pesquisa combinada:
    • boostAction
    • synonymAction
    • filterAction
  • Existe um limite de 50 armazéns de dados por app de pesquisa.
  • Se um arquivo de dados usar uma configuração de CMEK, todos os outros arquivos de dados também têm de usar a mesma configuração de CMEK.