É possível atualizar o esquema para qualquer dado que contenha dados compatíveis com um esquema, como dados estruturados, dados do site com dados estruturados ou outros dados não estruturados com metadados.
É possível atualizar o esquema no console do Google Cloud ou usando o método da API schemas.patch
.
A atualização do esquema de um site é aceita apenas pela API REST.
Para atualizar o esquema, adicione novos campos, mude as anotações indexáveis, pesquisáveis e
recuperáveis de um campo ou marque um campo como uma propriedade de chave, como
title
, uri
e description
.
Atualizar o esquema
É possível atualizar o esquema no console do Google Cloud ou usando a API.
Console
Para atualizar um esquema no console do Google Cloud, siga estas etapas:
Consulte a seção Requisitos e limitações para verificar se a atualização do esquema é válida.
Se você estiver atualizando as anotações de campo (definindo campos como indexáveis, recuperáveis, dinâmicos, pesquisáveis ou completáveis), consulte Configurar configurações de campo para ver as limitações e os requisitos de cada tipo de anotação.
Verifique se você concluiu a ingestão de dados. Caso contrário, o esquema talvez ainda não esteja disponível para edição.
No Console do Google Cloud, acesse a página Criador de agentes.
No menu de navegação, clique em Repositórios de dados.
Na coluna Nome, clique no repositório de dados com o esquema que você quer atualizar.
Clique na guia Esquema para conferir o esquema dos seus dados.
Essa guia pode estar vazia se for a primeira vez que você edita os campos.
Clique no botão Editar.
Atualize o esquema:
Mapear propriedades principais:na coluna Propriedades principais do seu esquema, selecione uma propriedade principal para mapear um campo. Por exemplo, se um campo chamado
details
sempre contém a descrição de um documento, mapeie esse campo para a propriedade de chave Description.Atualizar o número de dimensões (avançado): é possível atualizar essa configuração se você estiver usando embeddings de vetores personalizados com a pesquisa da Vertex AI. Consulte Avançado: use embeddings personalizados.
Atualizar anotações de campo:para atualizar as anotações de um campo, selecione ou desmarque a configuração de anotação de um campo. As anotações disponíveis são Retrievable, Indexable, Dynamic Facetable, Searchable e Completable. Algumas configurações de campo têm limitações. Consulte Configurar configurações de campo para descrições e requisitos de cada tipo de anotação.
Adicionar um novo campo:adicionar novos campos ao esquema antes de importar novos documentos com esses campos pode encurtar o tempo que o Vertex AI Agent Builder leva para reindexar seus dados após a importação.
Clique em Adicionar novos campos para abrir a seção.
Clique em add_box Adicionar nó e especifique as configurações do novo campo.
Para indicar uma matriz, defina Matriz como Sim. Por exemplo, para adicionar uma matriz de strings, defina type como
string
e Array comoYes
.Para um índice de repositório de dados de site, todos os campos adicionados são matrizes por padrão.
Clique em Salvar para aplicar as mudanças no esquema.
A mudança do esquema aciona a reindexação. Para repositórios de dados grandes, a reindexação pode levar horas.
REST
Para usar a API e atualizar seu esquema, siga estas etapas:
Analise as seções Requisitos e limitações e Exemplos de limitação (somente REST) para verificar se as mudanças de esquema são válidas.
Para atualizar o esquema de repositórios de dados com sites ou dados não estruturados com metadados, pule para a etapa 5 para chamar o método
schema.patch
.Se você estiver atualizando as anotações de campo (definindo campos como indexáveis, recuperáveis, dinâmicos, com tabela ou pesquisáveis), consulte Configurar configurações de campo para ver as limitações e os requisitos de cada tipo de anotação.
Se você estiver editando um esquema detectado automaticamente, verifique se a ingestão de dados foi concluída. Caso contrário, o esquema pode não estar disponível para edição ainda.
Encontre o ID do repositório de dados. Se você já tiver o ID do repositório de dados, pule para a próxima etapa.
No console do Google Cloud, acesse a página Criador de agentes e, no menu de navegação, clique em Repositórios de dados.
Clique no nome do seu repositório de dados.
Na página Dados do seu repositório de dados, encontre o ID do repositório.
Use o método da API schemas.patch para fornecer o novo esquema JSON como um objeto JSON.
curl -X PATCH \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ "https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/schemas/default_schema" \ -d '{ "structSchema": JSON_SCHEMA_OBJECT }'
Substitua:
PROJECT_ID
: o ID do seu projeto do Google Cloud.DATA_STORE_ID
: o ID do repositório de dados da Vertex AI para Pesquisa.JSON_SCHEMA_OBJECT
: seu novo esquema JSON como um objeto JSON. Exemplo:{ "$schema": "https://json-schema.org/draft/2020-12/schema", "type": "object", "properties": { "title": { "type": "string", "keyPropertyMapping": "title" }, "categories": { "type": "array", "items": { "type": "string", "keyPropertyMapping": "category" } }, "uri": { "type": "string", "keyPropertyMapping": "uri" } } }
Opcional: siga o procedimento Conferir uma definição de esquema para analisar o esquema.
C#
Para mais informações, consulte a documentação de referência da API C# do Vertex AI Agent Builder.
Para autenticar no Vertex AI Agent Builder, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Go
Para mais informações, consulte a documentação de referência da API Go do Vertex AI Agent Builder.
Para autenticar no Vertex AI Agent Builder, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para mais informações, consulte a documentação de referência da API Java do Vertex AI Agent Builder.
Para autenticar no Vertex AI Agent Builder, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para mais informações, consulte a documentação de referência da API Python do Vertex AI Agent Builder.
Para autenticar no Vertex AI Agent Builder, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Ruby
Para mais informações, consulte a documentação de referência da API Ruby do Vertex AI Agent Builder.
Para autenticar no Vertex AI Agent Builder, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Requisitos e limitações
Ao atualizar um esquema, verifique se o novo esquema é compatível com o esquema que você está atualizando. Para atualizar um esquema com um novo esquema que não seja compatível com versões anteriores, exclua todos os documentos no repositório de dados, exclua o esquema e crie um novo.
Atualizar um esquema aciona a reindexação de todos os documentos. Isso pode levar tempo e gerar custos adicionais:
Tempo. A reindexação de um repositório de dados grande pode levar horas ou dias.
Despesa. A reindexação pode gerar custos, dependendo do analisador. Por exemplo, reindexar repositórios de dados que usam o analisador de OCR ou de layout gera custos. Para mais informações, consulte Preços dos recursos da Document AI.
As atualizações de esquema não são compatíveis com o seguinte:
- Como mudar o tipo de um campo. Uma atualização de esquema não oferece suporte para a alteração do tipo do campo. Por exemplo, um campo associado a um número inteiro não pode ser alterado para string.
- Remoção de um campo. Depois de definido, um campo não pode ser removido. Você pode continuar adicionando novos campos, mas não pode remover um campo atual.
Exemplos de limitação (somente REST)
Esta seção mostra exemplos de tipos válidos e inválidos de atualizações de esquema. Esses exemplos usam o seguinte esquema JSON:
{
"$schema": "https://json-schema.org/draft/2020-12/schema",
"type": "object",
"properties": {
"title": {
"type": "string"
},
"description": {
"type": "string",
"keyPropertyMapping": "description"
},
"categories": {
"type": "array",
"items": {
"type": "string",
"keyPropertyMapping": "category"
}
}
}
}
Exemplos de atualizações compatíveis
As atualizações a seguir do esquema de exemplo são compatíveis.
Adicionar um campo. Neste exemplo, o campo
properties.uri
foi adicionado ao esquema.{ "$schema": "https://json-schema.org/draft/2020-12/schema", "type": "object", "properties": { "title": { "type": "string" }, "description": { "type": "string", "keyPropertyMapping": "description" }, "uri": { // Added field. This is supported. "type": "string", "keyPropertyMapping": "uri" }, "categories": { "type": "array", "items": { "type": "string", "keyPropertyMapping": "category" } } } }
Adicionar ou remover anotações de propriedade de chave para
title
,description
ouuri
. Neste exemplo,keyPropertyMapping
foi adicionado ao campotitle
.{ "$schema": "https://json-schema.org/draft/2020-12/schema", "type": "object", "properties": { "title": { "type": "string", "keyPropertyMapping": "title" // Added "keyPropertyMapping". This is supported. }, "description": { "type": "string", "keyPropertyMapping": "description" }, "categories": { "type": "array", "items": { "type": "string", "keyPropertyMapping": "category" } } } }
Exemplos de atualizações de esquema inválidas
As atualizações a seguir do esquema de exemplo não são compatíveis.
Como mudar o tipo de um campo. Neste exemplo, o tipo do campo
title
foi alterado de string para número. Isso não é possível.{ "$schema": "https://json-schema.org/draft/2020-12/schema", "type": "object", "properties": { "title": { "type": "number" // Changed from string. Not allowed. }, "description": { "type": "string", "keyPropertyMapping": "description" }, "categories": { "type": "array", "items": { "type": "string", "keyPropertyMapping": "category" } } } }
Remoção de um campo. Neste exemplo, o campo
title
foi removido. Isso não é possível.{ "$schema": "https://json-schema.org/draft/2020-12/schema", "type": "object", "properties": { // "title" is removed. Not allowed. "description": { "type": "string", "keyPropertyMapping": "description" }, "uri": { "type": "string", "keyPropertyMapping": "uri" }, "categories": { "type": "array", "items": { "type": "string", "keyPropertyMapping": "category" } } } }
A seguir
- Conferir a definição do esquema para dados estruturados
- Excluir um esquema de dados estruturados
- Visualizar os resultados da pesquisa