Method: projects.locations.collections.dataStores.trainCustomModel

Prepara um modelo personalizado.

Pedido HTTP

POST https://discoveryengine.googleapis.com/v1beta/{dataStore=projects/*/locations/*/collections/*/dataStores/*}:trainCustomModel

O URL usa a sintaxe de transcodificação de gRPC.

Parâmetros de caminho

Parâmetros
dataStore

string

Obrigatório. O nome do recurso da loja de dados, como projects/*/locations/global/collections/default_collection/dataStores/default_data_store. Este campo é usado para identificar o armazenamento de dados onde preparar os modelos.

Corpo do pedido

O corpo do pedido contém dados com a seguinte estrutura:

Representação JSON
{
  "modelType": string,
  "errorConfig": {
    object (ImportErrorConfig)
  },
  "modelId": string,

  // Union field training_input can be only one of the following:
  "gcsTrainingInput": {
    object (GcsTrainingInput)
  }
  // End of list of possible types for union field training_input.
}
Campos
modelType

string

Modelo a ser preparado. Os valores suportados são:

  • search-tuning: otimização do sistema de pesquisa com base nos dados fornecidos.
errorConfig

object (ImportErrorConfig)

A localização desejada dos erros incorridos durante o carregamento e a preparação dos dados.

modelId

string

Se não for fornecido, é gerado um UUID.

Campo de união training_input. Entrada de preparação do modelo. training_input só pode ser uma das seguintes opções:
gcsTrainingInput

object (GcsTrainingInput)

Entrada de preparação do Cloud Storage.

Corpo da resposta

Se for bem-sucedido, o corpo da resposta contém uma instância de Operation.

Âmbitos de autorização

Requer um dos seguintes âmbitos do OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/discoveryengine.readwrite

Para mais informações, consulte o Authentication Overview.

Autorizações de IAM

Requer a seguinte autorização de IAM no recurso dataStore:

  • discoveryengine.dataStores.trainCustomModel

Para mais informações, consulte a documentação do IAM.

GcsTrainingInput

Entrada de dados de preparação do Cloud Storage.

Representação JSON
{
  "corpusDataPath": string,
  "queryDataPath": string,
  "trainDataPath": string,
  "testDataPath": string
}
Campos
corpusDataPath

string

Os dados do corpus do Cloud Storage que podem ser associados aos dados de preparação. O formato do caminho dos dados é gs://<bucket_to_data>/<jsonl_file_name>. Um ficheiro jsonl/ndjson delimitado por newline.

Para o modelo de aperfeiçoamento da pesquisa, cada linha deve ter o ID, o título e o texto. Exemplo: {"Id": "doc1", title: "relevant doc", "text": "relevant text"}

queryDataPath

string

Os dados de consulta do GCS que podem ser associados aos dados de preparação. O formato do caminho dos dados é gs://<bucket_to_data>/<jsonl_file_name>. Um ficheiro jsonl/ndjson delimitado por newline.

Para o modelo de ajuste de pesquisa, cada linha deve ter o ID e o texto. Exemplo: {"Id": "query1", "text": "example query"}

trainDataPath

string

Caminho dos dados de preparação do Cloud Storage cujo formato deve ser gs://<bucket_to_data>/<tsv_file_name>. O ficheiro deve estar no formato TSV. Cada linha deve ter o docId, o queryId e a pontuação (número).

Para o modelo de otimização da pesquisa, deve ter o ID da consulta, o ID do corpus e a pontuação como cabeçalho do ficheiro TSV. A pontuação deve ser um número em [0, inf+). Quanto maior for o número, mais relevante é o par. Exemplo:

  • query-id\tcorpus-id\tscore
  • query1\tdoc1\t1
testDataPath

string

Dados de teste do Cloud Storage. O mesmo formato que trainDataPath. Se não for fornecido, é feita uma divisão aleatória de 80/20 entre dados de treino e de teste em trainDataPath.