Method: projects.locations.collections.dataStores.trainCustomModel

Entrena un modelo personalizado.

Solicitud HTTP

POST https://discoveryengine.googleapis.com/v1alpha/{dataStore=projects/*/locations/*/collections/*/dataStores/*}:trainCustomModel

La URL usa la sintaxis de la transcodificación gRPC.

Parámetros de ruta de acceso

Parámetros
dataStore

string

Obligatorio. Es el nombre del recurso del almacén de datos, como projects/*/locations/global/collections/default_collection/dataStores/default_data_store. Este campo se usa para identificar el almacén de datos en el que se entrenarán los modelos.

Cuerpo de la solicitud

El cuerpo de la solicitud contiene datos con la siguiente estructura:

Representación JSON
{
  "modelType": string,
  "errorConfig": {
    object (ImportErrorConfig)
  },
  "modelId": string,

  // Union field training_input can be only one of the following:
  "gcsTrainingInput": {
    object (GcsTrainingInput)
  }
  // End of list of possible types for union field training_input.
}
Campos
modelType

string

Es el modelo que se entrenará. Los valores admitidos son los que se detallan a continuación:

  • search-tuning: Ajuste preciso del sistema de búsqueda en función de los datos proporcionados.
errorConfig

object (ImportErrorConfig)

Ubicación deseada de los errores que se produjeron durante la transferencia y el entrenamiento de los datos.

modelId

string

Si no se proporciona, se generará un UUID.

Campo de unión training_input. Es la entrada del entrenamiento del modelo. training_input puede ser solo uno de los siguientes:
gcsTrainingInput

object (GcsTrainingInput)

Es la entrada de entrenamiento de Cloud Storage.

Cuerpo de la respuesta

Si se ejecuta de forma correcta, el cuerpo de la respuesta contiene una instancia de Operation.

Alcances de autorización

Se necesita uno de los siguientes permisos de OAuth:

  • https://www.googleapis.com/auth/cloud-platform
  • https://www.googleapis.com/auth/discoveryengine.readwrite

Para obtener más información, consulta Authentication Overview.

Permisos de IAM

Se requiere el siguiente permiso de IAM en el recurso dataStore:

  • discoveryengine.dataStores.trainCustomModel

Para obtener más información, consulta la documentación de IAM.

GcsTrainingInput

Es la entrada de datos de entrenamiento de Cloud Storage.

Representación JSON
{
  "corpusDataPath": string,
  "queryDataPath": string,
  "trainDataPath": string,
  "testDataPath": string
}
Campos
corpusDataPath

string

Son los datos del corpus de Cloud Storage que se podrían asociar en los datos de entrenamiento. El formato de la ruta de datos es gs://<bucket_to_data>/<jsonl_file_name>. Es un archivo jsonl/ndjson delimitado por saltos de línea.

En el caso del modelo de ajuste de la búsqueda, cada línea debe tener el ID, el título y el texto. Ejemplo: {"Id": "doc1", title: "relevant doc", "text": "relevant text"}

queryDataPath

string

Son los datos de la consulta de GCS que se podrían asociar con los datos de entrenamiento. El formato de la ruta de datos es gs://<bucket_to_data>/<jsonl_file_name>. Es un archivo jsonl/ndjson delimitado por saltos de línea.

En el caso del modelo de ajuste de la búsqueda, cada línea debe tener el ID y el texto. Ejemplo: {"Id": "query1", "text": "example query"}

trainDataPath

string

Es la ruta de acceso a los datos de entrenamiento de Cloud Storage, cuyo formato debe ser gs://<bucket_to_data>/<tsv_file_name>. El archivo debe estar en formato TSV. Cada línea debe tener el docId, el queryId y la puntuación (número).

En el caso del modelo de ajuste de la búsqueda, debe tener la puntuación de ID de consulta y de ID de corpus como encabezado del archivo TSV. La puntuación debe ser un número en [0, inf+). Cuanto mayor sea el número, más relevante será el par. Ejemplo:

  • query-id\tcorpus-id\tscore
  • query1\tdoc1\t1
testDataPath

string

Son los datos de prueba de Cloud Storage. Tiene el mismo formato que trainDataPath. Si no se proporciona, se realizará una división aleatoria del 80/20 entre los datos de entrenamiento y prueba en trainDataPath.