Para poder consultar un índice, primero debes seguir una serie de pasos:
- Crea un
IndexEndpoint
si es necesario o reutiliza uno que ya tengas.IndexEndpoint
- Obtén el
IndexEndpoint
ID. - Implementa el índice en
IndexEndpoint
.
Crear un IndexEndpoint
gcloud
Antes de usar los datos de los comandos que se indican a continuación, haz los siguientes cambios:
- INDEX_ENDPOINT_NAME: nombre visible del endpoint de índice.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
Ejecuta el siguiente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints create \ --display-name=INDEX_ENDPOINT_NAME \ --public-endpoint-enabled \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints create ` --display-name=INDEX_ENDPOINT_NAME ` --public-endpoint-enabled ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints create ^ --display-name=INDEX_ENDPOINT_NAME ^ --public-endpoint-enabled ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- INDEX_ENDPOINT_NAME: nombre visible del endpoint de índice.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
- PROJECT_NUMBER: el número de proyecto que se genera automáticamente.
Método HTTP y URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints
Cuerpo JSON de la solicitud:
{ "display_name": "INDEX_ENDPOINT_NAME", "publicEndpointEnabled": "true" }
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.CreateIndexEndpointOperationMetadata", "genericMetadata": { "createTime": "2022-01-13T04:09:56.641107Z", "updateTime": "2022-01-13T04:09:56.641107Z" } } }
"done": true
.
Terraform
En el siguiente ejemplo se usa el recurso de Terraform vertex_ai_index_endpoint
para crear un endpoint de índice.
Para saber cómo aplicar o quitar una configuración de Terraform, consulta Comandos básicos de Terraform.
Python
Para saber cómo instalar o actualizar el SDK de Vertex AI para Python, consulta Instalar el SDK de Vertex AI para Python. Para obtener más información, consulta la documentación de referencia de la API Python.
Consola
Sigue estas instrucciones para crear un endpoint de índice.
- En la sección Vertex AI de la Google Cloud consola, ve a la sección Desplegar y usar. Selecciona Vector Search.
- Se muestra una lista de tus índices activos.
- En la parte superior de la página, selecciona la pestaña Endpoints de índice. Se muestran los endpoints de índice.
- Haga clic en Crear endpoint de índice. Se abre el panel Crear un endpoint de índice.
- Introduce un nombre visible para el endpoint del índice.
- En el campo Región, selecciona una región en el menú desplegable.
- En el campo Acceso, selecciona Estándar.
- Haz clic en Crear.
Desplegar un índice en un endpoint
gcloud
En este ejemplo se usa el comando gcloud ai index-endpoints deploy-index
.
Antes de usar los datos de los comandos que se indican a continuación, haz los siguientes cambios:
- INDEX_ENDPOINT_ID: ID del endpoint de índice.
- DEPLOYED_INDEX_ID: cadena especificada por el usuario para identificar de forma única el índice implementado. Debe empezar por una letra y solo puede contener letras, números o guiones bajos. Consulta las directrices de formato de DeployedIndex.id.
- DEPLOYED_INDEX_ENDPOINT_NAME: Nombre visible del endpoint de índice implementado.
- INDEX_ID: ID del índice.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
Ejecuta el siguiente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --display-name=DEPLOYED_INDEX_ENDPOINT_NAME \ --index=INDEX_ID \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --display-name=DEPLOYED_INDEX_ENDPOINT_NAME ` --index=INDEX_ID ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --display-name=DEPLOYED_INDEX_ENDPOINT_NAME ^ --index=INDEX_ID ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- INDEX_ENDPOINT_ID: ID del endpoint de índice.
- DEPLOYED_INDEX_ID: cadena especificada por el usuario para identificar de forma única el índice implementado. Debe empezar por una letra y solo puede contener letras, números o guiones bajos. Consulta las directrices de formato de DeployedIndex.id.
- DEPLOYED_INDEX_ENDPOINT_NAME: Nombre visible del endpoint de índice implementado.
- INDEX_ID: ID del índice.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
- PROJECT_NUMBER: el número de proyecto que se genera automáticamente.
Método HTTP y URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:deployIndex
Cuerpo JSON de la solicitud:
{ "deployedIndex": { "id": "DEPLOYED_INDEX_ID", "index": "projects/PROJECT_ID/locations/LOCATION/indexes/INDEX_ID", "displayName": "DEPLOYED_INDEX_ENDPOINT_NAME" } }
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeployIndexOperationMetadata", "genericMetadata": { "createTime": "2022-10-19T17:53:16.502088Z", "updateTime": "2022-10-19T17:53:16.502088Z" }, "deployedIndexId": "DEPLOYED_INDEX_ID" } }
Terraform
En el siguiente ejemplo se usa el recurso de Terraform vertex_ai_index_endpoint_deployed_index
para crear un endpoint de índice implementado.
Para saber cómo aplicar o quitar una configuración de Terraform, consulta Comandos básicos de Terraform.
Python
Para saber cómo instalar o actualizar el SDK de Vertex AI para Python, consulta Instalar el SDK de Vertex AI para Python. Para obtener más información, consulta la documentación de referencia de la API Python.
Consola
Sigue estas instrucciones para implementar tu índice en un endpoint.
- En la sección Vertex AI de la Google Cloud consola, ve a la sección Desplegar y usar. Selecciona Vector Search.
- Se muestra una lista de tus índices activos.
- Selecciona el nombre del índice que quieras implementar. Se abrirá la página de detalles del índice.
- En la página de detalles del índice, haz clic en Implementar en endpoint. Se abrirá el panel de implementación de índices.
- Introduce un nombre visible. Este nombre actúa como un ID y no se puede actualizar.
- En el menú desplegable Endpoint, selecciona el endpoint en el que quieras implementar este índice. Nota: El endpoint no está disponible si el índice ya se ha implementado en él.
- Opcional: En el campo Tipo de máquina, selecciona Estándar o Alta memoria.
- Opcional. Selecciona Habilitar el autoescalado para cambiar automáticamente el tamaño del número de nodos en función de las demandas de tus cargas de trabajo. El número predeterminado de réplicas es 2 si el autoescalado está inhabilitado.
- Haz clic en Desplegar para desplegar el índice en el endpoint. Nota: El proceso de implementación tarda unos 30 minutos.
Obtener el nombre de dominio del índice
Una vez que se haya implementado el índice, necesitarás el nombre de dominio para poder usarlo en una consulta online. El valor está disponible en
publicEndpointDomainName
.
curl -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`" ${ENDPOINT}/v1/projects/${PROJECT_ID}/locations/${REGION}/indexEndpoints/${INDEX_ENDPOINT_ID}
Respuesta de ejemplo
{
"name": "projects/181224308459/locations/us-central1/indexEndpoints/3370566089086861312",
"displayName": "public-endpoint-test1",
"deployedIndexes": [
{
"id": "test_index_public1",
"index": "projects/181224308459/locations/us-central1/indexes/7733428228102029312",
"displayName": "test_index_public1",
"createTime": "2023-02-08T23:19:58.026843Z",
"indexSyncTime": "2023-02-09T05:26:19.309417Z",
"automaticResources": {
"minReplicaCount": 2,
"maxReplicaCount": 2
},
"deploymentGroup": "default"
}
],
"etag": "AMEw9yNkXQcSke8iqW9SYxfhj_hT9GCwPt1XlxVwJRSCxiXOYnG4CKrZM_X0oH-XN8tR",
"createTime": "2023-02-08T22:44:20.285382Z",
"updateTime": "2023-02-08T22:44:26.515162Z",
"publicEndpointDomainName": "1957880287.us-central1-181224308459.vdb.vertexai.goog"
}
Habilitar autoescalado
La búsqueda vectorial admite el autoescalado, que puede cambiar automáticamente el tamaño del número de nodos en función de las demandas de tus cargas de trabajo. Cuando la demanda es alta, se añaden nodos al grupo de nodos, que no superará el tamaño máximo que designes. Cuando la demanda es baja, el grupo de nodos se reduce a un tamaño mínimo que designes. Puedes consultar los nodos que se están usando y los cambios monitorizando las réplicas actuales.
Para habilitar el autoescalado, especifica maxReplicaCount
y minReplicaCount
al desplegar el índice:
gcloud
En el siguiente ejemplo se usa el comando gcloud ai index-endpoints deploy-index
.
Antes de usar los datos de los comandos que se indican a continuación, haz los siguientes cambios:
- INDEX_ENDPOINT_ID: ID del endpoint de índice.
- DEPLOYED_INDEX_ID: cadena especificada por el usuario para identificar de forma única el índice implementado. Debe empezar por una letra y solo puede contener letras, números o guiones bajos. Consulta las directrices de formato de DeployedIndex.id.
- DEPLOYED_INDEX_NAME: nombre visible del índice implementado.
- INDEX_ID: ID del índice.
- MIN_REPLICA_COUNT: número mínimo de réplicas de la máquina en las que se desplegará siempre el índice desplegado. Si se especifica, el valor debe ser igual o superior a 1.
- MAX_REPLICA_COUNT: número máximo de réplicas de la máquina en las que se puede implementar el índice.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
Ejecuta el siguiente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --display-name=DEPLOYED_INDEX_NAME \ --index=INDEX_ID \ --min-replica-count=MIN_REPLICA_COUNT \ --max-replica-count=MAX_REPLICA_COUNT \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --display-name=DEPLOYED_INDEX_NAME ` --index=INDEX_ID ` --min-replica-count=MIN_REPLICA_COUNT ` --max-replica-count=MAX_REPLICA_COUNT ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --display-name=DEPLOYED_INDEX_NAME ^ --index=INDEX_ID ^ --min-replica-count=MIN_REPLICA_COUNT ^ --max-replica-count=MAX_REPLICA_COUNT ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- INDEX_ENDPOINT_ID: ID del endpoint de índice.
- DEPLOYED_INDEX_ID: cadena especificada por el usuario para identificar de forma única el índice implementado. Debe empezar por una letra y solo puede contener letras, números o guiones bajos. Consulta las directrices de formato de DeployedIndex.id.
- DEPLOYED_INDEX_NAME: nombre visible del índice implementado.
- INDEX_ID: ID del índice.
- MIN_REPLICA_COUNT: número mínimo de réplicas de la máquina en las que se desplegará siempre el índice desplegado. Si se especifica, el valor debe ser igual o superior a 1.
- MAX_REPLICA_COUNT: número máximo de réplicas de la máquina en las que se puede implementar el índice.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
- PROJECT_NUMBER: el número de proyecto que se genera automáticamente.
Método HTTP y URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:deployIndex
Cuerpo JSON de la solicitud:
{ "deployedIndex": { "id": "DEPLOYED_INDEX_ID", "index": "projects/PROJECT_NUMBER/locations/LOCATION/indexes/INDEX_ID", "displayName": "DEPLOYED_INDEX_NAME", "automaticResources": { "minReplicaCount": MIN_REPLICA_COUNT, "maxReplicaCount": MAX_REPLICA_COUNT } } }
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeployIndexOperationMetadata", "genericMetadata": { "createTime": "2023-10-19T17:53:16.502088Z", "updateTime": "2023-10-19T17:53:16.502088Z" }, "deployedIndexId": "DEPLOYED_INDEX_ID" } }
Python
Para saber cómo instalar o actualizar el SDK de Vertex AI para Python, consulta Instalar el SDK de Vertex AI para Python. Para obtener más información, consulta la documentación de referencia de la API Python.
Consola
Solo puedes habilitar el autoescalado desde la consola durante la implementación del índice.
- En la sección Vertex AI de la Google Cloud consola, ve a la sección Desplegar y usar. Selecciona Vector Search.
- Se muestra una lista de tus índices activos.
- Selecciona el nombre del índice que quieras implementar. Se abrirá la página de detalles del índice.
- En la página de detalles del índice, haz clic en Implementar en endpoint. Se abrirá el panel de implementación de índices.
- Introduce un nombre visible. Este nombre actúa como un ID y no se puede actualizar.
- En el menú desplegable Endpoint, selecciona el endpoint en el que quieras implementar este índice. Nota: El endpoint no está disponible si el índice ya se ha implementado en él.
- Opcional: En el campo Tipo de máquina, selecciona Estándar o Alta memoria.
- Opcional. Selecciona Habilitar el autoescalado para cambiar automáticamente el tamaño del número de nodos en función de las demandas de tus cargas de trabajo. El número predeterminado de réplicas es 2 si el autoescalado está inhabilitado.
- Si no se definen
minReplicaCount
nimaxReplicaCount
, se les asigna el valor 2 de forma predeterminada. - Si solo se define
maxReplicaCount
,minReplicaCount
se define como 2 de forma predeterminada. - Si solo se define
minReplicaCount
,maxReplicaCount
se define como igual aminReplicaCount
.
Modificar un DeployedIndex
Puedes usar la API MutateDeployedIndex
para actualizar los recursos de implementación (por ejemplo, minReplicaCount
y maxReplicaCount
) de un índice que ya se haya implementado.
- Los usuarios no pueden cambiar el
machineType
después de que se haya implementado el índice. - Si no se especifica
maxReplicaCount
en la solicitud,DeployedIndex
sigue usando el valor demaxReplicaCount
que ya tenía.
gcloud
En el siguiente ejemplo se usa el comando gcloud ai index-endpoints mutate-deployed-index
.
Antes de usar los datos de los comandos que se indican a continuación, haz los siguientes cambios:
- INDEX_ENDPOINT_ID: ID del endpoint de índice.
- DEPLOYED_INDEX_ID: cadena especificada por el usuario para identificar de forma única el índice implementado. Debe empezar por una letra y solo puede contener letras, números o guiones bajos. Consulta las directrices de formato de DeployedIndex.id.
- MIN_REPLICA_COUNT: número mínimo de réplicas de la máquina en las que se desplegará siempre el índice desplegado. Si se especifica, el valor debe ser igual o superior a 1.
- MAX_REPLICA_COUNT: número máximo de réplicas de la máquina en las que se puede implementar el índice.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
Ejecuta el siguiente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints mutate-deployed-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --min-replica-count=MIN_REPLICA_COUNT \ --max-replica-count=MAX_REPLICA_COUNT \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints mutate-deployed-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --min-replica-count=MIN_REPLICA_COUNT ` --max-replica-count=MAX_REPLICA_COUNT ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints mutate-deployed-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --min-replica-count=MIN_REPLICA_COUNT ^ --max-replica-count=MAX_REPLICA_COUNT ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- INDEX_ENDPOINT_ID: ID del endpoint de índice.
- DEPLOYED_INDEX_ID: cadena especificada por el usuario para identificar de forma única el índice implementado. Debe empezar por una letra y solo puede contener letras, números o guiones bajos. Consulta las directrices de formato de DeployedIndex.id.
- MIN_REPLICA_COUNT: número mínimo de réplicas de la máquina en las que se desplegará siempre el índice desplegado. Si se especifica, el valor debe ser igual o superior a 1.
- MAX_REPLICA_COUNT: número máximo de réplicas de la máquina en las que se puede implementar el índice.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
- PROJECT_NUMBER: el número de proyecto que se genera automáticamente.
Método HTTP y URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:mutateDeployedIndex
Cuerpo JSON de la solicitud:
{ "deployedIndex": { "id": "DEPLOYED_INDEX_ID", "index": "projects/PROJECT_ID/locations/LOCATION/indexes/INDEX_ID", "displayName": "DEPLOYED_INDEX_NAME", "min_replica_count": "MIN_REPLICA_COUNT", "max_replica_count": "MAX_REPLICA_COUNT" } }
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeployIndexOperationMetadata", "genericMetadata": { "createTime": "2020-10-19T17:53:16.502088Z", "updateTime": "2020-10-19T17:53:16.502088Z" }, "deployedIndexId": "DEPLOYED_INDEX_ID" } }
Terraform
Para saber cómo aplicar o quitar una configuración de Terraform, consulta Comandos básicos de Terraform. Para obtener más información, consulta la documentación de referencia del proveedor Terraform.
Python
Para saber cómo instalar o actualizar el SDK de Vertex AI para Python, consulta Instalar el SDK de Vertex AI para Python. Para obtener más información, consulta la documentación de referencia de la API Python.
Ajustes de implementación que afectan al rendimiento
Los siguientes ajustes de implementación pueden afectar a la latencia, la disponibilidad y el coste al usar la búsqueda vectorial. Estas directrices se aplican a la mayoría de los casos. Sin embargo, siempre debes experimentar con tus configuraciones para asegurarte de que funcionan en tu caso práctico.
Ajuste | Impacto en el rendimiento |
---|---|
Tipo de máquina |
La selección de hardware interactúa directamente con el tamaño de fragmento seleccionado. En función de las opciones de partición que hayas especificado al crear el índice, cada tipo de máquina ofrece un equilibrio entre rendimiento y coste. Consulta la página de precios para determinar el hardware disponible y los precios. En general, el rendimiento aumenta en el siguiente orden:
|
Número mínimo de réplicas |
Si tienes cargas de trabajo que bajan a niveles bajos y, después, aumentan rápidamente a niveles más altos, te recomendamos que asignes a |
Número máximo de réplicas |
maxReplicaCount te permite controlar principalmente el coste del uso. Puedes evitar que los costes superen un umbral determinado, pero a cambio se aumentará la latencia y se reducirá la disponibilidad.
|
Lista IndexEndpoints
Para enumerar tus recursos de IndexEndpoint
y ver la información de las instancias de DeployedIndex
asociadas, ejecuta el siguiente código:
gcloud
En el siguiente ejemplo se usa el comando gcloud ai index-endpoints list
.
Antes de usar los datos de los comandos que se indican a continuación, haz los siguientes cambios:
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
Ejecuta el siguiente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints list \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints list ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints list ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
- PROJECT_NUMBER: el número de proyecto que se genera automáticamente.
Método HTTP y URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
{ "indexEndpoints": [ { "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID", "displayName": "INDEX_ENDPOINT_DISPLAY_NAME", "deployedIndexes": [ { "id": "DEPLOYED_INDEX_ID", "index": "projects/PROJECT_NUMBER/locations/LOCATION/indexes/INDEX_ID", "displayName": "DEPLOYED_INDEX_DISPLAY_NAME", "createTime": "2021-06-04T02:23:40.178286Z", "privateEndpoints": { "matchGrpcAddress": "GRPC_ADDRESS" }, "indexSyncTime": "2022-01-13T04:22:00.151916Z", "automaticResources": { "minReplicaCount": 2, "maxReplicaCount": 10 } } ], "etag": "AMEw9yP367UitPkLo-khZ1OQvqIK8Q0vLAzZVF7QjdZ5O3l7Zow-mzBo2l6xmiuuMljV", "createTime": "2021-03-17T04:47:28.460373Z", "updateTime": "2021-06-04T02:23:40.930513Z", "network": "VPC_NETWORK_NAME" } ] }
Python
Para saber cómo instalar o actualizar el SDK de Vertex AI para Python, consulta Instalar el SDK de Vertex AI para Python. Para obtener más información, consulta la documentación de referencia de la API Python.
Consola
Sigue estas instrucciones para ver una lista de tus endpoints de índice.
- En la sección Vertex AI de la Google Cloud consola, ve a la sección Desplegar y usar. Selecciona Vector Search.
- En la parte superior de la página, selecciona la pestaña Endpoint de índice.
- Se muestran todos los endpoints de índice.
Para obtener más información, consulta la documentación de referencia de IndexEndpoint
.
Anular el despliegue de un índice
Para retirar la implementación de un índice de un endpoint, ejecuta el siguiente código:
gcloud
En el siguiente ejemplo se usa el comando gcloud ai index-endpoints undeploy-index
.
Antes de usar los datos de los comandos que se indican a continuación, haz los siguientes cambios:
- INDEX_ENDPOINT_ID: ID del endpoint de índice.
- DEPLOYED_INDEX_ID: cadena especificada por el usuario para identificar de forma única el índice implementado. Debe empezar por una letra y solo puede contener letras, números o guiones bajos. Consulta las directrices de formato de DeployedIndex.id.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
Ejecuta el siguiente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints undeploy-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints undeploy-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints undeploy-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- INDEX_ENDPOINT_ID: ID del endpoint de índice.
- DEPLOYED_INDEX_ID: cadena especificada por el usuario para identificar de forma única el índice implementado. Debe empezar por una letra y solo puede contener letras, números o guiones bajos. Consulta las directrices de formato de DeployedIndex.id.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
- PROJECT_NUMBER: el número de proyecto que se genera automáticamente.
Método HTTP y URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:undeployIndex
Cuerpo JSON de la solicitud:
{ "deployed_index_id": "DEPLOYED_INDEX_ID" }
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.UndeployIndexOperationMetadata", "genericMetadata": { "createTime": "2022-01-13T04:09:56.641107Z", "updateTime": "2022-01-13T04:09:56.641107Z" } } }
Python
Para saber cómo instalar o actualizar el SDK de Vertex AI para Python, consulta Instalar el SDK de Vertex AI para Python. Para obtener más información, consulta la documentación de referencia de la API Python.
Consola
Sigue estas instrucciones para retirar un índice de un endpoint.
- En la sección Vertex AI de la Google Cloud consola, ve a la sección Desplegar y usar. Selecciona Vector Search.
- Se muestra una lista de tus índices activos.
- Selecciona el índice que quieras retirar. Se abrirá la página de detalles del índice.
- En la sección Índices implementados, busca la versión del índice que quieras retirar.
- Haz clic en el menú de opciones que se encuentra en la misma fila que el índice y selecciona Desactivar.
- Se abrirá una pantalla de confirmación. Haz clic en Desplegar. Nota: El proceso de retirada puede tardar hasta 30 minutos.
Eliminar un IndexEndpoint
Antes de eliminar un IndexEndpoint
, debes undeploy todos los índices que se hayan desplegado en el endpoint.
gcloud
En el siguiente ejemplo se usa el comando gcloud ai index-endpoints delete
.
Antes de usar los datos de los comandos que se indican a continuación, haz los siguientes cambios:
- INDEX_ENDPOINT_ID: ID del endpoint de índice.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
Ejecuta el siguiente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints delete INDEX_ENDPOINT_ID \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints delete INDEX_ENDPOINT_ID ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints delete INDEX_ENDPOINT_ID ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- INDEX_ENDPOINT_ID: ID del endpoint de índice.
- LOCATION: la región en la que usas Vertex AI.
- PROJECT_ID: tu Google Cloud ID de proyecto.
- PROJECT_NUMBER: el número de proyecto que se genera automáticamente.
Método HTTP y URL:
DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID
Para enviar tu solicitud, despliega una de estas opciones:
Deberías recibir una respuesta JSON similar a la siguiente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeleteOperationMetadata", "genericMetadata": { "createTime": "2022-01-13T04:36:19.142203Z", "updateTime": "2022-01-13T04:36:19.142203Z" } }, "done": true, "response": { "@type": "type.googleapis.com/google.protobuf.Empty" } }
Python
Para saber cómo instalar o actualizar el SDK de Vertex AI para Python, consulta Instalar el SDK de Vertex AI para Python. Para obtener más información, consulta la documentación de referencia de la API Python.
Consola
Sigue estas instrucciones para eliminar un endpoint de índice.
- En la sección Vertex AI de la Google Cloud consola, ve a la sección Desplegar y usar. Selecciona Vector Search.
- En la parte superior de la página, selecciona la pestaña Endpoint de índice.
- Se muestran todos los endpoints de índice.
- Haz clic en el menú de opciones que se encuentra en la misma fila que el índice que quieres eliminar y selecciona Eliminar.
- Se abrirá una pantalla de confirmación. Haz clic en Eliminar. El endpoint de índice se ha eliminado.