Prima di poter eseguire query su un indice, devi completare alcuni passaggi:
- Crea un
IndexEndpoint
, se necessario, o riutilizzane uno esistente.IndexEndpoint
- Recupera l'ID
IndexEndpoint
. - Esegui il deployment dell'indice in
IndexEndpoint
.
Crea un IndexEndpoint
gcloud
Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:
- INDEX_ENDPOINT_NAME: nome visualizzato dell'endpoint dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
Esegui il seguente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints create \ --display-name=INDEX_ENDPOINT_NAME \ --public-endpoint-enabled \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints create ` --display-name=INDEX_ENDPOINT_NAME ` --public-endpoint-enabled ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints create ^ --display-name=INDEX_ENDPOINT_NAME ^ --public-endpoint-enabled ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- INDEX_ENDPOINT_NAME: nome visualizzato dell'endpoint dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
- PROJECT_NUMBER: il numero del progetto generato automaticamente.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints
Corpo JSON della richiesta:
{ "display_name": "INDEX_ENDPOINT_NAME", "publicEndpointEnabled": "true" }
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.CreateIndexEndpointOperationMetadata", "genericMetadata": { "createTime": "2022-01-13T04:09:56.641107Z", "updateTime": "2022-01-13T04:09:56.641107Z" } } }
"done": true
.
Terraform
L'esempio seguente utilizza la risorsa Terraform vertex_ai_index_endpoint
per creare un endpoint indice.
Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI per Python, consulta Installare l'SDK Vertex AI per Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Console
Segui queste istruzioni per creare un endpoint indice.
- Nella sezione Vertex AI della console Google Cloud, vai alla sezione Esegui il deployment e utilizza. Seleziona Ricerca vettoriale.
- Viene visualizzato un elenco degli indici attivi.
- Nella parte superiore della pagina, seleziona la scheda Endpoint dell'indice. Vengono visualizzati gli endpoint dell'indice.
- Fai clic su Crea nuovo endpoint indice. Viene visualizzato il riquadro Crea un nuovo endpoint indice.
- Inserisci un nome visualizzato per l'endpoint indice.
- Nel campo Regione, seleziona una regione dal menu a discesa.
- Nel campo Accesso, seleziona Standard.
- Fai clic su Crea.
Eseguire il deployment di un indice in un endpoint
gcloud
In questo esempio viene utilizzato il comando gcloud ai index-endpoints deploy-index
.
Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint dell'indice.
- DEPLOYED_INDEX_ID: una stringa specificata dall'utente per identificare in modo univoco l'indice di cui è stato eseguito il deployment. Deve iniziare con una lettera e contenere solo lettere, numeri o trattini bassi. Per le linee guida sul formato, consulta DeployedIndex.id.
- DEPLOYED_INDEX_ENDPOINT_NAME: nome visualizzato dell'endpoint dell'indice di cui è stato eseguito il deployment.
- INDEX_ID: l'ID dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
Esegui il seguente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --display-name=DEPLOYED_INDEX_ENDPOINT_NAME \ --index=INDEX_ID \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --display-name=DEPLOYED_INDEX_ENDPOINT_NAME ` --index=INDEX_ID ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --display-name=DEPLOYED_INDEX_ENDPOINT_NAME ^ --index=INDEX_ID ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint dell'indice.
- DEPLOYED_INDEX_ID: una stringa specificata dall'utente per identificare in modo univoco l'indice di cui è stato eseguito il deployment. Deve iniziare con una lettera e contenere solo lettere, numeri o trattini bassi. Consulta DeployedIndex.id per le linee guida sul formato.
- DEPLOYED_INDEX_ENDPOINT_NAME: nome visualizzato dell'endpoint dell'indice di cui è stato eseguito il deployment.
- INDEX_ID: l'ID dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
- PROJECT_NUMBER: il numero del progetto generato automaticamente.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:deployIndex
Corpo JSON della richiesta:
{ "deployedIndex": { "id": "DEPLOYED_INDEX_ID", "index": "projects/PROJECT_ID/locations/LOCATION/indexes/INDEX_ID", "displayName": "DEPLOYED_INDEX_ENDPOINT_NAME" } }
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeployIndexOperationMetadata", "genericMetadata": { "createTime": "2022-10-19T17:53:16.502088Z", "updateTime": "2022-10-19T17:53:16.502088Z" }, "deployedIndexId": "DEPLOYED_INDEX_ID" } }
Terraform
L'esempio seguente utilizza la risorsa Terraform vertex_ai_index_endpoint_deployed_index
per creare un endpoint indice di cui è stato eseguito il deployment.
Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI per Python, consulta Installare l'SDK Vertex AI per Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Console
Segui queste istruzioni per eseguire il deployment dell'indice in un endpoint.
- Nella sezione Vertex AI della console Google Cloud, vai alla sezione Esegui il deployment e utilizza. Seleziona Ricerca vettoriale.
- Viene visualizzato un elenco degli indici attivi.
- Seleziona il nome dell'indice di cui vuoi eseguire il deployment. Viene visualizzata la pagina dei dettagli dell'indice.
- Nella pagina dei dettagli dell'indice, fai clic su Esegui il deployment nell'endpoint. Viene visualizzato il riquadro di implementazione dell'indice.
- Inserisci un nome visualizzato. Questo nome funge da ID e non può essere aggiornato.
- Dal menu a discesa Endpoint, seleziona l'endpoint in cui vuoi eseguire il deployment di questo indice. Nota: l'endpoint non è disponibile se l'indice è già stato implementato.
- (Facoltativo) Nel campo Tipo di macchina, seleziona standard o memoria elevata.
- Facoltativo. Seleziona Attiva la scalabilità automatica per ridimensionare automaticamente il numero di nodi in base alle esigenze dei tuoi carichi di lavoro. Il numero predefinito di repliche è 2 se la scalabilità automatica è disabilitata.
- Fai clic su Esegui il deployment per eseguire il deployment dell'indice nell'endpoint. Nota: il deployment richiede circa 30 minuti.
Ottieni il nome di dominio dell'indice
Dopo il deployment dell'indice, devi disporre del nome di dominio per poterlo utilizzare per una query online. Il valore è disponibile in
publicEndpointDomainName
.
curl -H "Content-Type: application/json" -H "Authorization: Bearer `gcloud auth print-access-token`" ${ENDPOINT}/v1/projects/${PROJECT_ID}/locations/${REGION}/indexEndpoints/${INDEX_ENDPOINT_ID}
Risposta di esempio
{
"name": "projects/181224308459/locations/us-central1/indexEndpoints/3370566089086861312",
"displayName": "public-endpoint-test1",
"deployedIndexes": [
{
"id": "test_index_public1",
"index": "projects/181224308459/locations/us-central1/indexes/7733428228102029312",
"displayName": "test_index_public1",
"createTime": "2023-02-08T23:19:58.026843Z",
"indexSyncTime": "2023-02-09T05:26:19.309417Z",
"automaticResources": {
"minReplicaCount": 2,
"maxReplicaCount": 2
},
"deploymentGroup": "default"
}
],
"etag": "AMEw9yNkXQcSke8iqW9SYxfhj_hT9GCwPt1XlxVwJRSCxiXOYnG4CKrZM_X0oH-XN8tR",
"createTime": "2023-02-08T22:44:20.285382Z",
"updateTime": "2023-02-08T22:44:26.515162Z",
"publicEndpointDomainName": "1957880287.us-central1-181224308459.vdb.vertexai.goog"
}
Abilita scalabilità automatica
Ricerca di vettori supporta la scalabilità automatica, che può ridimensionare automaticamente il numero di nodi in base alle esigenze dei carichi di lavoro. Quando la domanda è elevata, vengono aggiunti nodi al pool di nodi, che non supereranno la dimensione massima che hai specificato. Quando la domanda è bassa, il pool di nodi si riduce nuovamente a una dimensione minima che hai specificato. Puoi controllare i nodi effettivamente in uso e le modifiche monitorando le repliche attuali.
Per attivare la scalabilità automatica, specifica maxReplicaCount
e
minReplicaCount
quando esegui il deployment dell'indice:
gcloud
L'esempio seguente utilizza il comando gcloud ai index-endpoints deploy-index
.
Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint dell'indice.
- DEPLOYED_INDEX_ID: una stringa specificata dall'utente per identificare in modo univoco l'indice di cui è stato eseguito il deployment. Deve iniziare con una lettera e contenere solo lettere, numeri o trattini bassi. Per le linee guida sul formato, consulta DeployedIndex.id.
- DEPLOYED_INDEX_NAME: nome visualizzato dell'indice di cui è stato eseguito il deployment.
- INDEX_ID: l'ID dell'indice.
- MIN_REPLICA_COUNT: numero minimo di repliche della macchina in cui verrà sempre eseguito il deployment dell'indice. Se specificato, il valore deve essere maggiore o uguale a 1.
- MAX_REPLICA_COUNT: numero massimo di repliche della macchina in cui è possibile eseguire il deployment dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
Esegui il seguente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --display-name=DEPLOYED_INDEX_NAME \ --index=INDEX_ID \ --min-replica-count=MIN_REPLICA_COUNT \ --max-replica-count=MAX_REPLICA_COUNT \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --display-name=DEPLOYED_INDEX_NAME ` --index=INDEX_ID ` --min-replica-count=MIN_REPLICA_COUNT ` --max-replica-count=MAX_REPLICA_COUNT ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --display-name=DEPLOYED_INDEX_NAME ^ --index=INDEX_ID ^ --min-replica-count=MIN_REPLICA_COUNT ^ --max-replica-count=MAX_REPLICA_COUNT ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint dell'indice.
- DEPLOYED_INDEX_ID: una stringa specificata dall'utente per identificare in modo univoco l'indice di cui è stato eseguito il deployment. Deve iniziare con una lettera e contenere solo lettere, numeri o trattini bassi. Consulta DeployedIndex.id per le linee guida sul formato.
- DEPLOYED_INDEX_NAME: nome visualizzato dell'indice di cui è stato eseguito il deployment.
- INDEX_ID: l'ID dell'indice.
- MIN_REPLICA_COUNT: numero minimo di repliche della macchina in cui verrà sempre eseguito il deployment dell'indice. Se specificato, il valore deve essere maggiore o uguale a 1.
- MAX_REPLICA_COUNT: numero massimo di repliche della macchina in cui è possibile eseguire il deployment dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
- PROJECT_NUMBER: il numero del progetto generato automaticamente.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:deployIndex
Corpo JSON della richiesta:
{ "deployedIndex": { "id": "DEPLOYED_INDEX_ID", "index": "projects/PROJECT_NUMBER/locations/LOCATION/indexes/INDEX_ID", "displayName": "DEPLOYED_INDEX_NAME", "automaticResources": { "minReplicaCount": MIN_REPLICA_COUNT, "maxReplicaCount": MAX_REPLICA_COUNT } } }
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeployIndexOperationMetadata", "genericMetadata": { "createTime": "2023-10-19T17:53:16.502088Z", "updateTime": "2023-10-19T17:53:16.502088Z" }, "deployedIndexId": "DEPLOYED_INDEX_ID" } }
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI per Python, consulta Installare l'SDK Vertex AI per Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Console
Puoi attivare la scalabilità automatica dalla console solo durante il deployment dell'indice.
- Nella sezione Vertex AI della console Google Cloud, vai alla sezione Esegui il deployment e utilizza. Seleziona Ricerca vettoriale.
- Viene visualizzato un elenco degli indici attivi.
- Seleziona il nome dell'indice di cui vuoi eseguire il deployment. Viene visualizzata la pagina dei dettagli dell'indice.
- Nella pagina dei dettagli dell'indice, fai clic su Esegui il deployment nell'endpoint. Viene visualizzato il riquadro di implementazione dell'indice.
- Inserisci un nome visualizzato. Questo nome funge da ID e non può essere aggiornato.
- Dal menu a discesa Endpoint, seleziona l'endpoint in cui vuoi eseguire il deployment di questo indice. Nota: l'endpoint non è disponibile se l'indice è già stato implementato.
- (Facoltativo) Nel campo Tipo di macchina, seleziona standard o memoria elevata.
- Facoltativo. Seleziona Attiva la scalabilità automatica per ridimensionare automaticamente il numero di nodi in base alle esigenze dei tuoi carichi di lavoro. Il numero predefinito di repliche è 2 se la scalabilità automatica è disabilitata.
- Se non vengono impostati né
minReplicaCount
némaxReplicaCount
, per impostazione predefinita vengono impostati su 2. - Se è impostato solo
maxReplicaCount
,minReplicaCount
viene impostato su 2 per impostazione predefinita. - Se è impostato solo
minReplicaCount
,maxReplicaCount
viene impostato suminReplicaCount
.
Mutare un DeployedIndex
Puoi utilizzare l'API MutateDeployedIndex
per aggiornare le risorse di deployment
(ad esempio minReplicaCount
e maxReplicaCount
) di un indice già di cui è stato eseguito il deployment.
- Gli utenti non sono autorizzati a modificare
machineType
dopo il deployment dell'indice. - Se
maxReplicaCount
non è specificato nella richiesta,DeployedIndex
continua a utilizzare il valoremaxReplicaCount
esistente.
gcloud
L'esempio seguente utilizza il comando gcloud ai index-endpoints mutate-deployed-index
.
Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint dell'indice.
- DEPLOYED_INDEX_ID: una stringa specificata dall'utente per identificare in modo univoco l'indice di cui è stato eseguito il deployment. Deve iniziare con una lettera e contenere solo lettere, numeri o trattini bassi. Consulta DeployedIndex.id per le linee guida sul formato.
- MIN_REPLICA_COUNT: numero minimo di repliche della macchina in cui verrà sempre eseguito il deployment dell'indice. Se specificato, il valore deve essere maggiore o uguale a 1.
- MAX_REPLICA_COUNT: numero massimo di repliche della macchina in cui è possibile eseguire il deployment dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
Esegui il seguente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints mutate-deployed-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --min-replica-count=MIN_REPLICA_COUNT \ --max-replica-count=MAX_REPLICA_COUNT \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints mutate-deployed-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --min-replica-count=MIN_REPLICA_COUNT ` --max-replica-count=MAX_REPLICA_COUNT ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints mutate-deployed-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --min-replica-count=MIN_REPLICA_COUNT ^ --max-replica-count=MAX_REPLICA_COUNT ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint dell'indice.
- DEPLOYED_INDEX_ID: una stringa specificata dall'utente per identificare in modo univoco l'indice di cui è stato eseguito il deployment. Deve iniziare con una lettera e contenere solo lettere, numeri o trattini bassi. Consulta DeployedIndex.id per le linee guida sul formato.
- MIN_REPLICA_COUNT: numero minimo di repliche della macchina in cui verrà sempre eseguito il deployment dell'indice. Se specificato, il valore deve essere maggiore o uguale a 1.
- MAX_REPLICA_COUNT: numero massimo di repliche della macchina in cui è possibile eseguire il deployment dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
- PROJECT_NUMBER: il numero del progetto generato automaticamente.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:mutateDeployedIndex
Corpo JSON della richiesta:
{ "deployedIndex": { "id": "DEPLOYED_INDEX_ID", "index": "projects/PROJECT_ID/locations/LOCATION/indexes/INDEX_ID", "displayName": "DEPLOYED_INDEX_NAME", "min_replica_count": "MIN_REPLICA_COUNT", "max_replica_count": "MAX_REPLICA_COUNT" } }
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeployIndexOperationMetadata", "genericMetadata": { "createTime": "2020-10-19T17:53:16.502088Z", "updateTime": "2020-10-19T17:53:16.502088Z" }, "deployedIndexId": "DEPLOYED_INDEX_ID" } }
Terraform
Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base. Per ulteriori informazioni, consulta la Terraform documentazione di riferimento del provider.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI per Python, consulta Installare l'SDK Vertex AI per Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Impostazioni di deployment che influiscono sul rendimento
Le seguenti impostazioni di deployment possono influire su latenza, disponibilità e costo quando utilizzi la ricerca vettoriale. Queste indicazioni si applicano alla maggior parte dei casi. Tuttavia, fai sempre esperimenti con le configurazioni per assicurarti che funzionino per il tuo caso d'uso.
Impostazione | Impatto sulle prestazioni |
---|---|
Tipo di macchina |
La selezione dell'hardware ha un'interazione diretta con le dimensioni del frammento selezionate. A seconda delle scelte di shard specificate al momento della creazione dell'indice, ogni tipo di macchina offre un compromesso tra prestazioni e costi. Consulta la pagina dei prezzi per determinare l'hardware disponibile e i prezzi. In generale, il rendimento aumenta nel seguente ordine:
|
Numero minimo di repliche |
Se i tuoi carichi di lavoro scendono a livelli ridotti e poi aumentano rapidamente
a livelli più elevati, ti consigliamo di impostare |
Numero massimo di repliche |
maxReplicaCount ti consente principalmente di controllare il costo di utilizzo. Puoi scegliere di impedire l'aumento dei costi oltre una determinata soglia, con il compromesso di consentire un aumento della latenza e una riduzione della disponibilità.
|
Elenco IndexEndpoints
Per elencare le risorse IndexEndpoint
e visualizzare le informazioni di eventuali istanze DeployedIndex
associate, esegui il seguente codice:
gcloud
L'esempio seguente utilizza il comando gcloud ai index-endpoints list
.
Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
Esegui il seguente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints list \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints list ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints list ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
- PROJECT_NUMBER: il numero del progetto generato automaticamente.
Metodo HTTP e URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "indexEndpoints": [ { "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID", "displayName": "INDEX_ENDPOINT_DISPLAY_NAME", "deployedIndexes": [ { "id": "DEPLOYED_INDEX_ID", "index": "projects/PROJECT_NUMBER/locations/LOCATION/indexes/INDEX_ID", "displayName": "DEPLOYED_INDEX_DISPLAY_NAME", "createTime": "2021-06-04T02:23:40.178286Z", "privateEndpoints": { "matchGrpcAddress": "GRPC_ADDRESS" }, "indexSyncTime": "2022-01-13T04:22:00.151916Z", "automaticResources": { "minReplicaCount": 2, "maxReplicaCount": 10 } } ], "etag": "AMEw9yP367UitPkLo-khZ1OQvqIK8Q0vLAzZVF7QjdZ5O3l7Zow-mzBo2l6xmiuuMljV", "createTime": "2021-03-17T04:47:28.460373Z", "updateTime": "2021-06-04T02:23:40.930513Z", "network": "VPC_NETWORK_NAME" } ] }
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI per Python, consulta Installare l'SDK Vertex AI per Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Console
Segui queste istruzioni per visualizzare un elenco dei tuoi endpoint indice.
- Nella sezione Vertex AI della console Google Cloud, vai alla sezione Esegui il deployment e utilizza. Seleziona Ricerca vettoriale.
- Nella parte superiore della pagina, seleziona la scheda Endpoint dell'indice.
- Vengono visualizzati tutti gli endpoint dell'indice esistenti.
Per saperne di più, consulta la documentazione di riferimento per
IndexEndpoint
.
Annullare il deployment di un indice
Per annullare il deployment di un indice dall'endpoint, esegui il seguente codice:
gcloud
L'esempio seguente utilizza il comando gcloud ai index-endpoints undeploy-index
.
Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint dell'indice.
- DEPLOYED_INDEX_ID: una stringa specificata dall'utente per identificare in modo univoco l'indice di cui è stato eseguito il deployment. Deve iniziare con una lettera e contenere solo lettere, numeri o trattini bassi. Consulta DeployedIndex.id per le linee guida sul formato.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
Esegui il seguente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints undeploy-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints undeploy-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints undeploy-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint dell'indice.
- DEPLOYED_INDEX_ID: una stringa specificata dall'utente per identificare in modo univoco l'indice di cui è stato eseguito il deployment. Deve iniziare con una lettera e contenere solo lettere, numeri o trattini bassi. Per le linee guida sul formato, consulta DeployedIndex.id.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
- PROJECT_NUMBER: il numero del progetto generato automaticamente.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:undeployIndex
Corpo JSON della richiesta:
{ "deployed_index_id": "DEPLOYED_INDEX_ID" }
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.UndeployIndexOperationMetadata", "genericMetadata": { "createTime": "2022-01-13T04:09:56.641107Z", "updateTime": "2022-01-13T04:09:56.641107Z" } } }
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI per Python, consulta Installare l'SDK Vertex AI per Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Console
Segui queste istruzioni per annullare il deployment di un indice da un endpoint.
- Nella sezione Vertex AI della console Google Cloud, vai alla sezione Esegui il deployment e utilizza. Seleziona Ricerca vettoriale.
- Viene visualizzato un elenco degli indici attivi.
- Seleziona l'indice di cui vuoi annullare il deployment. Viene visualizzata la pagina dei dettagli dell'indice.
- Nella sezione Indici di cui è stato eseguito il deployment, identifica la versione dell'indice di cui vuoi annullare il deployment.
- Fai clic sul menu Opzioni nella stessa riga dell'indice e seleziona Esegui il rollback del deployment.
- Si apre una schermata di conferma. Fai clic su Annulla il deployment. Nota: il rollback può richiedere fino a 30 minuti.
Eliminare un IndexEndpoint
Prima di eliminare un IndexEndpoint
, devi eseguire il rollback di tutti gli indici di cui è stato eseguito il deployment nell'endpoint.
gcloud
L'esempio seguente utilizza il comando gcloud ai index-endpoints delete
.
Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
Esegui il seguente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints delete INDEX_ENDPOINT_ID \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints delete INDEX_ENDPOINT_ID ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints delete INDEX_ENDPOINT_ID ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo Google Cloud ID progetto.
- PROJECT_NUMBER: il numero del progetto generato automaticamente.
Metodo HTTP e URL:
DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeleteOperationMetadata", "genericMetadata": { "createTime": "2022-01-13T04:36:19.142203Z", "updateTime": "2022-01-13T04:36:19.142203Z" } }, "done": true, "response": { "@type": "type.googleapis.com/google.protobuf.Empty" } }
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI per Python, consulta Installare l'SDK Vertex AI per Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Console
Segui queste istruzioni per eliminare un endpoint indice.
- Nella sezione Vertex AI della console Google Cloud, vai alla sezione Esegui il deployment e utilizza. Seleziona Ricerca vettoriale.
- Nella parte superiore della pagina, seleziona la scheda Endpoint dell'indice.
- Vengono visualizzati tutti gli endpoint dell'indice esistenti.
- Fai clic sul menu Opzioni nella stessa riga dell'indice che vuoi eliminare e seleziona Elimina.
- Si apre una schermata di conferma. Fai clic su Elimina. L'endpoint dell'indice è stato eliminato.