Private Service Connect consente il consumo privato di servizi su reti VPC appartenenti a gruppi, team, progetti o organizzazioni diversi. Puoi pubblicare e utilizzare servizi utilizzando indirizzi IP che che definisci e che sono interni alla tua rete VPC e, per Vector Search per eseguire ricerche di somiglianze vettoriali.
Abilitazione di Private Service Connect in una ricerca vettoriale questo endpoint è adatto per i casi d'uso che:
- Richiedere bassa latenza e una connessione sicura ai backend di servizio di ricerca vettoriale.
- Dispongono di spazio IP limitato per la prenotazione esclusiva del peering VPC.
- È necessario accedere ai backend di pubblicazione da più reti VPC utente.
Per saperne di più sulla configurazione di Private Service Connect, consulta Panoramica di Private Service Connect dal documentazione di Virtual Private Cloud (VPC).
Crea l'endpoint dell'indice
Per creare un endpoint con Private Service Connect abilitato, devi definirlo al momento della creazione. È un processo simile alla creazione di altre endpoint in Vertex AI.
PROJECT=<your-service-project>
VPC_PROJECT=<your-vpc-project>
REGION=us-central1
VERTEX_ENDPOINT=$REGION-aiplatform.googleapis.com
curl -H "Content-Type: application/json" \
-H "Authorization: Bearer `gcloud auth print-access-token`" \
https://$VERTEX_ENDPOINT/v1/projects/$PROJECT/locations/$REGION/indexEndpoints \
-d '{displayName: "<your-index-endpoint-name>", privateServiceConnectConfig:
{ enablePrivateServiceConnect: true, projectAllowlist: ["'$VPC_PROJECT'", "'$PROJECT'"] }}'
Informazioni sulle opzioni di deployment dell'indice
Puoi eseguire il deployment dell'indice con connettività dei servizi automatica o manuale.
- Esegui il deployment con l'automazione di Private Service Connect: configura un criterio di connessione del servizio ed esegui il deployment degli indici. La configurazione di un criterio di connessione al servizio consente di eseguire il deployment in una rete specifica senza dover creare ogni volta un indirizzo di calcolo e una regola di inoltro.
- Esegui il deployment con connessione manuale: esegui il deployment dell'indice e manualmente un indirizzo di computing e una regola di forwarding. Puoi scegliere questa opzione se devi utilizzare più indirizzi IP.
Esegui il deployment con l'automazione di Private Service Connect
Puoi configurare un criterio di connessione al servizio in modo da non dover creare manualmente un indirizzo di calcolo e una regola di inoltro dopo ogni deployment dell'indice.
- Innanzitutto, crea un criterio di connessione al servizio che specifichi la rete, la classe di servizio e la regione in cui eseguire il deployment degli indici. Si tratta di un configurazione una tantum. Se lo hai già fatto, vai alla procedura successiva.
- Esegui il deployment dell'indice.
Limitazioni
Automation consente un solo indirizzo IP per progetto per rete. Se devi utilizzare più indirizzi IP, consulta Eseguire il deployment manuale dell'indice.
Crea una policy di connessione al servizio
Per creare un criterio di connessione al servizio per l'automazione del deployment dell'indice, devi essere un amministratore di rete.
Per automatizzare il deployment dell'indice, segui questi passaggi:
Crea il criterio di connessione al servizio.
- PROJECT: il progetto di servizio in cui stai creando le risorse Vertex AI.
- VPC_PROJECT: il progetto in cui si trova il VPC del client. Per la configurazione di un singolo VPC, sarà uguale a $PROJECT. Per Configurazione del VPC condiviso, questo è il progetto host VPC.
-
NETWORK_NAME: il nome della rete in cui eseguire il deployment, nel formato
projects/
./global/networks/ - REGION: la regione della rete.
- PSC_SUBNETS: Private Service Connect una subnet da usare.
gcloud network-connectivity service-connection-policies create <policy_name> \ --project=<vpc_project> --network=<network_name> # in the format projects/<project_id>/global/networks/<network_name> \ --service-class=gcp-vertexai --region=<region> --subnets=<psc subnets>
Visualizza il criterio di connessione al servizio.
gcloud network-connectivity service-connection-policies list --project=<vpc_project> -–region=<region>
Esegui il deployment dell'indice
Esegui il deployment dell'indice.
- PROJECT: il progetto di servizio in cui stai creando le risorse Vertex AI.
-
VPC_PROJECT: il progetto in cui si trova il VPC del client. Per
configurazione VPC autonoma, è uguale a
$PROJECT
. Per la configurazione della VPC condivisa, è il progetto host VPC. -
NETWORK_NAME: il nome della rete in cui eseguire il deployment, nella
formato
projects/
./global/networks/ - REGION: la regione della rete.
- PSC_SUBNETS: la subnet Private Service Connect da utilizzare.
INDEX_ENDPOINT_ID=<> curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json; charset=utf-8" "https://REGIONAL_ENDPOINT.googleapis.com/v1/projects/PROJECT_NUMBER/locations/REGION/indexEndpoints/INDEX_ENDPOINT_ID:deployIndex" -d '{ "deployedIndex": { "id": "DEPLOYED_INDEX_ID", "index": "projects/PROJECT_NUMBER/locations/us-central1/indexes/INDEX_ID", "displayName": "DISPLAY_NAME", "psc_automation_configs": [ {"project_id": "PROJECT_ID_1", "network": "NETWORK_1"}, {"project_id": "PROJECT_ID_2", "network": "NETWORK_2" }] } }'
Elimina il criterio di connessione al servizio
Se devi eliminare il criterio di connessione al servizio, esegui questo comando:
gcloud network-connectivity service-connection-policies delete --project=<vpc_project> –-region=<region> <policy_name>
Esegui il deployment con connessione manuale
Esegui il deployment dell'indice e crea una regola di forwarding nel tuo progetto VPC.
Esegui il deployment dell'indice
Ora che l'indice è pronto, in questo passaggio lo esegui nell'endpoint che hai creato con Private Service Connect abilitato.
gcloud
Questo esempio utilizza la classegcloud ai index-endpoints deploy-index
un comando kubectl.
Prima di utilizzare uno qualsiasi dei dati di comando riportati di seguito, effettua le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint indice.
- DEPLOYED_INDEX_ID: una stringa specificata dall'utente per identificare in modo univoco l'indice di cui è stato eseguito il deployment. Deve iniziare con una lettera e contenere solo lettere, numeri o trattini bassi. Consulta DeployedIndex.id per le linee guida sul formato.
- DEPLOYED_INDEX_ENDPOINT_NAME: nome visualizzato dell'endpoint dell'indice di cui è stato eseguito il deployment.
- INDEX_ID: l'ID dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo ID progetto Google Cloud.
Esegui il seguente comando:
Linux, macOS o Cloud Shell
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID \ --deployed-index-id=DEPLOYED_INDEX_ID \ --display-name=DEPLOYED_INDEX_ENDPOINT_NAME \ --index=INDEX_ID \ --region=LOCATION \ --project=PROJECT_ID
Windows (PowerShell)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ` --deployed-index-id=DEPLOYED_INDEX_ID ` --display-name=DEPLOYED_INDEX_ENDPOINT_NAME ` --index=INDEX_ID ` --region=LOCATION ` --project=PROJECT_ID
Windows (cmd.exe)
gcloud ai index-endpoints deploy-index INDEX_ENDPOINT_ID ^ --deployed-index-id=DEPLOYED_INDEX_ID ^ --display-name=DEPLOYED_INDEX_ENDPOINT_NAME ^ --index=INDEX_ID ^ --region=LOCATION ^ --project=PROJECT_ID
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- INDEX_ENDPOINT_ID: l'ID dell'endpoint indice.
- DEPLOYED_INDEX_ID: una stringa specificata dall'utente per identificare in modo univoco l'indice di cui è stato eseguito il deployment. Deve iniziare con una lettera e contenere solo lettere, numeri o trattini bassi. Consulta DeployedIndex.id per le linee guida sul formato.
- DEPLOYED_INDEX_ENDPOINT_NAME: nome visualizzato dell'endpoint dell'indice di cui è stato eseguito il deployment.
- INDEX_ID: l'ID dell'indice.
- LOCATION: la regione in cui utilizzi Vertex AI.
- PROJECT_ID: il tuo ID progetto Google Cloud.
- PROJECT_NUMBER: il numero di progetto generato automaticamente per il tuo progetto.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID:deployIndex
Corpo JSON della richiesta:
{ "deployedIndex": { "id": "DEPLOYED_INDEX_ID", "index": "projects/PROJECT_ID/locations/LOCATION/indexes/INDEX_ID", "displayName": "DEPLOYED_INDEX_ENDPOINT_NAME" } }
Per inviare la richiesta, espandi una delle seguenti opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/indexEndpoints/INDEX_ENDPOINT_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.DeployIndexOperationMetadata", "genericMetadata": { "createTime": "2022-10-19T17:53:16.502088Z", "updateTime": "2022-10-19T17:53:16.502088Z" }, "deployedIndexId": "DEPLOYED_INDEX_ID" } }
Console
Utilizza queste istruzioni per eseguire il deployment del tuo indice.
- Nella sezione Vertex AI della console Google Cloud, vai alla sezione Esegui il deployment e utilizza. Seleziona Ricerca vettoriale.
- Viene visualizzato un elenco degli indici attivi.
- Seleziona il nome dell'indice di cui vuoi eseguire il deployment. Si apre la pagina dei dettagli dell'indice.
- Dalla pagina dei dettagli dell'indice, fai clic su . Deployment su endpoint. Viene visualizzato il riquadro di implementazione dell'indice.
- Inserisci un nome visualizzato, che funge da ID e non può essere aggiornato.
- Dal menu a discesa Endpoint, seleziona l'endpoint in cui vuoi eseguire il deployment di questo indice. Nota: l'endpoint non è disponibile se è già stato eseguito il deployment dell'indice.
- (Facoltativo) Nel campo Tipo di macchina, seleziona Standard o con memoria elevata.
- Facoltativo. Seleziona Attiva la scalabilità automatica per ridimensionare automaticamente il numero di nodi in base alle esigenze dei tuoi carichi di lavoro. Il numero predefinito di repliche è 2 se la scalabilità automatica è disabilitata.
- Fai clic su Esegui il deployment per eseguire il deployment dell'indice nell'endpoint. Nota: il deployment richiede circa 30 minuti.
Crea una regola di inoltro nel progetto VPC
Al termine del deployment dell'indice, l'endpoint dell'indice restituisce un URI di allegato del servizio anziché un indirizzo IP. Devi creare un indirizzo di computing e una regola di forwarding nel Progetto VPC che ha come target il collegamento al servizio utilizzando l'indirizzo di computing creato. Per creare un indirizzo di computing, usa l'esempio seguente:
gcloud compute addresses create ${ADDRESS_NAME:?} \
--region=${REGION:?} \
--subnet=${SUBNET_NAME:?} \
--project=${VPC_PROJECT:?}
Per creare una regola di inoltro che abbia come target l'URI del collegamento a un servizio utilizzando l'indirizzo di calcolo creato, utilizza il seguente esempio:
SERVICE_ATTACHMENT_URI=`gcloud ai index-endpoints describe {INDEX_ENDPOINT_ID}
--format="value(deployedIndexes.privateEndpoints.serviceAttachment)"`
gcloud compute forwarding-rules create ${ENDPOINT_NAME:?} \
--network=${NETWORK_NAME:?} \
--address=${ADDRESS_NAME:?} \
--target-service-attachment=${SERVICE_ATTACHMENT_URI:?} \
--project=${VPC_PROJECT:?} \
--region=${REGION:?}
(Facoltativo) Crea il record DNS per l'indirizzo IP
Se vuoi connetterti e caricare senza memorizzare l'indirizzo IP effettivo, puoi per creare un record DNS. Questo passaggio è facoltativo.
DNS_NAME_SUFFIX=matchingengine.vertexai.goog. # Don't forget the "." in the end.
DNS_NAME=${INDEX_ENDPOINT_ID:?}.${REGION:?}.${DNS_NAME_SUFFIX:?}
gcloud dns managed-zones create ${DNS_ZONE_NAME:?} \
--dns-name=${DNS_NAME_SUFFIX:?} \
--visibility=private \
--project=${VPC_PROJECT:?} \
--region=${REGION:?}
gcloud dns record-sets create ${DNS_NAME:?} \
--rrdatas=${IP_ADDRESS:?} \
--type=A --ttl=60 \
--zone=${DNS_ZONE_NAME:?} \
--project=${VPC_PROJECT:?} \
--region=${REGION:?}
Invia query all'endpoint dell'indice
Ora che hai creato un endpoint con Private Service Connect e l'indice, puoi iniziare a eseguire query.
Per eseguire query sull'indice, vedi Eseguire query sugli indici per ottenere i vicini più prossimi.
Passaggi successivi
- Scopri come aggiornare e ricostruire l'indice
- Scopri come monitorare l'endpoint dell'indice