Vertex AI RAG Engine è un componente della piattaforma Vertex AI per la Retrieval-Augmented Generation (RAG). Con RAG Engine, i modelli linguistici di grandi dimensioni (LLM) possono accedere e utilizzare i dati di fonti di conoscenza esterne, come documenti e database, per generare risposte più accurate e informative. Questo documento fornisce informazioni ed esempi per l'utilizzo dell'API RAG Engine e tratta i seguenti argomenti: Il seguente diagramma riassume il flusso di lavoro generale per l'utilizzo dell'API RAG Engine: Questa sezione descrive i parametri per la gestione di un corpus RAG. Per saperne di più, consulta Gestione del corpus. Le tabelle seguenti descrivono i parametri utilizzati per creare un corpus RAG. Opzioni del database vettoriale Puoi scegliere una delle seguenti opzioni di database vettoriale per il tuo corpus RAG. Corpo della richiesta Obbligatorio: Il nome visualizzato del corpus RAG. (Facoltativo) La descrizione del corpus RAG. (Facoltativo) Immutabile: Il nome della chiave CMEK utilizzata per criptare i dati inattivi correlati al corpus RAG. Questa chiave è applicabile solo all'opzione Formato: (Facoltativo) Immutabile: La configurazione per il database vettoriale. Questo campo è un oggetto (Facoltativo) La configurazione di Vertex AI Search. Formato: (Facoltativo) Immutabile: Il modello di embedding da utilizzare per il corpus RAG. Questo valore non può essere modificato dopo l'impostazione. Se lo lasci vuoto, viene utilizzato text-embedding-005 come modello di incorporamento predefinito. Questa tabella elenca i parametri utilizzati per aggiornare un corpus RAG. Corpo della richiesta
(Facoltativo) Il nuovo nome visualizzato del corpus RAG. (Facoltativo) La nuova descrizione del corpus RAG. Il nome dell'indice Pinecone. Puoi impostare questo campo se il tuo Il nome della risorsa dell'indice Vector Search. Puoi impostare questo campo se il tuo Formato: Il nome della risorsa dell'endpoint di indice Vector Search. Puoi impostare questo campo se il tuo Formato: Il nome risorsa completo del secret in Secret Manager che contiene la chiave API Pinecone. Formato:
Parametri di gestione del corpus
Crea un corpus RAG
Opzione di database vettoriale
Descrizione
Caso d'uso
rag_managed_db
Un database vettoriale serverless completamente gestito fornito da Vertex AI. Questa è l'opzione predefinita.
Consigliato se vuoi una soluzione semplice e integrata senza gestire la tua infrastruttura di database vettoriale.
pinecone
Integrazione con un database vettoriale Pinecone autogestito. Richiede di fornire il nome dell'indice Pinecone e la chiave API.
Utilizza questa opzione se hai già una configurazione Pinecone esistente o preferisci le sue funzionalità specifiche.
vertex_vector_search
Integrazione con la ricerca vettoriale. Richiede la fornitura dei nomi delle risorse dell'indice e dell'endpoint indice.
Utilizza questa opzione se hai bisogno di una soluzione di ricerca vettoriale scalabile e ad alte prestazioni all'interno dell'ecosistema Google Cloud.
Parametri
display_name
string
description
string
encryption_spec
string
RagManaged
per il database vettoriale. Questo campo può essere impostato solo durante la creazione del corpus.projects/{project}/locations/{location}/keyRings/{key_ring}/cryptoKeys/{key_name}
vector_db_config
vectorDbConfig
oneof
. Scegli una delle opzioni seguenti:
rag_managed_db
: il database vettoriale predefinito completamente gestito.pinecone
: specifica l'istanza Pinecone.
index_name
(string
): il nome dell'indice Pinecone. Puoi impostarlo in un secondo momento con una chiamata all'UpdateRagCorpus
.api_auth.api_key_config.api_key_secret_version
(string
): il nome completo della risorsa del secret in Secret Manager che contiene la chiave API Pinecone. Formato: projects/{PROJECT_NUMBER}/secrets/{SECRET_ID}/versions/{VERSION_ID}
. Puoi impostarlo in un secondo momento.vertex_vector_search
: specifica l'istanza Vector Search.
index
(string
): il nome della risorsa dell'indice di ricerca vettoriale. Formato: projects/{project}/locations/{location}/indexes/{index}
. Puoi impostarlo in un secondo momento.index_endpoint
(string
): il nome della risorsa dell'endpoint di indice Vector Search. Formato: projects/{project}/locations/{location}/indexEndpoints/{index_endpoint}
. Puoi impostarlo in un secondo momento.
vertex_ai_search_config.serving_config
string
projects/{project}/locations/{location}/collections/{collection}/engines/{engine}/servingConfigs/{serving_config}
o
projects/{project}/locations/{location}/collections/{collection}/dataStores/{data_store}/servingConfigs/{serving_config}
rag_embedding_model_config.vertex_prediction_endpoint.endpoint
string
Aggiorna un corpus RAG
Parametri
display_name
string
description
string
rag_vector_db.pinecone.index_name
string
RagCorpus
è stato creato con una configurazione Pinecone
e il nome dell'indice non è stato impostato in precedenza.
rag_vector_db.vertex_vector_search.index
string
RagCorpus
è stato creato con una configurazione Vector Search
e l'indice non è stato impostato in precedenza.projects/{project}/locations/{location}/indexEndpoints/{index_endpoint}
rag_vector_db.vertex_vector_search.index_endpoint
string
RagCorpus
è stato creato con una configurazione Vector Search
e l'endpoint dell'indice non è stato impostato in precedenza.projects/{project}/locations/{location}/indexes/{index}
rag_vector_db.api_auth.api_key_config.api_key_secret_version
string
projects/{PROJECT_NUMBER}/secrets/{SECRET_ID}/versions/{VERSION_ID}
Elenca i corpora RAG
Questa tabella elenca i parametri utilizzati per elencare i corpus RAG.
Parametri | |
---|---|
|
(Facoltativo) Il numero massimo di corpora da restituire per pagina. |
|
(Facoltativo) Il token della pagina dell'elenco standard. In genere, viene ottenuto da |
Recuperare un corpus RAG
Questa tabella elenca il parametro utilizzato per ottenere un corpus RAG.
Parametri | |
---|---|
name |
Obbligatorio: Il nome della risorsa |
Elimina un corpus RAG
Questa tabella elenca il parametro utilizzato per eliminare un corpus RAG.
Parametri | |
---|---|
name |
Obbligatorio: Il nome della risorsa |
Parametri di gestione dei file
Questa sezione descrive i parametri per la gestione dei file in un corpus RAG. Per saperne di più, consulta Gestione dei file.
Caricare un file RAG
Questa tabella elenca i parametri utilizzati per caricare un file RAG.
Corpo della richiesta
Parametri | |
---|---|
parent |
Obbligatorio: Il nome della risorsa |
rag_file |
Obbligatorio: Il file da caricare. Contiene i seguenti campi:
|
upload_rag_file_config |
Obbligatorio: La configurazione per
|
Importare file RAG
Questa tabella elenca i parametri utilizzati per importare un file RAG.
Parametri | |
---|---|
|
Obbligatorio: Il nome della risorsa Formato: |
|
Percorso di Cloud Storage. Supporta l'importazione di singoli file e di intere directory Cloud Storage. |
|
URI Cloud Storage contenente il file di caricamento. |
|
Posizione di Google Drive. Supporta l'importazione di singoli file e cartelle di Google Drive. |
|
Il canale Slack in cui viene caricato il file. |
|
La query Jira in cui viene caricato il file. |
|
Le origini SharePoint in cui viene caricato il file. |
|
Numero di token di ogni blocco. |
|
La sovrapposizione tra i chunk. |
|
(Facoltativo) Specifica la configurazione dell'analisi per Se questo campo non è impostato, RAG utilizza il parser predefinito. |
|
(Facoltativo) Il numero massimo di query al minuto che questo job può eseguire sul modello di embedding specificato nel corpus. Questo valore è specifico per questo job e non viene condiviso con altri job di importazione. Consulta la pagina Quote del progetto per impostare un valore appropriato. Se non specificato, viene utilizzato un valore predefinito di 1000 QPM. |
GoogleDriveSource |
|
---|---|
|
Obbligatorio: L'ID della risorsa Google Drive. |
|
Obbligatorio: Il tipo di risorsa Google Drive. |
SlackSource |
|
---|---|
|
Ripetuto: Informazioni sul canale Slack, inclusi ID e intervallo di tempo da importare. |
|
Obbligatorio: L'ID del canale Slack. |
|
(Facoltativo) Il timestamp iniziale dei messaggi da importare. |
|
(Facoltativo) Il timestamp finale per i messaggi da importare. |
|
Obbligatorio: Il nome risorsa completo del secret archiviato in Secret Manager,
che contiene un token di accesso al canale Slack che ha accesso agli ID canale Slack.
Formato: |
JiraSource |
|
---|---|
|
Ripetuto: Un elenco di progetti Jira da importare nella loro interezza. |
|
Ripetuto: Un elenco di query Jira personalizzate da importare. Per informazioni su JQL (Jira Query Language), consulta
|
|
Obbligatorio: L'indirizzo email Jira. |
|
Obbligatorio: L'URI del server Jira. |
|
Obbligatorio: Il nome risorsa completo del secret archiviato in Secret Manager,
che contiene la chiave API Jira con accesso agli ID dei canali Slack.
Formato: |
SharePointSources |
|
---|---|
|
Il percorso della cartella di SharePoint da cui scaricare i file. |
|
L'ID della cartella SharePoint da cui scaricare. |
|
Il nome dell'unità da cui scaricare. |
|
L'ID dell'unità da cui scaricare. |
|
L'ID applicazione per l'app registrata nel portale Microsoft Azure.
|
|
Obbligatorio: Il nome completo della risorsa del secret archiviato in Secret Manager, che contiene il secret dell'applicazione per l'app registrata in Azure. Formato: |
|
Identificatore univoco dell'istanza di Azure Active Directory. |
|
Il nome del sito SharePoint da cui eseguire il download. Può trattarsi del nome o dell'ID del sito. |
RagFileParsingConfig |
|
---|---|
|
Il parser del layout da utilizzare per |
|
Il nome completo della risorsa di un processore o di una versione del processore Document AI. Formato:
|
|
Il numero massimo di richieste che il job può effettuare al processore Document AI al minuto. Consulta la pagina https://cloud.google.com/document-ai/quotas e la pagina Quote per il tuo progetto per impostare un valore appropriato qui. Se non specificato, viene utilizzato un valore predefinito di 120 QPM. |
|
Il parser LLM da utilizzare per |
|
Il nome della risorsa di un modello LLM. Formato:
|
|
Il numero massimo di richieste che il job può eseguire al modello LLM al minuto. Per impostare un valore appropriato per il tuo progetto, consulta la sezione relativa alle quote del modello e la pagina Quote per il tuo progetto per impostare un valore appropriato. Se non specificato, viene utilizzato un valore predefinito di 5000 QPM. |
Recuperare un file RAG
Questa tabella elenca il parametro utilizzato per ottenere un file RAG.
Parametri | |
---|---|
name |
Obbligatorio: Il nome della risorsa |
Eliminare un file RAG
Questa tabella elenca il parametro utilizzato per eliminare un file RAG.
Parametri | |
---|---|
name |
Obbligatorio: Il nome della risorsa |
Parametri di recupero e previsione
Questa sezione elenca i parametri di recupero e previsione.
Parametri di recupero
Questa tabella elenca i parametri per l'API retrieveContexts
.
Parametri | |
---|---|
|
Obbligatorio: Il nome risorsa della località da recuperare Formato: |
|
L'origine dati per Vertex RagStore. |
|
Obbligatorio: Singola query di recupero RAG. |
VertexRagStore
VertexRagStore |
|
---|---|
|
elenco: La rappresentazione dell'origine RAG. Può essere utilizzato per specificare solo il corpus
o |
|
(Facoltativo) Nome della risorsa Formato: |
|
elenco: Un elenco di risorse Formato: |
RagQuery |
|
---|---|
|
La query in formato di testo per ottenere contesti pertinenti. |
|
(Facoltativo) La configurazione del recupero per la query. |
RagRetrievalConfig |
|
---|---|
|
(Facoltativo) Il numero di contesti da recuperare. |
|
Restituisce solo i contesti con una distanza del vettore inferiore alla soglia. |
|
Restituisce solo i contesti con una somiglianza del vettore superiore alla soglia. |
|
(Facoltativo) Il nome del modello del servizio di classificazione. Esempio: |
|
(Facoltativo) Il nome del modello utilizzato per il ranking. Esempio: |
Parametri di previsione
Questa tabella elenca i parametri di previsione.
GenerateContentRequest |
|
---|---|
|
Impostato per utilizzare un'origine dati basata sull'archivio RAG di Vertex AI. |
Per maggiori dettagli, consulta VertexRagStore.
Parametri di gestione dei progetti
Questa tabella elenca le configurazioni del livello a livello di progetto per il database gestito del motore RAG.
Livello | Descrizione | Caso d'uso |
---|---|---|
RagManagedDbConfig.scaled |
Un livello su scala di produzione che offre prestazioni elevate e funzionalità di scalabilità automatica per il tuo database vettoriale gestito. | Consigliato per le applicazioni di produzione con carichi di query elevati o grandi volumi di dati. |
RagManagedDbConfig.basic |
Un livello di computing basso ed economico per il database vettoriale gestito. | Utilizza per lo sviluppo, i test o le applicazioni su piccola scala con traffico ridotto. |
RagManagedDbConfig.unprovisioned |
Elimina il database vettoriale gestito e le relative risorse sottostanti. In questo modo il database gestito viene disattivato per il progetto. | Utilizzalo per eliminare l'infrastruttura del database gestito quando non è più necessaria per gestire i costi. |
Esempi di gestione del corpus
Questa sezione fornisce esempi di come utilizzare l'API per gestire il corpus RAG.
Crea un esempio di corpus RAG
Questi esempi di codice mostrano come creare un corpus RAG.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- CORPUS_DISPLAY_NAME: il nome visualizzato del corpus RAG.
- CORPUS_DESCRIPTION: la descrizione del corpus RAG.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora
Corpo JSON della richiesta:
{
"display_name" : "CORPUS_DISPLAY_NAME",
"description": "CORPUS_DESCRIPTION",
}
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json ed esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora"
Powershell
Salva il corpo della richiesta in un file denominato request.json ed esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora" | Select-Object -Expand Content
Dovresti ricevere un codice di stato positivo (2xx).
L'esempio seguente mostra come creare un corpus RAG utilizzando l'API REST.
// CreateRagCorpus
// Input: LOCATION, PROJECT_ID, CORPUS_DISPLAY_NAME
// Output: CreateRagCorpusOperationMetadata
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora \
-d '{
"display_name" : "CORPUS_DISPLAY_NAME"
}'
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Aggiorna un esempio di corpus RAG
Puoi aggiornare il nome visualizzato, la descrizione e la configurazione del database vettoriale di un corpus RAG. Tuttavia, non puoi modificare i seguenti parametri immutabili nel corpus RAG:
- Il tipo di database vettoriale. Ad esempio, non puoi modificare il database vettoriale da Pinecone a Vector Search.
- Se utilizzi l'opzione di database gestito, non puoi aggiornare la configurazione del database vettoriale.
Questi esempi mostrano come aggiornare un corpus RAG.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- CORPUS_ID: l'ID corpus del tuo corpus RAG.
- CORPUS_DISPLAY_NAME: il nome visualizzato del corpus RAG.
- CORPUS_DESCRIPTION: la descrizione del corpus RAG.
- INDEX_NAME: il nome della risorsa dell'indice di ricerca vettoriale. Formato:
projects/{project}/locations/{location}/indexes/{index}
. - INDEX_ENDPOINT_NAME: il nome della risorsa dell'endpoint di indice Vector Search. Formato:
projects/{project}/locations/{location}/indexEndpoints/{index_endpoint}
.
Metodo HTTP e URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/CORPUS_ID
Corpo JSON della richiesta:
{
"display_name" : "CORPUS_DISPLAY_NAME",
"description": "CORPUS_DESCRIPTION",
"vector_db_config": {
"vertex_vector_search": {
"index": "INDEX_NAME",
"index_endpoint": "INDEX_ENDPOINT_NAME",
}
}
}
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json ed esegui il comando seguente:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/CORPUS_ID"
Powershell
Salva il corpo della richiesta in un file denominato request.json ed esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/CORPUS_ID" | Select-Object -Expand Content
Una richiesta riuscita restituisce un codice di stato 2xx.
Esempio di elenco di corpora RAG
Questi esempi di codice mostrano come elencare tutti i tuoi corpus RAG.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- PAGE_SIZE: il numero massimo di corpora RAG da restituire per pagina.
- PAGE_TOKEN: un token di pagina di una risposta
ListRagCorpora
precedente per recuperare la pagina successiva dei risultati.
Metodo HTTP e URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora?page_size=PAGE_SIZE&page_token=PAGE_TOKEN
Per inviare la richiesta, scegli una di queste opzioni:
curl
Esegui questo comando:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora?page_size=PAGE_SIZE&page_token=PAGE_TOKEN"
Powershell
Esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora?page_size=PAGE_SIZE&page_token=PAGE_TOKEN" | Select-Object -Expand Content
Una richiesta riuscita restituisce un codice di stato 2xx
e un elenco di corpus RAG per il progetto specificato.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Ottenere un esempio di corpus RAG
Questi esempi di codice mostrano come ottenere un corpus RAG.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- RAG_CORPUS_ID: l'ID della risorsa del corpus RAG.
Metodo HTTP e URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID
Per inviare la richiesta, scegli una di queste opzioni:
curl
Esegui questo comando:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID"
Powershell
Esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID" | Select-Object -Expand Content
Una risposta corretta restituisce la risorsa RagCorpus
.
I comandi get
e list
vengono utilizzati in un esempio per dimostrare come
RagCorpus
utilizza il campo rag_embedding_model_config
all'interno di
vector_db_config
, che punta al modello di incorporamento che hai scelto.
PROJECT_ID: Your project ID.
LOCATION: The region to process the request.
RAG_CORPUS_ID: The corpus ID of your RAG corpus.
```
```sh
// GetRagCorpus
// Input: LOCATION, PROJECT_ID, RAG_CORPUS_ID
// Output: RagCorpus
curl -X GET \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID
// ListRagCorpora
curl -sS -X GET \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/
```
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Elimina un esempio di corpus RAG
Questi esempi di codice mostrano come eliminare un corpus RAG.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- RAG_CORPUS_ID: l'ID della risorsa
RagCorpus
.
Metodo HTTP e URL:
DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID
Per inviare la richiesta, scegli una di queste opzioni:
curl
Esegui questo comando:
curl -X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID"
Powershell
Esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method DELETE `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID" | Select-Object -Expand Content
Una risposta corretta restituisce DeleteOperationMetadata
.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Esempi di gestione dei file
Questa sezione fornisce esempi di come utilizzare l'API per gestire i file RAG.
Carica un esempio di file RAG
Questi esempi di codice mostrano come caricare un file RAG.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- RAG_CORPUS_ID: l'ID corpus del tuo corpus RAG.
- LOCAL_FILE_PATH: il percorso locale del file da caricare.
- DISPLAY_NAME: il nome visualizzato del file RAG.
- DESCRIPTION: la descrizione del file RAG.
Per inviare la richiesta, utilizza il comando seguente:
curl -X POST \
-H "X-Goog-Upload-Protocol: multipart" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-F metadata="{'rag_file': {'display_name':' DISPLAY_NAME', 'description':'DESCRIPTION'}}" \
-F file=@LOCAL_FILE_PATH \
"https://LOCATION-aiplatform.googleapis.com/upload/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:upload"
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Esempio di importazione di file RAG
Puoi importare file e cartelle da Drive o
Cloud Storage. Puoi utilizzare response.metadata
per visualizzare errori parziali, tempo di richiesta e tempo di risposta nell'oggetto response
dell'SDK.
Il campo response.skipped_rag_files_count
contiene il numero di file
ignorati durante l'importazione. Il servizio ignora un file se sono soddisfatte le seguenti condizioni:
- Il file è già stato importato.
- Il file non è stato modificato.
- La configurazione del chunking per il file non è cambiata.
Python
from vertexai import rag
import vertexai
# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# corpus_name = "projects/{PROJECT_ID}/locations/us-central1/ragCorpora/{rag_corpus_id}"
# paths = ["https://drive.google.com/file/123", "gs://my_bucket/my_files_dir"] # Supports Cloud Storage and Google Drive Links
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location="us-central1")
response = rag.import_files(
corpus_name=corpus_name,
paths=paths,
transformation_config=rag.TransformationConfig(
rag.ChunkingConfig(chunk_size=1024, chunk_overlap=256)
),
import_result_sink="gs://sample-existing-folder/sample_import_result_unique.ndjson", # Optional: This must be an existing Cloud Storage bucket folder, and the filename must be unique (non-existent).
llm_parser=rag.LlmParserConfig(
model_name="gemini-2.5-pro-preview-05-06",
max_parsing_requests_per_min=100,
), # Optional
max_embedding_requests_per_min=900, # Optional
)
print(f"Imported {response.imported_rag_files_count} files.")
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- RAG_CORPUS_ID: l'ID corpus del tuo corpus RAG.
- FOLDER_RESOURCE_ID: l'ID risorsa della tua cartella Drive.
- GCS_URIS: un elenco di località Cloud Storage.
Esempio:
gs://my-bucket1
. - CHUNK_SIZE: numero di token che ogni blocco deve avere.
- CHUNK_OVERLAP: numero di token sovrapposti tra i chunk.
- EMBEDDING_MODEL_QPM_RATE: la frequenza di query al minuto per limitare l'accesso di RAG al tuo modello di incorporamento. Esempio: 1000.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:import
Corpo JSON della richiesta:
{
"import_rag_files_config": {
"gcs_source": {
"uris": "GCS_URIS"
},
"rag_file_chunking_config": {
"chunk_size": "CHUNK_SIZE",
"chunk_overlap": "CHUNK_OVERLAP"
}
}
}
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json ed esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:import"
Powershell
Salva il corpo della richiesta in un file denominato request.json ed esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:import" | Select-Object -Expand Content
Una risposta corretta restituisce la risorsa ImportRagFilesOperationMetadata
.
Il seguente esempio mostra come importare un file da Cloud Storage. Utilizza il campo di controllo max_embedding_requests_per_min
per limitare la velocità con cui RAG Engine chiama il modello di incorporamento durante il processo di indicizzazione ImportRagFiles
. Il campo ha un valore predefinito di 1000
chiamate
al minuto.
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- RAG_CORPUS_ID: l'ID corpus del tuo corpus RAG.
- GCS_URIS: un elenco di località Cloud Storage.
Esempio:
gs://my-bucket1
. - CHUNK_SIZE: numero di token che ogni blocco deve avere.
- CHUNK_OVERLAP: numero di token sovrapposti tra i chunk.
- EMBEDDING_MODEL_QPM_RATE: la frequenza di QPM per limitare l'accesso di RAG al tuo modello di incorporamento. Esempio: 1000.
// ImportRagFiles
// Import a single Cloud Storage file or all files in a Cloud Storage bucket.
// Input: LOCATION, PROJECT_ID, RAG_CORPUS_ID, GCS_URIS
// Output: ImportRagFilesOperationMetadataNumber
// Use ListRagFiles to find the server-generated rag_file_id.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:import \
-d '{
"import_rag_files_config": {
"gcs_source": {
"uris": "GCS_URIS"
},
"rag_file_chunking_config": {
"chunk_size": CHUNK_SIZE,
"chunk_overlap": CHUNK_OVERLAP
},
"max_embedding_requests_per_min": EMBEDDING_MODEL_QPM_RATE
}
}'
L'esempio riportato di seguito mostra come importare un file da Drive. Utilizza il campo di controllo max_embedding_requests_per_min
per
limitare la velocità con cui RAG Engine chiama il modello di incorporamento durante la
procedura di indicizzazione ImportRagFiles
. Il campo ha un valore predefinito di 1000
chiamate
al minuto.
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- RAG_CORPUS_ID: l'ID corpus del tuo corpus RAG.
- FOLDER_RESOURCE_ID: l'ID risorsa della tua cartella Drive.
- CHUNK_SIZE: numero di token che ogni blocco deve avere.
- CHUNK_OVERLAP: numero di token sovrapposti tra i chunk.
- EMBEDDING_MODEL_QPM_RATE: la frequenza di query al minuto per limitare l'accesso di RAG al tuo modello di incorporamento. Esempio: 1000.
// ImportRagFiles
// Import all files in a Google Drive folder.
// Input: LOCATION, PROJECT_ID, RAG_CORPUS_ID, FOLDER_RESOURCE_ID
// Output: ImportRagFilesOperationMetadataNumber
// Use ListRagFiles to find the server-generated rag_file_id.
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles:import \
-d '{
"import_rag_files_config": {
"google_drive_source": {
"resource_ids": {
"resource_id": "FOLDER_RESOURCE_ID",
"resource_type": "RESOURCE_TYPE_FOLDER"
}
},
"max_embedding_requests_per_min": EMBEDDING_MODEL_QPM_RATE
}
}'
Esempio di elenco di file RAG
Questi esempi di codice mostrano come elencare i file RAG.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- RAG_CORPUS_ID: l'ID della risorsa
RagCorpus
. - PAGE_SIZE: il numero massimo di
RagFiles
da restituire per pagina. - PAGE_TOKEN: un token di pagina di una risposta
ListRagFiles
precedente per recuperare la pagina successiva dei risultati.
Metodo HTTP e URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles?page_size=PAGE_SIZE&page_token=PAGE_TOKEN
Per inviare la richiesta, scegli una di queste opzioni:
curl
Esegui questo comando:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles?page_size=PAGE_SIZE&page_token=PAGE_TOKEN"
Powershell
Esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles?page_size=PAGE_SIZE&page_token=PAGE_TOKEN" | Select-Object -Expand Content
Una richiesta riuscita restituisce un codice di stato 2xx e un elenco di
RagFiles
per il RAG_CORPUS_ID
specificato.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Ottenere un esempio di file RAG
Questi esempi di codice mostrano come ottenere un file RAG.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- RAG_CORPUS_ID: l'ID della risorsa
RagCorpus
. - RAG_FILE_ID: l'ID della risorsa
RagFile
.
Metodo HTTP e URL:
GET https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID
Per inviare la richiesta, scegli una di queste opzioni:
curl
Esegui questo comando:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID"
Powershell
Esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID" | Select-Object -Expand Content
Una risposta corretta restituisce la risorsa RagFile
.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Elimina un esempio di file RAG
Questi esempi di codice mostrano come eliminare un file RAG.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID>: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- RAG_CORPUS_ID: l'ID della risorsa RagCorpus.
- RAG_FILE_ID: l'ID della risorsa RagFile. Formato:
projects/{project}/locations/{location}/ragCorpora/{rag_corpus}/ragFiles/{rag_file_id}
.
Metodo HTTP e URL:
DELETE https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID
Per inviare la richiesta, scegli una di queste opzioni:
curl
Esegui questo comando:
curl -X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID"
Powershell
Esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method DELETE `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/ragCorpora/RAG_CORPUS_ID/ragFiles/RAG_FILE_ID" | Select-Object -Expand Content
Una risposta corretta restituisce DeleteOperationMetadata
.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Esempio di query di recupero
Quando fornisci una query, il componente di recupero nella RAG esegue una ricerca nella knowledge base per trovare informazioni pertinenti.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- RAG_CORPUS_RESOURCE: il nome della risorsa
RagCorpus
. Formato:projects/{project}/locations/{location}/ragCorpora/{rag_corpus}
. - VECTOR_DISTANCE_THRESHOLD: vengono restituiti solo i contesti con una distanza del vettore inferiore alla soglia.
- TEXT: il testo della query per ottenere contesti pertinenti.
- SIMILARITY_TOP_K: il numero di contesti principali da recuperare.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION:retrieveContexts
Corpo JSON della richiesta:
{
"vertex_rag_store": {
"rag_resources": {
"rag_corpus": "RAG_CORPUS_RESOURCE"
},
"vector_distance_threshold": VECTOR_DISTANCE_THRESHOLD
},
"query": {
"text": TEXT
"similarity_top_k": SIMILARITY_TOP_K
}
}
curl
Salva il corpo della richiesta in un file denominato request.json ed esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION:retrieveContexts"
Powershell
Salva il corpo della richiesta in un file denominato request.json ed esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION:retrieveContexts" | Select-Object -Expand Content
Una richiesta riuscita restituisce un codice di stato 2xx e un elenco di contesti correlati.
Esempio di generazione
L'LLM genera una risposta fondata utilizzando i contesti recuperati.
REST
Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: il tuo ID progetto.
- LOCATION: la regione in cui elaborare la richiesta.
- MODEL_ID: modello LLM per la generazione di contenuti. Esempio:
gemini-2.5-flash
. - GENERATION_METHOD: metodo LLM per la generazione di contenuti.
Opzioni:
generateContent
,streamGenerateContent
. - INPUT_PROMPT: il testo inviato all'LLM per la generazione di contenuti. Prova a utilizzare un prompt pertinente ai file RAG caricati.
- RAG_CORPUS_RESOURCE: il nome della risorsa
RagCorpus
. Formato:projects/{project}/locations/{location}/ragCorpora/{rag_corpus}
. - SIMILARITY_TOP_K: (facoltativo) il numero di contesti principali da recuperare.
- VECTOR_DISTANCE_THRESHOLD: facoltativo: vengono restituiti i contesti con una distanza del vettore inferiore alla soglia.
- USER: il tuo nome utente.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:GENERATION_METHOD
Corpo JSON della richiesta:
{
"contents": {
"role": "USER",
"parts": {
"text": "INPUT_PROMPT"
}
},
"tools": {
"retrieval": {
"disable_attribution": false,
"vertex_rag_store": {
"rag_resources": {
"rag_corpus": "RAG_CORPUS_RESOURCE"
},
"similarity_top_k": "SIMILARITY_TOP_K",
"vector_distance_threshold": VECTOR_DISTANCE_THRESHOLD
}
}
}
}
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json ed esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:GENERATION_METHOD"
Powershell
Salva il corpo della richiesta in un file denominato request.json ed esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:GENERATION_METHOD" | Select-Object -Expand Content
Una risposta corretta restituisce i contenuti generati con le citazioni.
Python
Per scoprire come installare o aggiornare l'SDK Vertex AI Python, consulta Installare l'SDK Vertex AI Python. Per saperne di più, consulta la documentazione di riferimento dell'API Python.
Esempi di gestione dei progetti
Il livello è un'impostazione a livello di progetto nella risorsa RagEngineConfig
che influisce sui corpus RAG che utilizzano RagManagedDb
. Per ottenere la configurazione
del livello, utilizza GetRagEngineConfig
. Per aggiornare la configurazione del livello,
utilizza UpdateRagEngineConfig
.
Per ulteriori informazioni sulla gestione della configurazione dei livelli, consulta Gestire i livelli.
Recupera la configurazione del progetto
I seguenti esempi di codice mostrano come leggere il tuo RagEngineConfig
:
Console
- Nella console Google Cloud , vai alla pagina Motore RAG.
- Seleziona la regione in cui è in esecuzione RAG Engine. L'elenco dei corpora RAG è aggiornato.
- Fai clic su Configura RAG Engine. Viene visualizzato il riquadro Configura RAG Engine. Puoi vedere il livello selezionato per il motore RAG.
- Fai clic su Annulla.
Python
from vertexai import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config = rag.rag_data.get_rag_engine_config(
name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
)
print(rag_engine_config)
REST
curl -X GET \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/ragEngineConfig
Aggiorna la configurazione del progetto
Questa sezione fornisce esempi di codice per dimostrare come modificare la configurazione in un livello scalabile, Basic o non sottoposto a provisioning.
Aggiorna il tuo RagEngineConfig
al livello Scaled
I seguenti esempi di codice mostrano come impostare RagEngineConfig
sul livello
scalato:
Console
- Nella console Google Cloud , vai alla pagina Motore RAG.
- Seleziona la regione in cui è in esecuzione RAG Engine. L'elenco dei corpora RAG è aggiornato.
- Fai clic su Configura RAG Engine. Viene visualizzato il riquadro Configura RAG Engine.
- Seleziona il livello su cui vuoi eseguire RAG Engine.
- Fai clic su Salva.
Python
from vertexai import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(tier=rag.Scaled()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
REST
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/ragEngineConfig -d "{'ragManagedDbConfig': {'scaled': {}}}"
Aggiorna il tuo RagEngineConfig
al livello Basic
I seguenti esempi di codice mostrano come impostare RagEngineConfig
sul
livello Basic:
Console
- Nella console Google Cloud , vai alla pagina Motore RAG.
- Seleziona la regione in cui è in esecuzione RAG Engine. L'elenco dei corpora RAG è aggiornato.
- Fai clic su Configura RAG Engine. Viene visualizzato il riquadro Configura RAG Engine.
- Seleziona il livello su cui vuoi eseguire RAG Engine.
- Fai clic su Salva.
Python
from vertexai import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(tier=rag.Basic()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
REST
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/ragEngineConfig -d "{'ragManagedDbConfig': {'basic': {}}}"
Aggiorna il tuo RagEngineConfig
al livello Non sottoposto a provisioning
I seguenti esempi di codice mostrano come impostare RagEngineConfig
sul
livello Non sottoposto a provisioning:
Console
- Nella console Google Cloud , vai alla pagina Motore RAG.
- Seleziona la regione in cui è in esecuzione RAG Engine. L'elenco dei corpora RAG è aggiornato.
- Fai clic su Configura RAG Engine. Viene visualizzato il riquadro Configura RAG Engine.
- Fai clic su Elimina RAG Engine. Viene visualizzata una finestra di dialogo di conferma.
- Verifica di voler eliminare i dati in RAG Engine digitando delete, quindi fai clic su Conferma.
- Fai clic su Salva.
Python
from vertexai import rag
import vertexai
PROJECT_ID = YOUR_PROJECT_ID
LOCATION = YOUR_RAG_ENGINE_LOCATION
# Initialize Vertex AI API once per session
vertexai.init(project=PROJECT_ID, location=LOCATION)
rag_engine_config_name=f"projects/{PROJECT_ID}/locations/{LOCATION}/ragEngineConfig"
new_rag_engine_config = rag.RagEngineConfig(
name=rag_engine_config_name,
rag_managed_db_config=rag.RagManagedDbConfig(tier=rag.Unprovisioned()),
)
updated_rag_engine_config = rag.rag_data.update_rag_engine_config(
rag_engine_config=new_rag_engine_config
)
print(updated_rag_engine_config)
REST
curl -X PATCH \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/ragEngineConfig -d "{'ragManagedDbConfig': {'unprovisioned': {}}}"
Passaggi successivi
- Per scoprire di più sui modelli di generazione supportati, consulta la pagina Modelli di AI generativa che supportano RAG.
- Per scoprire di più sui modelli di embedding supportati, consulta Modelli di embedding.
- Per scoprire di più sui modelli aperti, consulta Modelli aperti.
- Per saperne di più su RAG Engine, consulta la panoramica di RAG Engine.