Pode atualizar quando uma cache de contexto expira. O tempo de expiração predefinido de uma cache de contexto é de 60 minutos após a hora de criação. Uma cache de contexto expirada é eliminada durante um processo de recolha de lixo e não pode ser usada nem atualizada. Para atualizar a hora em que uma cache de contexto não expirada expira, atualize uma das seguintes propriedades:
ttl
: o número de segundos e nanosegundos que a cache dura após a sua criação ou após a atualização dottl
antes de expirar. Quando define o elementottl
, aexpireTime
da cache é atualizada.expire_time
- ATimestamp
que especifica a data e a hora absolutas em que a cache de contexto expira.
Atualize a cache de contexto através do respetivo parâmetro ttl
Segue-se um exemplo de um comando curl que atualiza o respetivo prazo de validade em 3600 segundos.
Python
Instalação
pip install --upgrade google-genai
Para saber mais, consulte a documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com o Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Go
Saiba como instalar ou atualizar o Go.
Para saber mais, consulte a documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com o Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Java
Saiba como instalar ou atualizar o Java.
Para saber mais, consulte a documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com o Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
Node.js
Instalação
npm install @google/genai
Para saber mais, consulte a documentação de referência do SDK.
Defina variáveis de ambiente para usar o SDK de IA generativa com o Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
REST
Pode usar o REST para criar uma atualização da cache de contexto através da
API Vertex AI para enviar um pedido PATCH para o ponto final do modelo do publicador. O exemplo seguinte mostra como atualizar a data de validade através do parâmetro ttl
.
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
- PROJECT_ID: o seu ID do projeto.
- LOCATION: a região onde o pedido para criar a cache de contexto foi processado.
- CACHE_ID: o ID da cache de contexto. O ID da cache de contexto é devolvido quando cria a cache de contexto. Também pode encontrar IDs da cache de contexto listando as caches de contexto de um projeto do Google Cloud Platform (GCP) com o comando: Google Cloud Para mais informações, consulte as secções Crie uma cache de contexto e Liste as caches de contexto.
- SECONDS: um
float
que especifica o componente de segundos da duração antes de a cache expirar. - NANOSECONDS: um
float
que especifica o componente de nanosegundos da duração antes de a cache expirar.
Método HTTP e URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
Corpo JSON do pedido:
{ "seconds":"SECONDS", "nanos":"NANOSECONDS" }
Para enviar o seu pedido, escolha uma destas opções:
curl
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
Deve receber uma resposta JSON semelhante à seguinte:
Comando curl de exemplo
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"ttl": {"seconds":"3600","nanos":"0"}
}'
Atualize a cache de contexto através do respetivo parâmetro expire_time
Segue-se um exemplo de um comando curl que usa o parâmetro expire_time
para atualizar a respetiva hora de validade para as 09:00 a 30 de junho de 2024.
REST
Pode usar o REST para criar uma atualização da cache de contexto através da
API Vertex AI para enviar um pedido PATCH para o ponto final do modelo do publicador. O exemplo seguinte mostra como atualizar a data de validade através do parâmetro expire_time
.
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
- PROJECT_ID: .
- LOCATION: a região onde o pedido para criar a cache de contexto foi processado.
- CACHE_ID: o ID da cache de contexto. Pode encontrar o ID na resposta quando criar a cache de contexto.
- EXPIRE_TIME: um
Timestamp
que especifica a hora em que a cache de contexto expira.
Método HTTP e URL:
PATCH https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID
Corpo JSON do pedido:
{ "expire_time":"EXPIRE_TIME" }
Para enviar o seu pedido, escolha uma destas opções:
curl
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID"
PowerShell
Guarde o corpo do pedido num ficheiro com o nome request.json
,
e execute o seguinte comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method PATCH `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/cachedContents/CACHE_ID" | Select-Object -Expand Content
Deve receber uma resposta JSON semelhante à seguinte:
Comando curl de exemplo
PROJECT_ID="PROJECT_ID"
LOCATION="us-central1"
CACHE_ID="CACHE_ID"
curl \
-X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json"\
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/cachedContents/${CACHE_ID}" -d \
'{
"expire_time":"2024-06-30T09:00:00.000000Z"
}'
O que se segue?
- Saiba como usar uma cache de contexto.
- Saiba como obter informações sobre todas as caches de contexto associadas a um Google Cloud projeto.