Este documento explica como criar um pedido de reserva futura no modo de calendário. Para saber mais acerca deste tipo de reserva, consulte o artigo Vista geral dos pedidos de reserva futuros no modo de calendário.
Crie um pedido de reserva futura no modo de calendário para reservar os seguintes recursos durante um máximo de 90 dias:
Até 80 instâncias de máquinas virtuais (VMs) com GPUs anexadas.
Até 1024 chips de TPU.
Na data e hora de entrega escolhidas, pode criar VMs de GPU ou TPU consumindo a capacidade reservada. Use pedidos de reserva futuros no modo de calendário para obter recursos de elevada procura para as seguintes cargas de trabalho:
Tarefas de pré-treino de modelos
Tarefas de ajuste do modelo
Cargas de trabalho de simulação de computação de alto desempenho (HPC)
Aumentos de curto prazo nas cargas de trabalho de inferência
Para reservar mais de 80 VMs com GPU ou por mais de 90 dias num único pedido, consulte, em alternativa, a secção Reserve capacidade na documentação do hipercomputador de IA.
Limitações
As secções seguintes explicam as limitações para pedidos de reserva futuros no modo de calendário.
Limitações para todos os pedidos
Todos os pedidos de reserva futuros no modo de calendário têm as seguintes limitações:
Pode reservar recursos por um período entre 1 e 90 dias.
Depois de criar e enviar um pedido, não pode cancelá-lo, eliminá-lo nem modificá-lo.
Limitações para pedidos de VMs com GPU
Só pode reservar VMs com GPU da seguinte forma:
Pode reservar entre 1 e 80 VMs com GPU por pedido.
Pode reservar as seguintes séries de máquinas:
Só pode reservar VMs com GPU em zonas específicas.
Limitações para pedidos de TPUs
Só pode reservar TPUs da seguinte forma:
Pode reservar 1, 4, 8, 16, 32, 64, 128, 256, 512 ou 1024 chips de TPU por pedido.
Pode reservar as seguintes versões de TPUs:
Só pode reservar 1, 4 ou 8 chips de TPU v5e para tipos de cargas de trabalho de publicação (
SERVING
).Só pode reservar TPUs nas seguintes zonas:
Para a TPU v6e:
asia-northeast1-b
us-east5-a
us-east5-b
Para a TPU v5p:
us-east5-a
Para a TPU v5e:
Para tipos de carga de trabalho em lote (
BATCH
):us-west4-b
Para tipos de carga de trabalho de publicação (
SERVING
):us-central1-a
Antes de começar
- Se não conseguir usar pedidos de reserva futuros no modo de calendário, pode não ser elegível para aceder e usar esta funcionalidade. Neste caso, contacte a sua equipa da conta ou a equipa de vendas.
- Para partilhar a sua capacidade reservada com outros projetos na sua organização, certifique-se de que o projeto no qual quer criar pedidos de reserva futuros no modo de calendário está autorizado a criar reservas partilhadas. Caso contrário, vai deparar-se com erros.
-
Se ainda não o tiver feito, configure a autenticação.
A autenticação valida a sua identidade para aceder a Google Cloud serviços e APIs. Para executar código ou exemplos a partir de um ambiente de desenvolvimento local, pode autenticar-se no Compute Engine selecionando uma das seguintes opções:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:
gcloud init
Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.
- Set a default region and zone.
REST
Para usar os exemplos da API REST nesta página num ambiente de desenvolvimento local, usa as credenciais que fornece à CLI gcloud.
Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:
gcloud init
Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.
Para mais informações, consulte o artigo Autenticar para usar REST na Google Cloud documentação de autenticação.
Funções necessárias
Para receber as autorizações de que precisa para criar um pedido de reserva futuro no modo de calendário, peça ao seu administrador para lhe conceder a função IAM Compute Future Reservation User (
roles/compute.futureReservationUser
) no projeto. Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.Esta função predefinida contém as autorizações necessárias para criar um pedido de reserva futuro no modo de calendário. Para ver as autorizações exatas que são necessárias, expanda a secção Autorizações necessárias:
Autorizações necessárias
São necessárias as seguintes autorizações para criar um pedido de reserva futuro no modo de calendário:
-
Para criar um pedido de reserva futuro:
compute.futureReservations.create
no projeto -
Para permitir que o Compute Engine crie automaticamente reservas:
compute.reservations.create
no projeto -
Para especificar um modelo de instância:
compute.instanceTemplates.useReadOnly
no modelo de instância -
Para ver a disponibilidade futura dos recursos:
compute.advice.calendarMode
no projeto
Também pode conseguir estas autorizações com funções personalizadas ou outras funções predefinidas.
Vista geral
Para criar um pedido de reserva futuro no modo de calendário, conclua os seguintes passos:
Veja a disponibilidade futura do recurso. Veja a disponibilidade futura das VMs com GPUs ou das TPUs que quer reservar. Em seguida, quando criar um pedido, especifique o número, o tipo e a duração da reserva dos recursos que confirmou como disponíveis.É mais provável que o Google Cloud aprove o seu pedido se fornecer estas informações.
Crie um pedido de reserva para VMs com GPU ou TPUs. Crie e envie um pedido de reserva futura no modo de calendário para VMs com GPU ou TPUs. Se conseguir criar um pedido com êxito, o sistema aprova-o num minuto. Google Cloud
Veja a disponibilidade futura do recurso
Pode ver a disponibilidade futura de VMs de GPU ou TPUs numa região da seguinte forma:
Para VMs com GPU, até 60 dias de antecedência
Para TPUs, até 120 dias de antecedência
Para ver a disponibilidade futura de VMs com GPU ou TPUs numa região, selecione uma das seguintes opções:
Consola
Pode ver a disponibilidade futura de VMs com GPU ou TPUs numa região quando cria um pedido de reserva futura no modo de calendário. Para mais informações, consulte a secção Crie um pedido de reserva para VMs com GPUs ou TPUs neste documento.
gcloud
Para ver a disponibilidade futura de VMs com GPU ou TPU numa região, use um dos seguintes comandos
gcloud beta compute advice calendar-mode
. Com base nos recursos que quer ver, inclua as seguintes flags:Para ver a disponibilidade de VMs com GPU, inclua as flags
--vm-count
e--machine-type
:gcloud beta compute advice calendar-mode \ --vm-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Para ver a disponibilidade de TPUs, inclua as flags
--chip-count
e--tpu-version
:gcloud beta compute advice calendar-mode \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Substitua o seguinte:
NUMBER_OF_VMS
: o número de VMs com GPU a reservar.MACHINE_TYPE
: o tipo de máquina de GPU a reservar.NUMBER_OF_CHIPS
: o número de chips de TPU a reservar.TPU_VERSION
: a versão da TPU a reservar. Especifique um dos seguintes valores:Para a TPU v6e:
V6E
Para a TPU v5p:
V5P
Para a TPU v5e:
V5E
Se especificar uma TPU v5e, tem de incluir a flag
--workload-type
. Defina esta flag para o tipo de cargas de trabalho que quer executar nas TPUs:Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA), especifique
BATCH
.Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING
.
REGION
: a região onde reservar VMs com GPUs ou TPUs. Para verificar que regiões e zonas são suportadas, consulte as limitações neste documento.FROM_START_TIME
eTO_START_TIME
: as datas mais antigas e mais recentes para as quais quer reservar capacidade. Formate estas datas como carimbos de data/hora RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSET
Substitua o seguinte:
YYYY-MM-DD
: uma data formatada como um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos, separados por hífenes (-
).HH:MM:SS
: uma hora formatada como uma hora de dois dígitos com uma hora de 24 horas, minutos de dois dígitos e segundos de dois dígitos, separados por dois pontos (:
).OFFSET
: o fuso horário formatado como um desvio do Tempo Universal Coordenado (UTC). Por exemplo, para usar a Hora Padrão do Pacífico (PST), especifique-08:00
. Para não usar nenhum desvio, especifiqueZ
.
FROM_END_TIME
eTO_END_TIME
: as datas mais antigas e mais recentes em que quer que a reserva de capacidade termine. Formate estas datas como carimbos de data/hora RFC 3339. Se quiser especificar um intervalo de durações para o período de reserva em vez de horas de fim, substitua a flag--end-time-range
pela flag--duration-range
.
O resultado é semelhante ao seguinte:
- recommendationsPerSpec: spec: endTime: '2025-09-07T00:00:00Z' location: zones/us-east5-a otherLocations: zones/us-east5-b: details: this machine family is not supported in this zone status: NOT_SUPPORTED zones/us-east5-c: details: this machine family is not supported in this zone status: NOT_SUPPORTED recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb recommendationType: FUTURE_RESERVATION startTime: '2025-06-09T00:00:00Z'
Se os recursos pedidos estiverem disponíveis, o resultado contém os campos
startTime
,endTime
elocation
. Estes campos especificam a hora de início mais próxima, a hora de fim mais tardia e as zonas onde os recursos estão disponíveis.REST
Para ver a disponibilidade futura de VMs com GPU ou TPUs numa região, faça um pedido
GET
ao método betaadvice.calendarMode
. Com base nos recursos que quer ver, inclua os seguintes campos no corpo do pedido:Para ver a disponibilidade de VMs com GPU, inclua os campos
instanceCount
emachineType
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "specificSkuResources": { "instanceCount": "NUMBER_OF_VMS", "machineType": "MACHINE_TYPE" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Para ver a disponibilidade das TPUs, inclua os campos
acceleratorCount
evmFamily
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "aggregateResources": { "acceleratorCount": "NUMBER_OF_CHIPS", "vmFamily": "TPU_VERSION" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Substitua o seguinte:
PROJECT_ID
: o ID do projeto onde quer reservar recursos.REGION
: a região onde quer reservar VMs com GPUs ou TPUs. Para verificar as regiões e as zonas suportadas, consulte as limitações neste documento.NUMBER_OF_VMS
: o número de VMs com GPU a reservar.MACHINE_TYPE
: o tipo de máquina de GPU a reservar.NUMBER_OF_CHIPS
: o número de chips de TPU a reservar.TPU_VERSION
: a versão da TPU a reservar. Especifique um dos seguintes valores:Para a TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
Para a TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
Para a TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Se especificar uma TPU v5e, no campo
aggregateResources
, tem de incluir o campoworkloadType
. Defina este campo para o tipo de cargas de trabalho que quer executar nas TPUs:Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA), especifique
BATCH
.Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING
.
FROM_START_TIME
eTO_START_TIME
: as datas mais antigas e mais recentes para as quais quer reservar capacidade. Formate estas datas como carimbos de data/hora RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSET
Substitua o seguinte:
YYYY-MM-DD
: uma data formatada como um ano de quatro dígitos, um mês de dois dígitos e um dia de dois dígitos, separados por hífenes (-
).HH:MM:SS
: uma hora formatada como uma hora de dois dígitos com uma hora de 24 horas, minutos de dois dígitos e segundos de dois dígitos, separados por dois pontos (:
).OFFSET
: o fuso horário formatado como um desvio do Tempo Universal Coordenado (UTC). Por exemplo, para usar a Hora Padrão do Pacífico (PST), especifique-08:00
. Para não usar nenhum desvio, especifiqueZ
.
FROM_END_TIME
eTO_END_TIME
: as datas mais antigas e mais recentes em que quer que a reserva de capacidade termine. Formate estas datas como carimbos de data/hora RFC 3339. Se quiser especificar um intervalo de durações para o período de reserva em vez de horas de fim, substitua os camposendTimeNotEarlierThan
eendTimeNotLaterThan
pelos camposminDuration
emaxDuration
.
O resultado é semelhante ao seguinte:
{ "recommendations": [ { "recommendationsPerSpec": { "spec": { "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b", "recommendationType": "FUTURE_RESERVATION", "startTime": "2025-06-09T00:00:00Z", "endTime": "2025-09-07T00:00:00Z", "otherLocations": { "zones/us-east5-b": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" }, "zones/us-east5-c": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" } }, "location": "zones/us-east5-a" } } } ] }
Se os recursos pedidos estiverem disponíveis, o resultado contém os campos
startTime
,endTime
elocation
. Estes campos especificam a hora de início mais próxima, a hora de fim mais tardia e as zonas onde os recursos estão disponíveis.Crie um pedido de reserva para VMs com GPUs ou TPUs
Quando cria um pedido de reserva futura no modo de calendário, só pode especificar um período de reserva da seguinte forma:
Hora de início: com base nos recursos que quer reservar, tem de especificar uma hora de início que seja, pelo menos, um dos seguintes valores a partir do momento em que cria e envia um pedido:
Para VMs com GPU, 87 horas (três dias e 15 horas)
Para TPUs, seis horas
Hora de fim: pode reservar recursos durante um máximo de 90 dias.
Para criar um pedido usando uma VM de GPU existente como referência, use a Google Cloud consola. Caso contrário, selecione uma das seguintes opções:
Consola
Na Google Cloud consola, aceda à página Reservas.
Clique no separador Reservas futuras.
Clique em
Criar reserva futura. É apresentada a página Crie uma reserva futura e o painel Configuração de hardware é selecionado.Na secção Configuração, especifique as propriedades das VMs com GPU ou das TPUs que quer reservar através de uma das seguintes opções:
Para especificar diretamente as propriedades da VM de GPU ou da TPU, conclua os seguintes passos:
Selecione Especificar tipo de máquina.
Clique no separador GPUs ou TPUs e, de seguida, selecione o tipo de máquina de GPU ou a versão da TPU a reservar.
Para especificar as propriedades da VM de GPU através de um modelo de instância existente, selecione Modelo de instância e, de seguida, selecione o modelo.
Para especificar as propriedades da VM de GPU através de uma VM existente como referência, selecione Usar VM existente e, de seguida, selecione a VM.
Se especificou uma TPU v5e (CT5LP) no passo anterior, na lista Tipo de carga de trabalho de TPU v5, selecione uma das seguintes opções:
Para executar cargas de trabalho nas TPUs que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de ML, selecione Lote.
Para executar cargas de trabalho nas TPUs que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, selecione Serviço.
Na secção Pesquisar capacidade, conclua os seguintes passos:
Nas listas Região e Zona, especifique a região e a zona onde quer reservar recursos. Para rever as regiões e as zonas suportadas, consulte as Limitações neste documento.
No campo Capacidade total necessária (quando reserva VMs com GPUs) ou na lista Número de chips (quando reserva TPUs), especifique o número de VMs com GPUs ou chips de TPU a reservar.
Na lista Hora de início, selecione a hora de início do pedido.
Opcional: na lista Escolha a flexibilidade da data de início, selecione o nível de exatidão da data de início.
No campo Duração da reserva, especifique durante quanto tempo quer reservar recursos.
Clique em Pesquisar capacidade. Em seguida, na tabela Capacidade disponível, selecione uma das opções disponíveis que contenham o tipo, o número e o período de reserva das VMs de GPU ou das TPUs a reservar.
Clicar em Seguinte.
Na secção Tipo de partilha, selecione os projetos com os quais quer partilhar a capacidade pedida:
Para usar a capacidade reservada apenas no seu projeto, selecione Local.
Para partilhar a capacidade reservada com outros projetos, selecione Partilhada, clique em
Adicionar projetos e, em seguida, siga as instruções para selecionar os projetos.
Clicar em Seguinte.
No campo Nome da reserva futura, introduza um nome para o pedido.
No campo Nome da reserva, introduza o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.
Clique em Criar.
gcloud
Para criar um pedido de reserva futuro no modo de calendário e enviá-lo para revisão, use um dos seguintes
gcloud beta compute future-reservations create
comandos. Com base nos recursos que quer reservar, inclua as seguintes flags:Para reservar VMs de GPU, inclua as flags
--total-count
e--machine-type
:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --total-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Para reservar TPUs, inclua as flags
--chip-count
e--tpu-version
:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Substitua o seguinte:
FUTURE_RESERVATION_NAME
: o nome do pedido.NUMBER_OF_VMS
: o número de VMs com GPU a reservar.MACHINE_TYPE
: o tipo de máquina de GPU a reservar.NUMBER_OF_CHIPS
: o número de chips de TPU a reservar.TPU_VERSION
: a versão da TPU a reservar. Especifique um dos seguintes valores:Para a TPU v6e:
V6E
Para a TPU v5p:
V5P
Para a TPU v5e:
V5E
Se especificar uma TPU v5e, tem de incluir a flag
--workload-type
. Defina o sinalizador para o tipo de cargas de trabalho que quer executar nas UTPs:Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de aprendizagem automática (AA), especifique
BATCH
.Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING
.
RESERVATION_NAME
: o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.SHARE_TYPE
: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:Para usar a capacidade apenas no seu projeto:
local
Para partilhar capacidade com outros projetos:
projects
Se especificar
projects
, tem de incluir a flag--share-with
definida como uma lista de IDs de projetos separados por vírgulas, por exemplo,project-1,project-2
. Pode especificar até 100 projetos na sua organização. Não inclua o ID do projeto nesta lista. Pode consumir a capacidade reservada por predefinição.START_TIME
: a hora de início do pedido, formatada como uma data/hora RFC 3339.END_TIME
: a hora de fim do período de reserva, formatada como uma data/hora RFC 3339. Se quiser especificar uma duração, em segundos, para o período de reserva em vez de uma hora de fim, substitua a flag--end-time
pela flag--duration
.ZONE
: a zona onde quer reservar recursos.
REST
Para criar um pedido de reserva futuro no modo de calendário e enviá-lo para revisão, envie o seguinte pedido
POST
para o método betafutureReservations.insert
. Com base nos recursos que quer reservar, inclua os seguintes campos no corpo do pedido:Para reservar VMs de GPU, inclua os campos
totalCount
emachineType
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "specificSkuProperties": { "totalCount": NUMBER_OF_VMS, "instanceProperties": { "machineType": "MACHINE_TYPE" } }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Para reservar TPUs, inclua os campos
acceleratorCount
evmFamily
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "aggregateReservation": { "reservedResources": [ { "accelerator": { "acceleratorCount": NUMBER_OF_CHIPS } } ], "vmFamily": "TPU_VERSION" }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Substitua o seguinte:
PROJECT_ID
: o ID do projeto onde quer criar o pedido.ZONE
: a zona onde quer reservar recursos.FUTURE_RESERVATION_NAME
: o nome do pedido.RESERVATION_NAME
: o nome da reserva que o Compute Engine cria automaticamente para aprovisionar a capacidade pedida.SHARE_TYPE
: se outros projetos na sua organização podem consumir a capacidade reservada. Especifique um dos seguintes valores:Para usar a capacidade apenas no seu projeto:
LOCAL
Para partilhar capacidade com outros projetos:
SPECIFIC_PROJECTS
Se especificar
SPECIFIC_PROJECTS
, no camposhareSettings
, tem de incluir o campoprojectMap
para especificar os projetos com os quais partilhar a capacidade. Pode especificar até 100 projetos na sua organização. Não especifique o ID do projeto. Pode consumir a capacidade reservada por predefinição.Por exemplo, para partilhar a capacidade pedida com outros dois projetos, inclua o seguinte:
"shareSettings": { "shareType": "SPECIFIC_PROJECTS", "projectMap": { "CONSUMER_PROJECT_ID_1": { "projectId": "CONSUMER_PROJECT_ID_1" }, "CONSUMER_PROJECT_ID_2": { "projectId": "CONSUMER_PROJECT_ID_2" } } }
Substitua
CONSUMER_PROJECT_ID_1
eCONSUMER_PROJECT_ID_2
pelos IDs de dois projetos que quer permitir que consumam a capacidade pedida.NUMBER_OF_VMS
: o número de VMs com GPU a reservar.MACHINE_TYPE
: o tipo de máquina de GPU a reservar.NUMBER_OF_CHIPS
: o número de chips de TPU a reservar.TPU_VERSION
: a versão da TPU a reservar. Especifique um dos seguintes valores:Para a TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
Para a TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
Para a TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Se especificar uma TPU v5e, no campo
aggregateResources
, tem de incluir o campoworkloadType
. Defina o campo para o tipo de cargas de trabalho que quer executar nas UTPs:Para cargas de trabalho que processam grandes quantidades de dados em operações únicas ou múltiplas, como cargas de trabalho de preparação de ML, especifique
BATCH
.Para cargas de trabalho que processam pedidos simultâneos e requerem uma latência de rede mínima, como cargas de trabalho de inferência de ML, especifique
SERVING
.
START_TIME
: a hora de início do pedido, formatada como uma data/hora RFC 3339.END_TIME
: a hora de fim do período de reserva, formatada como uma data/hora RFC 3339. Se quiser especificar uma duração, em segundos, para o período de reserva em vez de uma hora de fim, substitua o campoendTime
pelo campoduration
.
O que se segue?
Consuma uma reserva criada automaticamente para VMs de GPU no Compute Engine
Consuma uma reserva criada automaticamente para TPUs no Cloud TPU
Consuma uma reserva criada automaticamente usando tarefas de previsão da Vertex AI
Consuma uma reserva criada automaticamente usando tarefas de preparação do Vertex AI
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-09-19 UTC.
-