En este documento se describen los diferentes tipos de reservas que puedes usar para reservar capacidad para instancias de Compute Engine. Para obtener más información sobre los recursos que usas para crear instancias, consulta Instancias de Compute Engine.
Las reservas te ayudan a asegurarte de que tienes los recursos disponibles para crear instancias con el mismo hardware (memoria y vCPUs) y recursos opcionales (GPUs, TPUs o discos SSD locales) cuando los necesites. Las reservas ofrecen las siguientes ventajas:
Alta garantía de capacidad: reservas recursos para hacer frente a futuros aumentos de la demanda, como los siguientes:
Crecimiento
Picos de uso planificados o no planificados
Migraciones de gran tamaño
Copias de seguridad y recuperación tras fallos
Acceso exclusivo: las reservas impiden que otros usuarios utilicen los recursos que has reservado.
Propiedades heredadas: las reservas heredan las mismas propiedades que la familia de máquinas que elijas.
Después de reservar capacidad, puedes usarla para crear instancias que coincidan con la reserva. No se aplican cargos adicionales cuando creas estas instancias. Solo pagas por los recursos que no forman parte de la reserva, como los discos o las direcciones IP.
Limitaciones
Todos los tipos de reservas tienen las siguientes limitaciones:
Las reservas son recursos específicos de una zona.
No puedes usar tu capacidad reservada para crear los siguientes recursos de Compute Engine:
Máquinas virtuales de acceso puntual o instancias interrumpibles
Nodos de único cliente
Elige un tipo de reserva
El siguiente diagrama te ayuda a elegir el tipo de reserva de Compute Engine que mejor se adapte a las necesidades de tu carga de trabajo:
Las preguntas del diagrama anterior son las siguientes:
¿Necesitas capacidad de inmediato?
Sí: ve a la siguiente pregunta.
No: ve a la pregunta 3.
¿Necesitas flexibilidad en cuanto al tiempo que se debe mantener la capacidad?
Sí: consulta Usar reservas bajo demanda.
No: ve a la siguiente pregunta.
¿Necesitas recursos de alta demanda, como GPUs?
Sí: ve a la siguiente pregunta.
No: consulta Usar reservas futuras.
¿Necesitas recursos durante más de 90 días?
Sí: consulta Usar reservas futuras en AI Hypercomputer.
No: consulta el artículo Usar reservas futuras en el modo Calendario.
Usar reservas bajo demanda
Con las reservas bajo demanda, puedes reservar capacidad para instancias de computación y obtenerla en cuanto la reserves. Una vez que hayas creado una reserva bajo demanda, podrás usarla, modificarla o eliminarla cuando lo necesites.
Para obtener más información, consulta Acerca de las reservas.
Usar reservas futuras
Para reservar instancias durante un periodo determinado, puedes usar reservas futuras. Después de crear una solicitud de reserva, debes enviarla a Google Cloud para que la revise.Google Cloud suele tardar cinco días en revisar tu solicitud. Si se aprueba tu solicitud, Compute Engine creará reservas bajo demanda con la capacidad que hayas solicitado en la fecha y la hora que hayas elegido. Para consumir estas reservas, crea instancias de computación que las usen. Una vez que finalice el periodo de reserva, podrás modificar o eliminar las reservas.
Para obtener más información, consulta Acerca de las solicitudes de reserva futuras.
Usar las reservas futuras en el modo Calendario
Para reservar instancias de GPU o TPUs durante un máximo de 90 días, puedes usar las reservas futuras en modo calendario. Para crear este tipo de reserva, primero debes consultar cuándo están disponibles en una región el número y el tipo de recursos que has elegido. A continuación, crea y envía una solicitud de reserva con las propiedades que hayas confirmado como disponibles. Si puedes crear la solicitud correctamente,Google Cloud la aprobará en un minuto. Una vez aprobada la solicitud, Compute Engine hace lo siguiente:
Compute Engine crea una reserva bajo demanda.
Compute Engine reserva los recursos solicitados lo más cerca posible entre sí para minimizar la latencia de la red.
Al inicio del periodo de reserva, puedes consumir la reserva creando instancias de GPU o TPU. Al final del periodo de reserva, Compute Engine elimina la reserva y detiene o elimina las instancias que la consumen en función de la acción de finalización que hayas especificado para las instancias.
Para obtener más información, consulta Acerca de las solicitudes de reserva futuras en el modo Calendario.
Usar reservas futuras en AI Hypercomputer
Ponte en contacto con tu equipo de cuenta y solicita reservar instancias de GPU para cargas de trabajo de inteligencia artificial (IA) y aprendizaje automático (ML) a gran escala. Una vez que Google cree una solicitud de reserva en borrador, envíala para que se revise si todo es correcto. Google Cloud aprobará la solicitud inmediatamente y, a continuación, Compute Engine hará lo siguiente:
Compute Engine crea reservas bajo demanda.
Compute Engine reserva los recursos solicitados lo más cerca posible entre sí para minimizar la latencia de la red.
Compute Engine reserva recursos con la programación basada en la topología, así como con la supervisión y el mantenimiento mejorados.
Al inicio del periodo de reserva, puedes consumir la reserva creando instancias de GPU. Al final del periodo de reserva, Compute Engine elimina la reserva y detiene o elimina las instancias que la consumen en función de la acción de finalización que hayas especificado para las instancias.
Para obtener más información, consulta Reservar capacidad en la documentación de AI Hypercomputer.