Desde el 29 de abril del 2025, los modelos Gemini 1.5 Pro y Gemini 1.5 Flash no están disponibles en proyectos donde no se hayan utilizado previamente, incluidos los proyectos nuevos. Para obtener más información, consulta Versiones y ciclo de vida de los modelos.
Organízate con las colecciones
Guarda y clasifica el contenido según tus preferencias.
Vertex AI ofrece dos formas de gestionar el rendimiento de tus modelos de IA generativa, lo que te permite equilibrar el coste, la flexibilidad y el rendimiento. Puedes usar un modelo flexible de pago por uso o reservar una cantidad de capacidad de procesamiento dedicada por un precio fijo.
Pago por uso
En el modelo predeterminado de pago por uso, Vertex AI usa la cuota compartida dinámica, que no tiene un límite de uso predefinido. En su lugar, obtienes acceso a un gran conjunto de recursos compartidos que se asignan dinámicamente en función de la disponibilidad y la demanda en tiempo real.
Este modelo permite que tus cargas de trabajo usen más recursos cuando estén disponibles.
Si recibes un error resource exhausted (429), significa que el grupo compartido está experimentando temporalmente una gran demanda de muchos usuarios a la vez. Deberías implementar mecanismos de reintento en tu aplicación, ya que la disponibilidad puede cambiar rápidamente.
Capacidad reservada
En el caso de las aplicaciones de producción críticas que requieren un rendimiento constante y costes predecibles, puedes usar Rendimiento aprovisionado.
El rendimiento aprovisionado es una suscripción de coste fijo que reserva una cantidad específica de rendimiento para tus modelos en una ubicación elegida.
[[["Es fácil de entender","easyToUnderstand","thumb-up"],["Me ofreció una solución al problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Es difícil de entender","hardToUnderstand","thumb-down"],["La información o el código de muestra no son correctos","incorrectInformationOrSampleCode","thumb-down"],["Me faltan las muestras o la información que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-12 (UTC)."],[],[],null,[]]