Se usó la API de Cloud Translation para traducir esta página.

Errores de la API de inferencia de IA generativa en Vertex AI

En esta guía, se proporciona una lista de errores que puedes encontrar si usas la referencia de la API de modelos para la IA generativa. Los errores siguen el modelo de error de la API de Google Cloud , que recomienda proporcionar orientación sobre las causas y las soluciones específicas de los modelos de IA generativa.

Errores de la API

En esta tabla, se proporcionan descripciones y códigos de error de la API.

Código de error HTTP	Código de error canónico	Causa	Ejemplo	Solución
400	`INVALID_ARGUMENT / FAILED_PRECONDITION`	La solicitud falla en la validación de la API o intentaste acceder a un modelo que requiere listas de anunciantes permitidos o no está permitido por la política de la organización.	La solicitud supera el límite de token de entrada del modelo.	Consulta la referencia de la API de modelos para la IA generativa a fin de conocer los parámetros de solicitud, el recuento de tokens y otros parámetros.
403	`PERMISSION_DENIED`	El cliente no tiene permisos suficientes para llamar a la API.	La cuenta de servicio no tiene permiso para acceder al bucket de Cloud Storage que aloja los recursos de imagen o video.	1. Verifica que todas las APIs necesarias estén habilitadas y que la cuenta de servicio tenga el permiso correcto para acceder al servicio de Vertex AI seleccionado. 2. La cuenta de servicio por producto y por proyecto (P4SA) de Vertex AI recibe el permiso necesario para acceder a los recursos a los que se hace referencia en la entrada.
404	`NOT_FOUND`	No se encontró ningún objeto válido en la URL designada.	No se encontró el archivo de imagen en la URL de almacenamiento.	Verifica y corrige la ubicación del archivo.
429	`RESOURCE_EXHAUSTED`	Según el mensaje de error, el error podría deberse a los siguientes motivos: 1. Cuota de API superior al límite. 2. Sobrecarga del servidor debido a la capacidad compartida del servidor. 3. Alcanzaste el límite diario de solicitudes con `logprobs`.	La API de Gemini supera el límite de solicitudes por minuto.	1. Consulta los límites de cuotas de la IA generativa de Vertex AI. Si es necesario, solicita una cuota más alta. 2. Vuelve a intentarlo después de unos segundos. Si el error persiste después de un período prolongado (horas), comunícate con el equipo de asistencia de Vertex AI. 3. Considera comprar capacidad de procesamiento aprovisionada.
499	`CANCELLED`	El cliente cancela la solicitud.
500	`UNKNOWN / INTERNAL`	Error del servidor debido a sobrecarga o falla de dependencia.	La solicitud está limitada porque el servicio está sobrecargado de forma temporal.	Vuelve a intentarlo después de unos segundos. Si el error persiste después de un período prolongado (horas), comunícate con el equipo de asistencia de Vertex AI.
503	`UNAVAILABLE`	El servicio no se encuentra disponible en este momento.	El servidor no responde a las solicitudes entrantes.	Es posible que el estado no disponible sea temporal. Sin embargo, si el error persiste, comunícate con la asistencia de Vertex AI.
504	`DEADLINE_EXCEEDED`	El cliente establece un plazo más corto que el plazo predeterminado del servidor (10 minutos), y la solicitud no finalizó dentro del plazo que proporcionó el cliente.	Considera aumentar la fecha límite que proporcionó el cliente.

Soluciona errores

Evita los aumentos repentinos de tráfico. Los aumentos repentinos son aumentos repentinos y significativos en la cantidad de solicitudes dentro de un período muy corto. A veces, los aumentos repentinos de tráfico pueden causar problemas para la aplicación de la cuota y pueden aumentar la posibilidad de que se sobrecargue el servidor.

Ten cuidado cuando vuelvas a intentar un evento. Te recomendamos volver a intentarlo no más de dos veces. El retraso mínimo es de un segundo y las solicitudes posteriores crean una copia de seguridad de manera exponencial.

¿Qué sigue?

La IA generativa en Vertex AI tiene algunas limitaciones. Para obtener más información, consulta Limitaciones de la API de PaLM.
Prueba un instructivo de guía de inicio rápido con Generative AI Studio o la API de Vertex AI.
Explora los modelos previamente entrenados en Model Garden.
Obtén información sobre las cuotas y los límites.
Más información sobre los precios.