Errores de la API de inferencia de IA generativa en Vertex AI

En esta guía, se proporciona una lista de errores que puedes encontrar si usas la referencia de la API de modelos para la IA generativa. Los errores siguen el modelo de error de la API de Google Cloud, que recomienda proporcionar orientación sobre las causas y las soluciones específicas de los modelos de IA generativa.

Errores de la API

En esta tabla, se proporcionan descripciones y códigos de error de la API.

Código de error HTTP Código de error canónico Causa Ejemplo Solución
400 INVALID_ARGUMENT / FAILED_PRECONDITION La solicitud falla en la validación de la API o intentaste acceder a un modelo que requiere listas de anunciantes permitidos o no está permitido por la política de la organización. La solicitud supera el límite de token de entrada del modelo. Consulta la referencia de la API de modelos para la IA generativa a fin de conocer los parámetros de solicitud, el recuento de tokens y otros parámetros.
403 PERMISSION_DENIED El cliente no tiene permisos suficientes para llamar a la API. La cuenta de servicio no tiene permiso para acceder al bucket de Cloud Storage que aloja los recursos de imagen o video. 1. Verifica que todas las APIs necesarias estén habilitadas y que la cuenta de servicio tenga el permiso correcto para acceder al servicio de Vertex AI seleccionado.

2. La cuenta de servicio por producto y por proyecto (P4SA) de Vertex AI recibe el permiso necesario para acceder a los recursos a los que se hace referencia en la entrada.
404 NOT_FOUND No se encontró ningún objeto válido en la URL designada. No se encontró el archivo de imagen en la URL de almacenamiento. Verifica y corrige la ubicación del archivo.
429 RESOURCE_EXHAUSTED Según el mensaje de error, el error podría deberse a los siguientes motivos:

1. Cuota de API superior al límite.

2. Sobrecarga del servidor debido a la capacidad compartida del servidor.
La API de Gemini supera el límite de solicitudes por minuto. 1. Consulta los límites de cuotas de la IA generativa de Vertex AI. Si es necesario, solicita una cuota más alta.

2. Vuelve a intentarlo después de unos segundos. Si el error persiste después de un período prolongado (horas), comunícate con el equipo de asistencia de Vertex AI.
499 CANCELLED El cliente cancela la solicitud.
500 UNKNOWN / INTERNAL Error del servidor debido a sobrecarga o falla de dependencia. La solicitud está limitada porque el servicio está sobrecargado de forma temporal. Vuelve a intentarlo después de unos segundos. Si el error persiste después de un período prolongado (horas), comunícate con el equipo de asistencia de Vertex AI.
503 UNAVAILABLE El servicio no se encuentra disponible en este momento. El servidor no responde a las solicitudes entrantes. Es posible que el estado no disponible sea temporal. Sin embargo, si el error persiste, comunícate con la asistencia de Vertex AI.
504 DEADLINE_EXCEEDED El cliente establece un plazo más corto que el plazo predeterminado del servidor (10 minutos), y la solicitud no finalizó dentro del plazo que proporcionó el cliente. Considera aumentar la fecha límite que proporcionó el cliente.

Soluciona errores

Evita los aumentos repentinos de tráfico. Los aumentos repentinos son aumentos repentinos y significativos en la cantidad de solicitudes dentro de un período muy corto. A veces, los aumentos repentinos de tráfico pueden causar problemas para la aplicación de la cuota y pueden aumentar la posibilidad de que se sobrecargue el servidor.

Ten cuidado cuando vuelvas a intentar un evento. Te recomendamos volver a intentarlo no más de dos veces. El retraso mínimo es de un segundo y las solicitudes posteriores crean una copia de seguridad de manera exponencial.

¿Qué sigue?