Errores de la API de inferencia de IA generativa en Vertex AI

En esta guía se incluye una lista de errores que pueden producirse al usar la referencia de la API Model para la IA generativa. Los errores siguen el modelo de errores de la Google Cloud API, que recomienda que proporcionemos orientación sobre las causas y las soluciones específicas de los modelos de IA generativa.

Errores de la API

En esta tabla se proporcionan los códigos de error y las descripciones de la API.

Código de error HTTP Código de error canónico Causa Ejemplo Solución
400 INVALID_ARGUMENT / FAILED_PRECONDITION La solicitud no supera la validación de la API o has intentado acceder a un modelo que requiere que se te incluya en una lista de permitidos o que la política de la organización no permite. La solicitud supera el límite de tokens de entrada del modelo. Consulta la referencia de la API Model de IA generativa para ver los parámetros de solicitud, el recuento de tokens y otros parámetros.
403 PERMISSION_DENIED El cliente no tiene suficientes permisos para llamar a la API. La cuenta de servicio no tiene permiso para acceder al segmento de Cloud Storage que aloja los recursos de imagen o vídeo. 1. Verifica que todas las APIs necesarias estén habilitadas y que la cuenta de servicio tenga el permiso adecuado para acceder al servicio de Vertex AI seleccionado.

2. A la cuenta de servicio por producto y por proyecto (P4SA) de Vertex AI se le concede el permiso necesario para acceder a los recursos a los que se hace referencia en la entrada.
404 NOT_FOUND No se ha encontrado ningún objeto válido en la URL designada. No se ha encontrado el archivo de imagen en la URL de almacenamiento. Comprueba y corrige la ubicación del archivo.
429 RESOURCE_EXHAUSTED En función del mensaje de error, este puede deberse a lo siguiente:

1. Se ha superado el límite de cuota de la API.

2. Sobrecarga del servidor debido a la capacidad del servidor compartido.

3. Has alcanzado el límite diario de solicitudes con logprobs.
La API de Gemini supera el límite de solicitudes por minuto. 1. Consulta los límites de cuota de la IA generativa de Vertex AI. Si es necesario, solicita una cuota superior.

2. Vuelve a intentarlo en unos segundos. Si el error persiste durante un periodo prolongado (horas), ponte en contacto con el equipo de Asistencia de Vertex AI.

3. Plantéate comprar Capacidad de procesamiento reservada.
499 CANCELLED El cliente ha cancelado la solicitud.
500 UNKNOWN / INTERNAL Error del servidor debido a una sobrecarga o a un fallo de dependencia. La solicitud se ha limitado porque el servicio está sobrecargado temporalmente. Vuelve a intentarlo en unos segundos. Si el error persiste durante un periodo prolongado (horas), ponte en contacto con el equipo de Asistencia de Vertex AI.
503 UNAVAILABLE El servicio no está disponible temporalmente. El servidor no responde a las solicitudes entrantes. Es posible que el estado no disponible sea temporal. Sin embargo, si el error persiste, ponte en contacto con el equipo de Asistencia de Vertex AI.
504 DEADLINE_EXCEEDED El cliente establece un plazo inferior al plazo predeterminado del servidor (10 minutos) y la solicitud no se ha completado en el plazo proporcionado por el cliente. Te recomendamos que aumentes el plazo que te ha dado el cliente.

Gestionar errores

Evita los picos de tráfico. Los picos son aumentos repentinos y significativos del número de solicitudes en un periodo muy breve. A veces, los picos de tráfico pueden provocar problemas con la aplicación de las cuotas y aumentar las probabilidades de que se sobrecargue el servidor.

Ten cuidado al volver a intentar un evento. Te recomendamos que lo intentes dos veces como máximo. El retraso mínimo es de un segundo y las solicitudes posteriores se acumulan de forma exponencial.

Siguientes pasos