Errores de la API de inferencia de IA generativa en Vertex AI

En esta guía, se proporciona una lista de errores que puedes encontrar al usar la referencia de la API de modelo para la IA generativa. Los errores siguen el modelo de error de la API de Google Cloud, que recomienda que proporcionemos orientación sobre las causas y las soluciones específicas de los modelos de IA generativa.

Errores de la API

En esta tabla, se proporcionan descripciones y códigos de error de la API.

Código de error HTTP Código de error canónico Causa Ejemplo Solución
400 INVALID_ARGUMENT / FAILED_PRECONDITION La solicitud falla en la validación de la API, o intentaste acceder a un modelo que requiere una lista de entidades permitidas o que la política de la organización no permite. La solicitud excede el límite de tokens de entrada del modelo. Consulta la referencia de la API de modelo para la IA generativa a fin de conocer los parámetros de solicitud, el recuento de tokens y otros parámetros.
403 PERMISSION_DENIED El cliente no tiene permisos suficientes para llamar a la API. La cuenta de servicio no tiene permiso para acceder al bucket de Cloud Storage que aloja los recursos de imagen o video. 1. Verifica que todas las APIs necesarias estén habilitadas y que la cuenta de servicio tenga el permiso adecuado para acceder al servicio de Vertex AI seleccionado.

2. La cuenta de servicio por producto y por proyecto (P4SA) de Vertex AI recibe el permiso necesario para acceder a los recursos a los que se hace referencia en la entrada.
404 NOT_FOUND No se encontró ningún objeto válido en la URL designada. No se encontró el archivo de imagen en la URL de almacenamiento. Verifica y repara la ubicación del archivo.
429 RESOURCE_EXHAUSTED Según el mensaje de error, el error podría deberse a los siguientes motivos:

1. Cuota de API sobre el límite.

2. Sobrecarga del servidor debido a la capacidad del servidor compartido.
La API de Gemini supera el límite de solicitudes por minuto. 1. Consulta los límites de cuotas de IA generativa de Vertex AI. Si es necesario, solicita una cuota más alta.

2. Vuelve a intentarlo después de unos segundos. Si el error persiste después de un período prolongado (horas), comunícate con el equipo de asistencia de Vertex AI.
499 CANCELLED El cliente cancela la solicitud.
500 UNKNOWN / INTERNAL Error del servidor debido a una sobrecarga o una falla de la dependencia. La solicitud está limitada porque el servicio está sobrecargado de forma temporal. Vuelve a intentarlo después de unos segundos. Si el error persiste después de un período prolongado (horas), comunícate con el equipo de asistencia de Vertex AI.
503 UNAVAILABLE El servicio no se encuentra disponible en este momento. El servidor no responde a las solicitudes entrantes. El estado no disponible puede ser temporal. Sin embargo, si el error persiste, comunícate con el equipo de Asistencia de Vertex AI.
504 DEADLINE_EXCEEDED El cliente establece un plazo más corto que la fecha límite predeterminada del servidor (10 minutos) y la solicitud no finalizó dentro del plazo que proporciona el cliente. Considera aumentar el plazo proporcionado por el cliente.

Maneja errores

Evita los aumentos repentinos de tráfico. Los aumentos repentinos son aumentos repentinos y significativos en la cantidad de solicitudes dentro de un período muy corto. A veces, los aumentos repentinos de tráfico pueden causar problemas para la aplicación de la cuota y pueden aumentar la posibilidad de sobrecarga del servidor.

Ten cuidado cuando reintentes un evento. Te recomendamos que vuelvas a intentarlo no más de dos veces. El retraso mínimo es de un segundo y las solicitudes posteriores se crean copias de seguridad de manera exponencial.

¿Qué sigue?