Una predicción es el resultado de un modelo de aprendizaje automático entrenado. En esta página, se proporciona una descripción general del flujo de trabajo para obtener predicciones de tus modelos en Vertex AI.
Vertex AI ofrece dos métodos para obtener predicciones:
Las predicciones en línea son solicitudes síncronas realizadas en un modelo que se implementa en un
endpoint
. Por lo tanto, antes de enviar una solicitud, primero debes implementar el recursoModel
en un extremo. Esto asocia los recursos de procesamiento al modelo para que pueda entregar predicciones en línea con baja latencia. Usa predicciones en línea cuando realices solicitudes en respuesta a la entrada de la aplicación o en situaciones en las que se necesite una inferencia oportuna.Las predicciones por lotes son solicitudes asíncronas realizadas en un modelo que no se implementa en un extremo. Envías la solicitud (como un recurso
BatchPredictionsJob
) directamente al recursoModel
. Usa las predicciones por lotes cuando no necesites una respuesta inmediata y desees procesar datos acumulados mediante una sola solicitud.
Prueba el modelo de forma local
Antes de obtener predicciones, es útil implementar el modelo en un extremo local durante la fase de desarrollo y prueba. Esto te permite iterar con mayor rapidez y probar tu modelo sin implementarlo en un extremo en línea ni incurrir en costos de predicción. La implementación local está diseñada para el desarrollo y las pruebas locales, no para las implementaciones de producción.
Si deseas implementar un modelo de forma local, usa el SDK de Vertex AI para Python e implementa un LocalModel
en un LocalEndpoint
.
Para obtener una demostración, consulta este notebook.
Incluso si tu cliente no está escrito en Python, puedes usar el SDK de Vertex AI para Python a fin de iniciar el contenedor y el servidor para poder probar las solicitudes de tu cliente.
Obtén predicciones a partir de modelos entrenados personalizados
Para obtener predicciones, primero debes importar tu modelo. Después de importarse, se convierte en un recurso Model
visible en Vertex AI Model Registry.
Luego, lee la siguiente documentación para aprender a obtener predicciones:
¿Qué sigue?
- Obtén información sobre los recursos de Compute para la predicción.