Una predicción es el resultado de un modelo de aprendizaje automático entrenado. En esta página, se proporciona una descripción general del flujo de trabajo para obtener predicciones de tus modelos en Vertex AI.
Vertex AI ofrece dos métodos para obtener predicciones:
Las predicciones en línea son solicitudes síncronas realizadas en un modelo que se implementa en un
endpoint
. Por lo tanto, antes de enviar una solicitud, primero debes implementar el recursoModel
en un extremo. Esto asocia los recursos de procesamiento al modelo para que pueda entregar predicciones en línea con baja latencia. Usa predicciones en línea cuando realices solicitudes en respuesta a la entrada de la aplicación o en situaciones en las que se necesite una inferencia oportuna.Las predicciones por lotes son solicitudes asíncronas realizadas en un modelo que no se implementa en un extremo. Envías la solicitud (como un recurso
BatchPredictionsJob
) directamente al recursoModel
. Usa las predicciones por lotes cuando no necesites una respuesta inmediata y desees procesar datos acumulados mediante una sola solicitud.
Obtén predicciones a partir de modelos entrenados personalizados
Para obtener predicciones, primero debes importar tu modelo. Después de importarse, se convierte en un recurso Model
visible en Vertex AI Model Registry.
Luego, lee la siguiente documentación para aprender a obtener predicciones:
Obtén predicciones a partir de modelos de AutoML
A diferencia de los modelos entrenados personalizados, los modelos de AutoML se importan automáticamente a Vertex AI Model Registry después del entrenamiento.
Aparte de eso, el flujo de trabajo de los modelos de AutoML es similar, pero varía ligeramente según el tipo de datos y el objetivo del modelo. La documentación para obtener predicciones de AutoML se encuentra junto con la otra documentación de AutoML. Aquí hay vínculos a la documentación:
Imagen
Obtén información sobre cómo obtener predicciones a partir de los siguientes tipos de modelos de AutoML de imágenes:
Tabular
Obtén información sobre cómo obtener predicciones a partir de los siguientes tipos de modelos tabulares de AutoML:
Modelos de regresión y clasificación tabular
Modelos de previsión tabular (solo predicciones por lotes)
Texto
Obtén información sobre cómo obtener predicciones a partir de los siguientes tipos de modelos de AutoML de texto:
- Modelos de clasificación de texto
- Modelos de extracción de entidades de texto
- Modelos de análisis de opiniones de texto
Video
Obtén información sobre cómo obtener predicciones a partir de los siguientes tipos de modelos de AutoML de video:
- Modelos de reconocimiento de acciones en video (solo predicciones por lotes)
- Modelos de clasificación de videos (solo predicciones por lotes)
- Modelos de seguimiento de objetos de video (solo predicciones por lotes)
Obtén predicciones de los modelos de BigQuery ML
Existen dos maneras de obtener predicciones de los modelos de BigQuery ML:
- Puedes solicitar predicciones por lotes directamente desde el modelo en BigQuery ML.
- Puedes registrar los modelos directamente con el Model Registry, sin exportarlos desde BigQuery ML ni importarlos al registro.