Predicciones en línea
Las predicciones en línea son solicitudes síncronas realizadas en un extremo del modelo. Usa predicciones en línea cuando realices solicitudes en respuesta a la entrada de la aplicación o en situaciones en las que se necesite una inferencia oportuna.
Implementación del modelo
Debes implementar un modelo en un extremo antes de que se pueda usar para entregar predicciones en línea. La implementación de un modelo asocia recursos físicos con el modelo para que pueda entregar predicciones en línea con baja latencia.
Puedes implementar más de un modelo en un extremo y puedes implementar un modelo en más de un extremo. Para obtener más información sobre las opciones y los casos de uso a fin de implementar modelos, consulta Consideraciones para la implementación de modelos.
Para obtener información sobre cómo implementar un modelo de AutoML, consulta la sección Obtén predicciones a partir de modelos de AutoML de esta página y selecciona la página que sea relevante para tu modelo.
Para obtener información sobre cómo implementar un modelo entrenado personalizado, consulta Obtén predicciones a partir de un modelo entrenado personalizado.
Predicciones por lotes
Las predicciones por lotes son solicitudes asíncronas. Las predicciones por lotes se solicitan directamente desde el recurso de modelo sin necesidad de implementar el modelo en un extremo. Usa las predicciones por lotes cuando no necesites una respuesta inmediata y desees procesar datos acumulados mediante una sola solicitud.
Obtén predicciones a partir de modelos de AutoML
Puedes obtener predicciones en línea o por lotes desde los modelos de AutoML mediante la consola de Google Cloud o la API de Vertex AI. Las instrucciones para realizar esto pueden variar según el tipo de datos y el objetivo del modelo:
Imagen
Obtén información sobre cómo obtener predicciones a partir de los siguientes tipos de modelos de AutoML de imágenes:
Tabular
Obtén información sobre cómo obtener predicciones a partir de los siguientes tipos de modelos tabulares de AutoML:
Modelos de regresión/clasificación tabular
Modelos de previsión tabular (solo predicciones por lotes)
Texto
Obtén información sobre cómo obtener predicciones a partir de los siguientes tipos de modelos de AutoML de texto:
- Modelos de clasificación de texto
- Modelos de extracción de entidades de texto
- Modelos de análisis de opiniones de texto
Video
Obtén información sobre cómo obtener predicciones a partir de los siguientes tipos de modelos de AutoML de video:
- Modelos de reconocimiento de acciones de video (solo predicciones por lotes)
- Modelos de clasificación de videos (solo predicciones por lotes)
- Modelos de seguimiento de objetos de video (solo predicciones por lotes)
Obtén predicciones a partir de modelos entrenados personalizados
Las instrucciones para obtener predicciones en línea y por lotes de tu modelo entrenado personalizado son las mismas, sin importar el tipo de datos o el objetivo del modelo.
Para obtener más detalles, consulta Obtén predicciones a partir de un modelo entrenado personalizado.