Vertex AI: Tarea de predicción

La tarea Vertex AI - Predecir te permite realizar una predicción en línea. Las predicciones en línea son solicitudes síncronas realizadas en un extremo del modelo. Puedes usar predicciones en línea cuando realices solicitudes en respuesta a las entradas de la aplicación o cuando necesites inferencias oportunas.

Vertex AI es un servicio de Google Cloud que permite entrenar y, también, implementar modelos de AA y aplicaciones de IA, y personalizar modelos de lenguaje grande (LLM) para usarlos en sus aplicaciones con tecnología de IA.

Antes de comenzar

Asegúrate de realizar las siguientes tareas en tu proyecto de Google Cloud antes de configurar la tarea Vertex AI - Predecir:

  1. Habilite la API de Vertex AI (aiplatform.googleapis.com).

    Habilita la API de Vertex AI

  2. Implementa el recurso de modelo en el recurso de extremo.
  3. Crea un perfil de autenticación. La integración de Apigee usa un perfil de autenticación para conectarse a un extremo de autenticación de la tarea Vertex AI - Predecir.
  4. Asegúrate de que los Controles del servicio de VPC NO estén configurados para la integración de Apigee en tu proyecto de Google Cloud.

Configura la tarea de predicción de Vertex AI - Predecir

  1. En la IU de Apigee, selecciona tu organización de Apigee.
  2. Haz clic en Desarrollar > Integraciones.
  3. Selecciona una integración existente o crea una nueva haciendo clic en Crear integración.

    Si creas una integración nueva, haz lo siguiente:

    1. Ingresa un nombre y una descripción en el diálogo Crear integración.
    2. En la lista de regiones compatibles, selecciona Región para la integración.
    3. Haz clic en Crear.

    Esto abrirá la integración en la página del diseñador de integración.

  4. En la barra de navegación Diseñador de integración, haz clic en +Agregar una tarea o un activador > Tareas para ver la lista de tareas disponibles.
  5. Haz clic y coloca el elemento Vertex AI - Predecir en el diseñador de integración.
  6. Haz clic en el elemento Vertex AI - Predecir en el diseñador para ver el panel de configuración de tareas Vertex AI - Predecir.
  7. Ve a Autenticación y selecciona un perfil de autenticación existente que desees usar.

    Opcional. Si no creaste un perfil de autenticación antes de configurar la tarea, haz clic en + Nuevo perfil de autenticación y sigue los pasos que se mencionan en Crea un perfil de autenticación nuevo.

  8. Ve a Entrada de tarea y configura los campos de entrada que se muestran con la siguiente tabla de parámetros de entrada de la tarea.

    Los cambios en los campos de entrada se guardan de forma automática.

Parámetros de entrada de la tarea

En la siguiente tabla, se describen los parámetros de entrada de la tarea Vertex AI - Predecir:

Propiedad Tipo de datos Descripción
Región Cadena Ubicación del extremo del modelo. Por ejemplo: us - Estados Unidos.
ProjectsId String Tu ID del proyecto de Google Cloud.
ExtremoCadena El nombre del extremo solicitado para entregar la predicción.
Solicitud JSON Consulta la estructura de JSON de solicitud.

Resultado de la tarea

La tarea Vertex AI - Predecir muestra una respuesta que contiene la predicción.

Estrategia de manejo de errores

Una estrategia de manejo de errores de una tarea específica la acción que se debe realizar si la tarea falla debido a un error temporal. Para obtener información sobre cómo usar una estrategia de manejo de errores y conocer los diferentes tipos de estrategias de manejo de errores, consulta Estrategias de manejo de errores.

¿Qué sigue?

  1. Agrega perímetros y condiciones perimetrales.
  2. Prueba y publica tu integración.
  3. Configura un activador.
  4. Agrega una tarea de asignación de datos.
  5. Consulta todas las tareas para los servicios de Google Cloud.