Entrena un modelo de AutoML (Cloud Console)

En esta página, se describe cómo entrenar un modelo de AutoML con Google Cloud Console.

Si quieres obtener información sobre cómo usar la API de Vertex AI para entrenar un modelo de AutoML, consulta Entrena un modelo de AutoML con la API de Vertex AI.

Antes de comenzar

Antes de entrenar un modelo, debes preparar tus datos de entrenamiento, crear un conjunto de datos y asociar los datos al conjunto.

Entrena un modelo de AutoML

  1. En Google Cloud Console, en la sección Vertex AI, ve a la página Conjuntos de datos.

    Ir a la página Conjuntos de datos

  2. Haz clic en el nombre del conjunto de datos que deseas usar para entrenar tu modelo a fin de abrir su página de detalles.

  3. Si tu tipo de datos usa conjuntos de anotaciones, selecciona el conjunto de anotaciones que deseas usar para este modelo.

  4. Haz clic en Entrenar modelo nuevo.

  5. En la página Entrena un modelo nuevo, completa los siguientes pasos para tu tipo de datos:

    Imagen

    1. Selecciona AutoML para el método de entrenamiento y haz clic en Continuar.

    2. Ingresa el nombre visible de tu modelo nuevo.

    3. Si deseas configurar el forma en que se dividen los datos de entrenamiento, expande Opciones avanzadas y selecciona una opción de división de datos. Obtenga más información.

    4. Haga clic en Continuar.

    5. Solo modelos de detección de objetos: En la sección Optimiza tu modelo, selecciona la opción que deseas optimizar (exactitud o latencia).

    6. Haga clic en Continuar.

    7. Solo modelos de clasificación (opcional): En la sección Explicabilidad, selecciona Generar mapas de bits explicables. para cada imagen en el conjunto de prueba a fin de habilitar Vertex Explainable AI. Elige la configuración de visualización y haz clic en Continuar.

      Esta función tiene costos asociados. Consulta Precios para obtener más información.

    8. En la ventana Procesamiento y precio, ingresa la cantidad máxima de horas por la que se entrenará tu modelo.

      Esta configuración te ayuda a limitar los costos de entrenamiento. El tiempo real transcurrido puede ser más largo que este valor, ya que hay otras operaciones involucradas en la creación de un modelo nuevo.

    9. Si deseas detener el entrenamiento cuando el modelo ya no mejore, selecciona Habilitar interrupción anticipada.

    10. Haga clic en Comenzar entrenamiento.

      El entrenamiento de modelos puede tardar muchas horas, según el tamaño y la complejidad de tus datos y tu presupuesto de entrenamiento, si especificaste uno. Puedes cerrar esta pestaña y regresar a ella más tarde. Recibirás un correo electrónico cuando tu modelo haya finalizado el entrenamiento.

    Tabular

    Selecciona tu objetivo

    Clasificación, regresión

    1. Selecciona AutoML para el método de entrenamiento y haz clic en Continuar.

    2. Ingresa el nombre visible de tu modelo nuevo.

    3. Selecciona la columna objetivo.

      La columna objetivo es el valor que el modelo predecirá.

      Obtén más información sobre los requisitos de las columnas de destino.

    4. Si deseas exportar tu conjunto de datos de prueba a BigQuery, marca Exportar conjunto de datos de prueba a BigQuery y proporciona el nombre de la tabla.

    5. Si deseas controlar la división de los datos de forma manual, abre las Opciones avanzadas.

      La división de datos predeterminada es aleatoria. Según tus datos, puedes seleccionar Manual para usar una columna de división de datos, controlar los porcentajes de la división o proporcionar una columna de tiempo. Obtén más información sobre las divisiones de datos.

    6. Haga clic en Continuar.

    7. Si aún no lo hiciste, haz clic en Generar estadísticas.

      La generación de estadísticas propaga los menús desplegables de Transformación.

    8. En la página Opciones de entrenamiento, revisa tu lista de columnas y excluye del entrenamiento todas las que no se deban usar para entrenar el modelo.

      Si usas una columna de división de datos, esta debe incluirse.

    9. Revisa las transformaciones seleccionadas para los atributos incluidos, junto con la posibilidad de permitir datos no válidos y realiza las actualizaciones necesarias.

      Obtén más información sobre las transformaciones y los datos no válidos.

    10. Si deseas especificar una columna de peso o cambiar tu objetivo de optimización del valor predeterminado, abre las Opciones avanzadas y realiza tus selecciones.

      Obtén más información sobre las columnas de ponderación y los objetivos de optimización.

    11. Haga clic en Continuar.

    12. En la ventana Procesamiento y precio, ingresa la cantidad máxima de horas por la que se entrenará tu modelo.

      Esta configuración te ayuda a limitar los costos de entrenamiento. El tiempo real transcurrido puede ser más largo que este valor, ya que hay otras operaciones involucradas en la creación de un modelo nuevo.

      El tiempo de entrenamiento sugerido se relaciona con el tamaño de los datos de entrenamiento. En la siguiente tabla, se muestran los intervalos de tiempo de entrenamiento sugeridos por conteo de filas; una gran cantidad de columnas también aumentará el tiempo de entrenamiento.

      Filas Tiempo de entrenamiento sugerido
      Menor que 100,000 1-3 horas
      100,000-1,000,000 1-6 horas
      1,000,000-10,000,000 1-12 horas
      Más de 10,000,000 3-24 horas

      Para obtener información sobre los precios de entrenamiento, consulta la página de precios.

    13. Haga clic en Comenzar entrenamiento.

      El entrenamiento de modelos puede tardar muchas horas, según el tamaño y la complejidad de tus datos y tu presupuesto de entrenamiento, si especificaste uno. Puedes cerrar esta pestaña y regresar a ella más tarde. Recibirás un correo electrónico cuando tu modelo haya finalizado el entrenamiento.

    Previsión

    1. Selecciona AutoML para el método de entrenamiento y haz clic en Continuar.

    2. Ingresa el nombre visible de tu modelo nuevo.

    3. Selecciona la columna objetivo.

      La columna objetivo es el valor que el modelo predecirá. Obtén más información sobre los requisitos de las columnas de destino.

    4. Si no configuraste las columnas Identificador de la serie y Marca de tiempo en el conjunto de datos, selecciónalas ahora.

    5. Selecciona el Nivel de detalle de los datos.

      Obtenga más información.

    6. Ingresa la ventana de contexto y el horizonte de previsión.

      Si no especificas una ventana de contexto, se usa de forma predeterminada el valor establecido para el horizonte de previsión. Si deseas obtener más información, consulta Consideraciones para establecer la ventana de contexto y el horizonte de previsión.

    7. Si deseas exportar tu conjunto de datos de prueba a BigQuery, marca Exportar conjunto de datos de prueba a BigQuery y proporciona el nombre de la tabla.

    8. Si deseas que Vertex AI continúe con el entrenamiento, incluso si los datos tienen errores de validación, puedes seleccionar Ignorar validación.

      A menos que comprendas la fuente de los errores de datos y su impacto en la calidad del modelo, debes permitir que Vertex AI cancele el entrenamiento por errores de validación.

    9. Si deseas controlar la división de los datos de forma manual, abre las Opciones avanzadas.

      La división de datos predeterminada es cronológica, con los porcentajes estándar 80/10/10. Si deseas especificar de forma manual qué filas se asignan a qué división, selecciona Manual y especifica la columna de división de datos.

      Obtén más información sobre las divisiones de datos.

    10. Haga clic en Continuar.

    11. Si aún no lo hiciste, haz clic en Generar estadísticas.

      La generación de estadísticas propaga los menús desplegables de Transformación.

    12. En la página Opciones de entrenamiento, revisa tu lista de columnas y excluye del entrenamiento todas las que no se deban usar para entrenar el modelo.

      Si usas una columna de división de datos, esta debe incluirse.

    13. Revisa las transformaciones seleccionadas para los atributos incluidos y realiza las actualizaciones necesarias.

      Las filas que contienen datos que no son válidos para la transformación seleccionada se excluyen del entrenamiento. Obtén más información sobre las transformaciones.

    14. Para cada columna que incluiste en el entrenamiento, especifica el Tipo de atributo para indicar cómo se relaciona ese atributo con su serie temporal y si está disponible en el momento de la previsión. Obtén más información sobre el tipo y la disponibilidad de los atributos.

    15. Si deseas especificar una columna de peso o cambiar tu objetivo de optimización del valor predeterminado, abre las Opciones avanzadas y realiza tus selecciones.

      Obtén más información sobre las columnas de ponderación y los objetivos de optimización.

    16. Haga clic en Continuar.

    17. En la ventana Procesamiento y precio, ingresa la cantidad máxima de horas por la que se entrenará tu modelo.

      Esta configuración te ayuda a limitar los costos de entrenamiento. El tiempo real transcurrido puede ser más largo que este valor, ya que hay otras operaciones involucradas en la creación de un modelo nuevo.

      El tiempo de entrenamiento sugerido se relaciona con el tamaño del horizonte de previsión y los datos de entrenamiento. En la siguiente tabla, se muestran algunas ejecuciones de entrenamiento de previsión de muestra y el intervalo de tiempo de entrenamiento necesario para entrenar un modelo de alta calidad.

      Filas Características Horizonte de previsión Tiempo de entrenamiento
      12 millones 10 6 De 3 a 6 horas
      20 millones 50 13 De 6 a 12 horas
      16 millones 30 365 De 24 a 48 horas

      Para obtener información sobre los precios de entrenamiento, consulta la página de precios.

    18. Haga clic en Comenzar entrenamiento.

      El entrenamiento de modelos puede tardar muchas horas, según el tamaño y la complejidad de tus datos y tu presupuesto de entrenamiento, si especificaste uno. Puedes cerrar esta pestaña y regresar a ella más tarde. Recibirás un correo electrónico cuando tu modelo haya finalizado el entrenamiento.

    Text

    1. Para el método de entrenamiento, selecciona AutoML.

    2. Haga clic en Continuar.

    3. Ingresa un nombre para el modelo.

    4. Si deseas configurar el forma en que se dividen los datos de entrenamiento, expande Opciones avanzadas y selecciona una opción de división de datos. Obtenga más información.

    5. Haga clic en Comenzar entrenamiento.

      El entrenamiento de modelos puede tardar muchas horas, según el tamaño y la complejidad de tus datos y tu presupuesto de entrenamiento, si especificaste uno. Puedes cerrar esta pestaña y regresar a ella más tarde. Recibirás un correo electrónico cuando tu modelo haya finalizado el entrenamiento.

    Video

    1. Ingresa el nombre visible de tu modelo nuevo.

    2. Si deseas configurar el forma en que se dividen los datos de entrenamiento, expande Opciones avanzadas y selecciona una opción de división de datos. Obtenga más información.

    3. Haga clic en Continuar.

    4. Selecciona AutoML para el método de entrenamiento y haz clic en Continuar.

    5. Haga clic en Comenzar entrenamiento.

      El entrenamiento de modelos puede tardar muchas horas, según el tamaño y la complejidad de tus datos y tu presupuesto de entrenamiento, si especificaste uno. Puedes cerrar esta pestaña y regresar a ella más tarde. Recibirás un correo electrónico cuando tu modelo haya finalizado el entrenamiento.

      Varios minutos después de que comienza el entrenamiento, puedes verificar la estimación de la hora de procesamiento de nodo del entrenamiento con la información de las propiedades del modelo. Si cancelas el entrenamiento, no se aplicarán cargos por el producto actual.

¿Qué sigue?