Esta página se ha traducido con Cloud Translation API.

Descripción general de los datos tabulares

Vertex AI te permite realizar aprendizaje automático con datos tabulares mediante procesos e interfaces sencillos. Puedes crear los siguientes tipos de modelos para tus problemas de datos tabulares:

Los modelos de clasificación binaria predicen un resultado binario (una de las dos clases). Usa este tipo de modelo para preguntas que se responden con sí o no. Por ejemplo, puede crear un modelo de clasificación binaria para predecir si un cliente comprará una suscripción. Por lo general, un problema de clasificación binaria requiere menos datos que otros tipos de modelos.
Los modelos de clasificación de varias clases predicen una clase entre tres o más clases discretas. Usa este tipo de modelo para la categorización. Por ejemplo, si eres un comercio, puedes crear un modelo de clasificación multiclase para segmentar a los clientes en diferentes perfiles.
Los modelos de regresión predicen un valor continuo. Por ejemplo, si eres un comercio, puedes crear un modelo de regresión para predecir cuánto gastará un cliente el mes que viene.
Los modelos de previsión predicen una secuencia de valores. Por ejemplo, como comerciante, puede que quiera predecir la demanda diaria de sus productos durante los próximos tres meses para poder almacenar las existencias de productos de forma adecuada con antelación.

Para obtener una introducción al aprendizaje automático con datos tabulares, consulta el artículo Introducción a los datos tabulares. Para obtener más información sobre las soluciones de Vertex AI, consulta Soluciones de Vertex AI para clasificación y regresión y Soluciones de Vertex AI para previsión.

Nota sobre la imparcialidad

Google se compromete a seguir avanzando en la aplicación de prácticas responsables de la IA. Para ello, nuestros productos de aprendizaje automático, incluido AutoML, se han diseñado en torno a principios fundamentales, como la equidad y el aprendizaje automático centrado en las personas. Para obtener más información sobre las prácticas recomendadas para reducir el sesgo al crear tu propio sistema de aprendizaje automático, consulta la guía sobre la implementación de un aprendizaje automático inclusivo: AutoML.

Soluciones de clasificación y regresión de Vertex AI

Vertex AI ofrece las siguientes soluciones de clasificación y regresión:

Flujo de trabajo tabular para AutoML integral
Flujo de trabajo tabular de TabNet
Flujo de trabajo tabular para datos extensos y detallados
Clasificación y regresión con AutoML

Flujo de trabajo tabular para AutoML integral

El flujo de trabajo tabular de AutoML integral es una canalización de AutoML completa para tareas de clasificación y regresión. Es similar a la API AutoML, pero te permite elegir qué quieres controlar y qué quieres automatizar. En lugar de tener controles para toda la canalización, tienes controles para cada paso de la canalización. Estos controles de la canalización incluyen lo siguiente:

División de datos
Ingeniería de funciones
Búsqueda de arquitectura
Preparación de modelos
Ensamblado de modelos
Destilación de modelos

Ventajas

Admite conjuntos de datos de gran tamaño de varios terabytes y hasta 1000 columnas.
Te permite mejorar la estabilidad y reducir el tiempo de entrenamiento limitando el espacio de búsqueda de tipos de arquitectura u omitiendo la búsqueda de arquitectura.
Te permite mejorar la velocidad de entrenamiento seleccionando manualmente el hardware que se va a usar para el entrenamiento y la búsqueda de arquitectura.
Te permite reducir el tamaño del modelo y mejorar la latencia con la destilación o cambiando el tamaño del conjunto.
Cada componente de AutoML se puede inspeccionar en una interfaz de gráfico de canalizaciones potente que te permite ver las tablas de datos transformadas, las arquitecturas de modelos evaluadas y muchos más detalles.
Cada componente de AutoML obtiene más flexibilidad y transparencia, como la posibilidad de personalizar parámetros y hardware, ver el estado del proceso y los registros, entre otras opciones.

Para obtener más información sobre los flujos de trabajo tabulares, consulta Flujos de trabajo tabulares en Vertex AI. Para obtener más información sobre el flujo de trabajo tabular de AutoML integral, consulta Flujo de trabajo tabular de AutoML integral.

Flujo de trabajo tabular para TabNet

Tabular Workflow for TabNet es un flujo de procesamiento que puedes usar para entrenar modelos de clasificación o regresión. TabNet usa la atención secuencial para elegir las características que se deben tener en cuenta en cada paso de la decisión. Esto favorece la interpretabilidad y un aprendizaje más eficiente, ya que la capacidad de aprendizaje se utiliza para las funciones más destacadas.

Ventajas

Selecciona automáticamente el espacio de búsqueda de hiperparámetros adecuado en función del tamaño del conjunto de datos, el tipo de inferencia y el presupuesto de entrenamiento.
Integrado con Vertex AI. El modelo entrenado es un modelo de Vertex AI. Puedes ejecutar inferencias por lotes o desplegar el modelo para hacer inferencias online de inmediato.
Proporciona una interpretabilidad inherente del modelo. Puedes consultar qué funciones ha usado TabNet para tomar su decisión.
Admite el entrenamiento con GPU.

Para obtener más información sobre los flujos de trabajo tabulares, consulta Flujos de trabajo tabulares en Vertex AI. Para obtener más información sobre el flujo de trabajo tabular de TabNet, consulta Flujo de trabajo tabular de TabNet.

Flujo de trabajo tabular para modelos profundos y amplios

Tabular Workflow for Wide & Deep es un flujo de procesamiento que puedes usar para entrenar modelos de clasificación o regresión. Wide & Deep entrena conjuntamente modelos lineales amplios y redes neuronales profundas. Combina las ventajas de la memorización y la generalización. En algunos experimentos online, los resultados mostraron que Wide & Deep aumentó significativamente las adquisiciones de aplicaciones de Google Store en comparación con los modelos de solo ancho y solo profundidad.

Ventajas

Integrado con Vertex AI. El modelo entrenado es un modelo de Vertex AI. Puedes ejecutar inferencias por lotes o desplegar el modelo para hacer inferencias online de inmediato.

Para obtener más información sobre los flujos de trabajo tabulares, consulta Flujos de trabajo tabulares en Vertex AI. Para obtener más información sobre el flujo de trabajo tabular para modelos de aprendizaje profundo y amplio, consulta Flujo de trabajo tabular para modelos de aprendizaje profundo y amplio.

Clasificación y regresión con AutoML

Vertex AI ofrece flujos de trabajo integrados y totalmente gestionados para tareas de clasificación o regresión de extremo a extremo. Vertex AI busca el conjunto óptimo de hiperparámetros, entrena varios modelos con varios conjuntos de hiperparámetros y, a continuación, crea un único modelo final a partir de un conjunto de los mejores modelos. Vertex AI tiene en cuenta las redes neuronales y los árboles de refuerzo para los tipos de modelos.

Ventajas

Fácil de usar: Vertex AI elige el tipo de modelo, los parámetros del modelo y el hardware por ti.

Para obtener más información, consulta el artículo Descripción general de la clasificación y la regresión.

Soluciones de previsión de Vertex AI

Vertex AI ofrece las siguientes soluciones de previsión:

Flujo de trabajo tabular para las previsiones
Previsiones con AutoML
Previsiones con BigQuery ML ARIMA_PLUS
Previsiones con Prophet

Flujo de trabajo tabular para hacer previsiones

El flujo de trabajo tabular para las previsiones es la canalización completa para las tareas de previsión. Es similar a la API AutoML, pero te permite elegir qué controlar y qué automatizar. En lugar de tener controles para toda la canalización, tienes controles para cada paso de la canalización. Estos controles de la canalización incluyen lo siguiente:

División de datos
Ingeniería de funciones
Búsqueda de arquitectura
Preparación de modelos
Ensamblado de modelos

Ventajas

Admite conjuntos de datos de gran tamaño de hasta 1 TB y 200 columnas.
Te permite mejorar la estabilidad y reducir el tiempo de entrenamiento limitando el espacio de búsqueda de los tipos de arquitectura o saltándote la búsqueda de arquitectura.
Te permite mejorar la velocidad de entrenamiento seleccionando manualmente el hardware que se va a usar para el entrenamiento y la búsqueda de arquitectura.
Te permite reducir el tamaño del modelo y mejorar la latencia cambiando el tamaño del conjunto.
Cada componente se puede inspeccionar en una interfaz de gráfico de canalizaciones potente que te permite ver las tablas de datos transformadas, las arquitecturas de modelos evaluadas y muchos más detalles.
Cada componente obtiene más flexibilidad y transparencia, como la posibilidad de personalizar parámetros, hardware, ver el estado del proceso, los registros y más.

Para obtener más información sobre los flujos de trabajo tabulares, consulta Flujos de trabajo tabulares en Vertex AI. Para obtener más información sobre el flujo de trabajo tabular para las previsiones, consulta Flujo de trabajo tabular para las previsiones.

Previsiones con AutoML

Vertex AI ofrece una canalización integrada y totalmente gestionada para tareas de previsión completas. Vertex AI busca el conjunto óptimo de hiperparámetros, entrena varios modelos con varios conjuntos de hiperparámetros y, a continuación, crea un único modelo final a partir de un conjunto de los mejores modelos. Puedes elegir entre Time series Dense Encoder (TiDE), Temporal Fusion Transformer (TFT), AutoML (L2L) y Seq2Seq+ como método de entrenamiento del modelo. Vertex AI solo tiene en cuenta las redes neuronales para el tipo de modelo.

Ventajas

Fácil de usar: Vertex AI elige los parámetros del modelo y el hardware por ti.

Para obtener más información, consulta el artículo Introducción a las previsiones.

Hacer previsiones con BigQuery ML ARIMA_PLUS

BigQuery ML ARIMA_PLUS es un modelo de previsión univariante. Como modelo estadístico, se entrena más rápido que un modelo basado en redes neuronales. Te recomendamos que entrenes un modelo ARIMA_PLUS de BigQuery ML si necesitas realizar muchas iteraciones rápidas del entrenamiento de modelos o si necesitas una base de referencia económica para comparar otros modelos.

Al igual que Prophet, BigQuery ML ARIMA_PLUS intenta descomponer cada serie temporal en tendencias, temporadas y festivos, y genera una previsión mediante la agregación de las inferencias de estos modelos. Sin embargo, una de las muchas diferencias es que BQML ARIMA+ usa ARIMA para modelizar el componente de tendencia, mientras que Prophet intenta ajustar una curva mediante un modelo logístico o lineal por tramos.

Google Cloud ofrece una canalización para entrenar un modelo de BigQuery ML ARIMA_PLUS y otra para obtener inferencias por lotes de un modelo de BigQuery ML ARIMA_PLUS. Ambos flujos de procesamiento son instancias de Vertex AI Pipelines de Google Cloud Pipeline Components (GCPC).

Ventajas

Fácil de usar: BigQuery elige los parámetros del modelo y el hardware por ti.
Rápido: el entrenamiento de modelos proporciona una base de referencia de bajo coste con la que comparar otros modelos.

Para obtener más información, consulta Previsiones con ARIMA+.

Previsiones con Prophet

Prophet es un modelo de previsión mantenido por Meta. Consulta el artículo sobre Prophet para obtener información detallada sobre el algoritmo y la documentación para obtener más información sobre la biblioteca.

Al igual que BigQuery ML ARIMA_PLUS, Prophet intenta descomponer cada serie temporal en tendencias, temporadas y festivos, y genera una previsión mediante la agregación de las inferencias de estos modelos. Sin embargo, una diferencia importante es que ARIMA+ de BQML usa ARIMA para modelizar el componente de tendencia, mientras que Prophet intenta ajustar una curva mediante un modelo lineal o logístico por tramos.

Google Cloud ofrece un flujo de procesamiento para entrenar un modelo de Prophet y otro para obtener inferencias por lotes de un modelo de Prophet. Ambos flujos de procesamiento son instancias de Vertex AI Pipelines de Google Cloud Pipeline Components (GCPC).

La integración de Prophet con Vertex AI te permite hacer lo siguiente:

Usa las estrategias de división de datos y de ventanas de Vertex AI.
Leer datos de tablas de BigQuery o de archivos CSV almacenados en Cloud Storage. Vertex AI espera que cada fila tenga el mismo formato que Vertex AI Forecasting.

Aunque Prophet es un modelo multivariante, Vertex AI solo admite una versión univariante.

Ventajas

Flexible: puedes mejorar la velocidad de entrenamiento seleccionando el hardware que se va a usar.

Para obtener más información, consulta Previsiones con Prophet.

Siguientes pasos

Consulta información sobre el aprendizaje automático con datos tabulares.
Consulta información sobre la clasificación y la regresión con AutoML.
Consulta información sobre las previsiones con AutoML.
Consulta información sobre las previsiones con Prophet.
Consulta información sobre la previsión con BigQuery ML ARIMA_PLUS.
Consulta información sobre los flujos de trabajo tabulares.