Descripción general de las ponderaciones del modelo de BigQuery ML

En este documento se describe cómo BigQuery ML admite la visibilidad de las ponderaciones de modelo para los modelos de aprendizaje automático (AA).

Un modelo de AA es un artefacto que se guarda después de ejecutar un algoritmo de AA en los datos de entrenamiento. El modelo representa las reglas, los números y cualquier otra estructura de datos específica del algoritmo que se requiera para realizar predicciones. Estos son algunos ejemplos:

  • Un modelo de regresión lineal está compuesto por un vector de coeficientes que tienen valores específicos.
  • Un modelo de árbol de decisión está compuesto por uno o más árboles de declaraciones if-then que tienen valores específicos.
  • Un modelo de red neuronal profunda está compuesto por una estructura de grafos con vectores o matrices de ponderaciones que tienen valores específicos.

En BigQuery ML, el término ponderaciones del modelo se usa para describir los componentes de un modelo.

A fin de obtener información sobre las instrucciones y funciones de SQL compatibles para cada tipo de modelo, consulta Recorrido del usuario de extremo a extremo para cada modelo.

Ofertas de ponderaciones de modelos en BigQuery ML

BigQuery ML ofrece varias funciones que puedes usar a fin de recuperar las ponderaciones del modelo para diferentes modelos.

Categoría del modelo Tipos de modelos Funciones de ponderaciones de modelos Qué hace la función
Modelos supervisados Regresión lineal y logística ML.WEIGHTS Recupera los coeficientes de atributos y la interceptación.
Modelos no supervisados Kmeans ML.CENTROIDS Recupera los coeficientes de atributos para todos los centroides.
Factorización de matrices ML.WEIGHTS Recupera las ponderaciones de todos los factores latentes. Representan las dos matrices descompuestas, la matriz del usuario y la matriz del elemento.
PCA ML.PRINCIPAL_COMPONENTS Recupera los coeficientes de atributos para todos los componentes principales, también conocidos como eigenvectores.
ML.PRINCIPAL_COMPONENT_INFO Recupera las estadísticas de cada componente principal, como eigenvalor.
Modelos de serie temporal ARIMA_PLUS ML.ARIMA_COEFFICIENTS Recupera los coeficientes del modelo ARIMA, que se usa para modelar el componente de tendencia de las series temporales de entrada. Para obtener información sobre otros componentes, como los patrones estacionales que están presentes en las series temporales, usa ML.ARIMA_EVALUATE.

BigQuery ML no admite funciones de ponderación del modelo para los siguientes tipos de modelos:

Para ver las ponderaciones de todos estos tipos de modelos, excepto las de AutoML Tables, exporta el modelo de BigQuery ML a Cloud Storage. Luego, puedes usar la biblioteca XGBoost a fin de visualizar la estructura de árbol para los modelos con boosting y de bosque aleatorios, o la biblioteca de TensorFlow a fin de visualizar la estructura de grafos para modelos de DNN, y profundos y amplios. No hay un método para obtener información de ponderación del modelo para los modelos de AutoML Tables.

Para obtener más información sobre la exportación de un modelo, consulta la sentencia EXPORT MODEL y Exporta un modelo de BigQuery ML para la predicción en línea.