Descripción general de Explainable AI de BigQuery

En este documento, se describe cómo BigQuery ML admite la inteligencia artificial (IA) de Explainable, a veces llamada XAI.

Explainable AI te ayuda a comprender los resultados que genera el modelo de aprendizaje automático predictivo para las tareas de clasificación y regresión definiendo cómo cada atributo de una fila de datos contribuyó al resultado previsto. A menudo, esta información se conoce como atribución de atributos. Puedes usar esta información para verificar que el modelo se comporte según lo previsto, reconocer sesgos en los modelos y fundamentar formas de mejorar el modelo y los datos de entrenamiento.

Para obtener información sobre las instrucciones y funciones de SQL compatibles para cada tipo de modelo, consulta Recorrido del usuario de extremo a extremo para cada modelo.

Comparación entre la explicabilidad local y global

Existen dos tipos de explicabilidad: local y global. También se conocen como importancia local y global de los atributos.

  • La explicabilidad local muestra valores de atribución de atributos para cada ejemplo explicado. Estos valores describen cuánto afectó un atributo en particular a la predicción en relación con la predicción del modelo de referencia.
  • La explicabilidad global muestra la influencia general del atributo en el modelo y, a menudo, se obtiene con la agregación de las atribuciones de atributos en todo el conjunto de datos. Un valor absoluto más alto indica que el atributo tuvo una mayor influencia en las predicciones del modelo.

Ofertas de Explainable AI en BigQuery ML

Explainable AI en BigQuery ML es compatible con una variedad de modelos de aprendizaje automático, incluidos modelos de series temporales y no temporales. Cada uno de ellos aprovecha un método de explicabilidad diferente.

Si deseas usar Explainable AI en modelos de BigQuery ML que registraste en Model Registry, debes seguir requisitos específicos. Para obtener más información, consulta Aplica Explainable AI en modelos de BigQuery ML.

Categoría del modelo Tipos de modelos Método de explicabilidad Explicación básica del método Funciones de explicación local Funciones de explicación global
Modelos supervisados Regresión lineal y logística Valores de Shapley Los valores de Shapley para los modelos lineales son iguales a model weight * feature value, donde los valores del atributo están estandarizados y los pesos del modelo se entrenan con los valores de los atributos estandarizados. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Errores estándar y valores P Los errores estándar y los valores p se usan para realizar pruebas de importancia en los pesos del modelo. N/A ML.ADVANCED_WEIGHTS4
Árboles mejorados

Bosque aleatorio
SHAP de árbol El SHAP de árbol es un algoritmo que permite calcular valores SHAP exactos para modelos basados en árbol de decisión. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Contribución de atributos aproximada Aproxima los valores de contribución de los atributos. Es más rápido y sencillo en comparación con el SHAP del árbol. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Importancia de los atributos basada en el índice de Gini Una puntuación global de la importancia de los atributos que indica qué tan útil o valioso fue cada atributo en la construcción del modelo de árbol con boosting o de bosque aleatorio durante el entrenamiento. N/A ML.FEATURE_IMPORTANCE
Red neuronal profunda (DNN)

Algoritmo de amplitud y profundidad
Gradientes integrados Un método basado en gradientes que calcula de forma eficiente las atribuciones de atributos con las mismas propiedades axiomáticas que el valor de Shapley. Proporciona una aproximación de muestreo de las atribuciones de atributos exactas. Su precisión se controla con el parámetro integrated_gradients_num_steps. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
AutoML Tables Shapley de muestra El Shapley con muestreo asigna crédito del resultado del modelo a cada atributo y considera diferentes permutaciones de los atributos. Este método proporciona una aproximación de muestreo de los valores exactos de Shapley. N/A ML.GLOBAL_EXPLAIN2
Modelos de serie temporal ARIMA_PLUS Descomposición de serie temporal Descompone las series temporales en varios componentes si esos componentes están presentes en las series temporales. Los componentes incluyen tendencia, temporada, días feriados, cambios de pasos, aumentos repentinos y disminuciones repentinas. Consulta la canalización de modelado de ARIMA_PLUS para obtener más detalles. ML.EXPLAIN_FORECAST3 N/A
ARIMA_PLUS_XREG Descomposición de serie temporal
y
valores de Shapley
Descompone las series temporales en varios componentes, incluidas tendencias, temporadas, días feriados, cambios de pasos, aumentos repentinos y disminuciones repentinas (similares a ARIMA_PLUS). La atribución de cada regresor externo se calcula en función de los valores de Shapley, que equivale a model weight * feature value. ML.EXPLAIN_FORECAST3 N/A

1ML_EXPLAIN_PREDICT es una versión extendida de ML.PREDICT.

2ML.GLOBAL_EXPLAIN muestra la explicabilidad global obtenida mediante la atribución absoluta media que recibe cada atributo para todas las filas en el conjunto de datos de evaluación.

3ML.EXPLAIN_FORECAST es una versión extendida de ML.FORECAST.

4ML.ADVANCED_WEIGHTS es una versión extendida de ML.WEIGHTS.