Descripción general de Explainable AI de BigQuery

En este documento, se describe cómo BigQuery ML admite la inteligencia artificial (IA) de Explainable, a veces llamada XAI.

Explainable AI te ayuda a comprender los resultados que genera el modelo de aprendizaje automático predictivo para las tareas de clasificación y regresión definiendo cómo cada atributo de una fila de datos contribuyó al resultado previsto. A menudo, esta información se conoce como atribución de atributos. Puedes usar esta información para verificar que el modelo se comporte según lo previsto, reconocer sesgos en los modelos y fundamentar formas de mejorar el modelo y los datos de entrenamiento.

BigQuery ML y Vertex AI tienen ofertas de Explainable AI existentes que ofrecen explicaciones basadas en atributos. Puedes realizar la explicación en BigQuery ML o registrar tu modelo en Vertex AI y realizar la explicación allí.

Para obtener información sobre las instrucciones y funciones de SQL compatibles para cada tipo de modelo, consulta Recorrido del usuario de extremo a extremo para cada modelo.

Comparación entre la explicabilidad local y global

Existen dos tipos de explicabilidad: local y global. También se conocen como importancia local y global de los atributos.

  • La explicabilidad local muestra valores de atribución de atributos para cada ejemplo explicado. Estos valores describen cuánto afectó un atributo en particular a la predicción en relación con la predicción del modelo de referencia.
  • La explicabilidad global muestra la influencia general del atributo en el modelo y, a menudo, se obtiene con la agregación de las atribuciones de atributos en todo el conjunto de datos. Un valor absoluto más alto indica que el atributo tuvo una mayor influencia en las predicciones del modelo.

Ofertas de Explainable AI en BigQuery ML

Explainable AI en BigQuery ML es compatible con una variedad de modelos de aprendizaje automático, incluidos modelos de series temporales y no temporales. Cada uno de ellos aprovecha un método de explicabilidad diferente.

Categoría del modelo Tipos de modelos Método de explicabilidad Explicación básica del método Funciones de explicación local Funciones de explicación global
Modelos supervisados Regresión lineal y logística Valores de Shapley Los valores de Shapley para los modelos lineales son iguales a model weight * feature value, donde los valores del atributo están estandarizados y los pesos del modelo se entrenan con los valores de los atributos estandarizados. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Errores estándar y valores P Los errores estándar y los valores p se usan para las pruebas de importancia en relación con las ponderaciones del modelo. N/A ML.ADVANCED_WEIGHTS4
Árboles mejorados

Bosque aleatorio
SHAP de árbol El SHAP de árbol es un algoritmo que permite calcular valores SHAP exactos para modelos basados en árbol de decisión. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Contribución de atributos aproximada Aproxima los valores de contribución de los atributos. Es más rápido y sencillo en comparación con el SHAP del árbol. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Importancia de los atributos basada en el índice de Gini Una puntuación global de la importancia de los atributos que indica qué tan útil o valioso fue cada atributo en la construcción del modelo de árbol con boosting o de bosque aleatorio durante el entrenamiento. N/A ML.FEATURE_IMPORTANCE
Red neuronal profunda (DNN)

Algoritmo de amplitud y profundidad
Gradientes integrados Un método basado en gradientes que calcula de forma eficiente las atribuciones de atributos con las mismas propiedades axiomáticas que el valor de Shapley. Proporciona una aproximación de muestreo de las atribuciones de atributos exactas. Su precisión se controla mediante el parámetro integrated_gradients_num_steps. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
AutoML Tables Shapley de muestra El Shapley con muestreo asigna crédito del resultado del modelo a cada atributo y considera diferentes permutaciones de los atributos. Este método proporciona una aproximación de muestreo de los valores exactos de Shapley. N/A ML.GLOBAL_EXPLAIN2
Modelos de serie temporal ARIMA_PLUS Descomposición de serie temporal Descompone las series temporales en varios componentes si esos componentes están presentes en las series temporales. Los componentes incluyen tendencia, temporada, días feriados, cambios de pasos, aumentos repentinos y disminuciones repentinas. Consulta la canalización de modelado de ARIMA_PLUS para obtener más detalles. ML.EXPLAIN_FORECAST3 N/A
ARIMA_PLUS_XREG Descomposición de serie temporal
y
valores de Shapley
Descompone las series temporales en varios componentes, incluidas tendencias, temporadas, días feriados, cambios de pasos, aumentos repentinos y disminuciones repentinas (similares a ARIMA_PLUS). La atribución de cada regresor externo se calcula en función de los valores de Shapley, que equivale a model weight * feature value. ML.EXPLAIN_FORECAST3 N/A

1ML_EXPLAIN_PREDICT es una versión extendida de ML.PREDICT.

2ML.GLOBAL_EXPLAIN muestra la explicabilidad global obtenida mediante la atribución absoluta media que recibe cada atributo para todas las filas en el conjunto de datos de evaluación.

3ML.EXPLAIN_FORECAST es una versión extendida de ML.FORECAST.

4ML.ADVANCED_WEIGHTS es una versión extendida de ML.WEIGHTS.

Explainable AI en Vertex AI

Explainable AI está disponible en Vertex AI para el siguiente subconjunto de modelos de aprendizaje supervisado exportables:

Tipo de modelo Método de Explainable AI
dnn_classifier Gradientes integrados
dnn_regressor Gradientes integrados
dnn_linear_combined_classifier Gradientes integrados
dnn_linear_combined_regressor Gradientes integrados
boosted_tree_regressor Shapley de muestra
boosted_tree_classifier Shapley de muestra
random_forest_regressor Shapley de muestra
random_forest_classifier Shapley de muestra

Consulta Métodos de atribución de atributos para obtener más información sobre estos métodos.

Habilita Explainable AI en Model Registry

Cuando tu modelo de BigQuery ML está registrado en Model Registry, y si es un tipo de modelo que admite Explainable AI, puedes habilitar Explainable AI en el modelo cuando implementes en un extremo. Cuando registras tu modelo de BigQuery ML, todos los metadatos asociados se propagan.

  1. Registra tu modelo de BigQuery ML en el Model Registry.
  2. Ve a la página Model Registry desde la sección BigQuery en la consola de Google Cloud.
  3. En Model Registry, selecciona el modelo de BigQuery ML y haz clic en la versión del modelo para redireccionar a la página de detalles del modelo.
  4. Selecciona Más acciones en la versión del modelo.
  5. Haz clic en Implementar en el extremo.
  6. Define tu extremo: crea un nombre para él y haz clic en Continuar.
  7. Selecciona un tipo de máquina, por ejemplo, n1-standard-2.
  8. En Configuración del modelo, en la sección de registro, selecciona la casilla de verificación para habilitar las opciones de Explicabilidad.
  9. Haz clic en Listo y, luego, en Continuar para implementarlo en el extremo.

Para obtener información sobre cómo usar XAI en tus modelos desde Model Registry, consulta Obtén una explicación en línea con el modelo implementado. Para obtener más información sobre XAI en Vertex AI, consulta Obtén explicaciones.

¿Qué sigue?