Visão geral explicável da IA do BigQuery

Neste documento, descrevemos como o BigQuery ML oferece suporte à inteligência artificial (IA) explicável, às vezes chamada de XAI.

A Explainable AI ajuda a entender os resultados que seu modelo de machine learning preditivo gera para tarefas de classificação e regressão definindo como cada atributo em uma linha de dados contribuiu para o resultado previsto. Isso geralmente é chamado de atribuição de recursos. É possível usar essas informações para verificar se o modelo está se comportando conforme esperado, reconhecer vieses e informar maneiras de melhorar o modelo e os dados de treinamento.

O BigQuery ML e a Vertex AI têm ofertas de Explainable AI que oferecem explicações baseadas em atributos. É possível fazer a explicabilidade no BigQuery ML ou registrar seu modelo na Vertex AI e fazer a explicabilidade lá.

Para informações sobre as funções e instruções SQL compatíveis com cada tipo de modelo, consulte Jornada do usuário completa de cada modelo.

Explicabilidade local x global

Há dois tipos de explicabilidade: explicabilidade local e explicabilidade global. Elas também são conhecidas, respectivamente, como importância do recurso local e importância do recurso global.

A explicabilidade local retorna valores de atribuição de recursos para cada exemplo explicado. Esses valores descrevem o quanto um atributo específico afetou a previsão em relação à previsão de referência.
A explicabilidade global retorna a influência geral do atributo no modelo e geralmente é obtida agregando as atribuições de recursos em todo o conjunto de dados. Um valor absoluto mais alto indica que o recurso teve maior influência nas previsões do modelo.

Ofertas explicáveis de IA no BigQuery ML

A Explainable AI no BigQuery ML é compatível com uma variedade de modelos de machine learning, incluindo séries temporais e séries não temporais. Cada um deles usa um método de explicabilidade diferente.

Categoria do modelo	Tipos de modelos	Método de explicação	Explicação básica do método	Funções de explicação local	Funções de explicação global
Modelos supervisionados	Regressão linear e logística	Valores de Shapley	Os valores de Shapley para modelos lineares são iguais a `model weight * feature value`, em que os valores de atributos são padronizados e os pesos de modelo são treinados com esses valores.	`ML.EXPLAIN_PREDICT`¹	`ML.GLOBAL_EXPLAIN`²
	Regressão linear e logística	Erros padrão e valores-p	Erros padrão e valores-p são usados para testes de significância em relação aos pesos do modelo.	N/A	`ML.ADVANCED_WEIGHTS`⁴
	Árvores aprimoradas Floresta aleatória	Árvore SHAP	O Tree SHAP é um algoritmo para calcular valores SHAP exatos para modelos baseados em árvores de decisão.	`ML.EXPLAIN_PREDICT`¹	`ML.GLOBAL_EXPLAIN`²
		Contribuição aproximada de recursos	Aproxima os valores de contribuição do recurso. É mais rápido e simples em comparação com o Tree SHAP.	`ML.EXPLAIN_PREDICT`¹	`ML.GLOBAL_EXPLAIN`²
		Importância do recurso com base no índice da Gini	Pontuação de importância global de recursos que indica a utilidade ou importância de cada recurso na construção da árvore otimizada ou do modelo de floresta aleatória durante o treinamento.	N/A	`ML.FEATURE_IMPORTANCE`
	Rede neural profunda (DNN) Ampla e profunda	Gradientes integrados	Um método baseado em gradientes que calcula com eficiência as atribuições de atributos com as mesmas propriedades axiomáticas do valor de Shapley. Fornece uma amostra de estimativas de atribuições de recursos exatas. A precisão é controlada pelo parâmetro `integrated_gradients_num_steps`.	`ML.EXPLAIN_PREDICT`¹	`ML.GLOBAL_EXPLAIN`²
	AutoML Tables	Amostragem de Shapley	O Sampled Shapley atribui crédito pelo resultado do modelo a cada recurso e considera permutações diferentes dos recursos. Esse método oferece uma aproximação de amostragem dos valores exatos de Shapley.	N/A	`ML.GLOBAL_EXPLAIN`²
Modelos de série temporal	ARIMA_PLUS	Decomposição de séries temporais	Decompõe a série temporal em vários componentes se eles estiverem presentes na série temporal. Os componentes incluem tendência, sazonal, feriado, alterações nos passos, pico e quedas. Consulte o pipeline de modelagem ARIMA_PLUS para mais detalhes.	`ML.EXPLAIN_FORECAST`³	N/A
Modelos de série temporal	ARIMA_PLUS_XREG	Decomposição da série temporal e Valores de Shapley	Decompõe a série temporal em vários componentes, incluindo tendência, sazonal, feriado, alterações de etapas e pico e quedas (semelhante a ARIMA_PLUS). A atribuição de cada regressor externo é calculada com base nos valores de Shapley, que são iguais a `model weight * feature value`.	`ML.EXPLAIN_FORECAST`³	N/A

¹ML_EXPLAIN_PREDICT é uma versão estendida de ML.PREDICT.

²ML.GLOBAL_EXPLAIN retorna a explicabilidade global recebida considerando a atribuição absoluta média que cada recurso recebe para todas as linhas no conjunto de dados de avaliação.

³ML.EXPLAIN_FORECAST é uma versão estendida de ML.FORECAST.

⁴ML.ADVANCED_WEIGHTS é uma versão estendida de ML.WEIGHTS.

Explainable AI na Vertex AI

A Explainable AI está disponível na Vertex AI para este subconjunto de modelos de aprendizado supervisionado que podem ser exportados:

Tipo de modelo	Método do Explainable AI
dnn_classifier	Gradientes integrados
dnn_regressor	Gradientes integrados
dnn_linear_combined_classifier	Gradientes integrados
dnn_linear_combined_regressor	Gradientes integrados
boosted_tree_regressor	Amostragem de Shapley
boosted_tree_classifier	Amostragem de Shapley
random_forest_regressor	Amostragem de Shapley
random_forest_classifier	Amostragem de Shapley

Consulte Métodos de atribuição de recurso para saber mais sobre esses métodos.

Ativar a Explainable AI no Model Registry

Quando seu modelo do BigQuery ML é registrado no Model Registry, e se for um tipo de modelo compatível com a Explainable AI, será possível ativar a Explainable AI no modelo ao implantar em um endpoint. Quando você registra seu modelo do BigQuery ML, todos os metadados associados são preenchidos para você.

Registre seu modelo do BigQuery ML no Model Registry.
Acesse a página Model Registry na seção "BigQuery ML" no console do Google Cloud.
No Model Registry, selecione o modelo do BigQuery ML e clique na versão do modelo para redirecionar à página de detalhes do modelo.
Selecione Mais ações na versão do modelo.
Clique em Implantar no endpoint.
Defina seu endpoint: crie um nome de endpoint e clique em continuar.
Selecione um tipo de máquina, por exemplo, n1-standard-2.
Em Configurações do modelo, na seção de geração de registros, marque a caixa de seleção para ativar as opções de explicação.
Clique em Concluído e depois em Continuar para implantar no endpoint.

Para saber como usar o XAI nos seus modelos do Model Registry, consulte Receber uma explicação on-line usando o modelo implantado. Para saber mais sobre o XAI na Vertex AI, consulte Acessar explicações.

A seguir

Saiba como gerenciar modelos do BigQuery ML na Vertex AI.