Interpretar resultados de previsão de classificação e regressão

Nesta página, mostramos como interpretar os resultados da previsão de modelos de classificação e regressão.

Classificação

Previsão

A pontuação de confiança informa o quanto o modelo associa cada classe ou rótulo a um item de teste. Quanto maior o número, maior a confiança do modelo de que o rótulo precisa ser aplicado a esse item. Você decide o nível de confiança necessário para aceitar os resultados do modelo.

Importância do recurso local

A importância do recurso local, às vezes chamada de atribuições de recursos, permite determinar quanto uma determinada previsão é impactada por cada recurso. A importância do recurso local faz parte da Vertex Explainable AI.

Para calcular a importância do recurso local, primeiramente, é calculada a pontuação de previsão do valor de referência. Os valores de referência são calculados com base nos dados de treinamento e a utilização do valor mediano para recursos numéricos e do modo para recursos categóricos. A previsão gerada a partir dos valores de referência é o valor de referência da pontuação de previsão. Os valores de referência são calculados uma vez para um modelo e não são alterados.

Para uma previsão específica, a importância do recurso local de cada recurso informa quanto esse recurso foi adicionado ou subtraído do resultado, em comparação com a pontuação de previsão do valor de referência. A soma de todos os valores de importância de recurso é igual à diferença entre a pontuação de previsão do valor de referência e o resultado da previsão.

É possível usar a importância do recurso para garantir que o modelo esteja usando os dados de previsão de um jeito que faça sentido para seus dados e problema de negócios. Se você solicitou uma previsão sem a importância do recurso e o resultado não fez sentido, use o campo deployedModelId da previsão e solicite explicações para os mesmos dados e o mesmo modelo. Saiba mais

Para modelos de classificação, a pontuação está sempre entre 0,0 e 1,0 (inclusos). Portanto, os valores de importância de recursos locais para modelos de classificação estão sempre entre -1,0 e 1,0 (inclusos).

Regressão

Previsão

Os modelos de regressão retornam um valor de previsão e, para os destinos do BigQuery, um intervalo de previsão. O intervalo de previsão fornece um intervalo de valores em que o modelo que tem confiança de 95% contém o resultado real.

Importância do recurso local

Exemplo de saída para previsões e explicações on-line

Classificação

O payload de retorno de uma previsão on-line de um modelo de classificação tabular com a importância do recurso é semelhante ao exemplo a seguir.

O instanceOutputValue de 0.928652400970459 é a pontuação de confiança da classe de maior pontuação, neste caso class_a. O campo baselineOutputValue contém a pontuação de previsão do valor de referência, 0.808652400970459. O recurso que mais contribuiu para esse resultado foi feature_3.

{
"predictions": [
  {
    "scores": [
      0.928652400970459,
      0.071347599029541
    ],
    "classes": [
      "class_a",
      "class_b"
    ]
  }
]
"explanations": [
  {
    "attributions": [
      {
        "baselineOutputValue": 0.808652400970459,
        "instanceOutputValue": 0.928652400970459,
        "approximationError":  0.0058915703929231,
        "featureAttributions": {
          "feature_1": 0.012394922231235,
          "feature_2": 0.050212341234556,
          "feature_3": 0.057392736534209,
        },
        "outputIndex": [
          0
        ],
        "outputName": "scores"
      }
    ],
  }
]
"deployedModelId": "234567"
}

Regressão

O payload de retorno de uma previsão on-line com importância do recurso de um modelo de regressão tabular é semelhante ao exemplo JSON a seguir.

O instanceOutputValue de 1795.1246466281819 é o valor previsto, com os campos lower_bound e upper_bound que fornecem o intervalo de confiança de 95%. O campo baselineOutputValue contém a pontuação de previsão do valor de referência, 1788.7423095703125. O recurso que mais contribuiu para esse resultado foi feature_3.

{
"predictions": [
  {
    "value": 1795.1246466281819,
    "lower_bound": 246.32196807861328,
    "upper_bound": 8677.51904296875
  }
]
"explanations": [
  {
    "attributions": [
      {
        "baselineOutputValue": 1788.7423095703125,
        "instanceOutputValue": 1795.1246466281819,
        "approximationError": 0.0038215703911553,
        "featureAttributions": {
          "feature_1": 0.123949222312359,
          "feature_2": 0.802123412345569,
          "feature_3": 5.456264423211472,
        },
        "outputIndex": [
          -1
        ]
      }
    ]
  }
],
"deployedModelId": "345678"
}