Préparer la génération de résultats de prédiction

Cette page explique comment préparer les ensembles de données nécessaires pour générer des sorties de prédiction.

Avant de commencer

Avant de commencer, vous avez besoin des éléments suivants :

Créer un ensemble de données pour la prédiction

Vous pouvez créer des prédictions à l'aide d'un ensemble de données existant (par exemple, celui que vous utilisiez pour le rétrocompatibilité). Toutefois, dans un environnement de production, nous vous recommandons de créer un nouvel ensemble de données pour chaque exécution de prédiction:

  1. En tant que client, vous êtes responsable de tout suivi de la lignée de l'ensemble de données au modèle. Pour vous assurer que les données ne changent pas, nous vous recommandons de créer un instantané de table BigQuery de vos tables BigQuery une fois qu'elles ont passé la validation des données, puis de faire référence à l'instantané dans l'ensemble de données AML AI. Si vous référencez des tables régulièrement mises à jour, les opérations d'IA AML lisent les tables BigQuery chaque fois qu'une opération utilise le jeu de données d'IA AML. Par conséquent, les modifications apportées aux tables BigQuery sous-jacentes peuvent avoir un impact sur le réglage, l'entraînement, le rétrocompatibilité et les prédictions.
  2. Suivez les conseils de la section Préparer les données pour l'IA AML pour préparer vos tables BigQuery, puis créez un ensemble de données d'IA AML distinct pour la prédiction à l'aide des tables que vous avez enregistrées à l'étape 1. Pour créer les ensembles de données et les tables BigQuery, vous pouvez utiliser les commandes de la section Préparer des ensembles de données et des tables BigQuery.

Préparer les destinations de sortie

L'IA AML génère des sorties de prédiction (scores de risque et explicabilité) dans BigQuery lorsque vous créez une ressource de résultats de prédiction.

Avant de créer des résultats de prédiction, vous devez créer un ensemble de données BigQuery pour ces sorties. N'importe quel ensemble de données BigQuery peut être utilisé pour les sorties de prédiction, à condition que les autorisations appropriées soient accordées et que l'ensemble de données se trouve dans le même projet que l'API activée et au même emplacement que l'instance d'IA AML.

Générer des scores de risque et une explicabilité

Maintenant que vous disposez de l'ensemble de données pour la prédiction, d'une ressource de modèle entraînée et d'un ensemble de données BigQuery pour la sortie, vous pouvez créer des résultats de prédiction. Pour ce faire, consultez la section Créer et gérer les résultats de prédiction.