Créer un modèle de machine learning dans BigQuery ML à l'aide de la console Google Cloud
Ce document explique comment utiliser la console Google Cloud pour créer un modèle BigQuery ML.
Rôles requis
Pour créer un modèle et exécuter une inférence, vous devez disposer des rôles suivants :
- Éditeur de données BigQuery (
roles/bigquery.dataEditor
) - Utilisateur BigQuery (
roles/bigquery.user
)
- Éditeur de données BigQuery (
Avant de commencer
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and BigQuery Connection APIs.
Conditions préalables spécifiques au modèle
Avant de créer un modèle, assurez-vous d'avoir rempli tous les prérequis pour le type de modèle que vous créez :
Si vous souhaitez utiliser une requête pour sélectionner des données d'entraînement pour un modèle, vous devez disposer de cette requête en tant que requête enregistrée.
Les modèles de factorisation matricielle nécessitent des réservations. Pour en savoir plus, consultez Tarification.
Les modèles distants suivants nécessitent une connexion à une ressource cloud :
- Modèles distants par rapport aux modèles Vertex AI et partenaires
- Modèles distants par rapport aux modèles ouverts
- Modèles distants sur les services Cloud AI
- Modèles distants en comparaison avec les modèles personnalisés dans Vertex AI
Le compte de service de la connexion doit également disposer de certains rôles, en fonction du type de modèle distant.
Pour importer un modèle, vous devez l'avoir importé dans un bucket Cloud Storage.
Créer un ensemble de données
Créez un ensemble de données BigQuery pour contenir vos ressources :
Console
Dans la console Google Cloud , accédez à la page BigQuery.
Dans le volet Explorateur, cliquez sur le nom de votre projet.
Cliquez sur
Afficher les actions > Créer un ensemble de données.Sur la page Créer un ensemble de données, procédez comme suit :
Pour ID de l'ensemble de données, saisissez un nom pour l'ensemble de données.
Dans Type d'emplacement, sélectionnez un emplacement pour l'ensemble de données.
Cliquez sur Créer un ensemble de données.
bq
Pour créer un ensemble de données, exécutez la commande
bq mk
en spécifiant l'option--location
:bq --location=LOCATION mk -d DATASET_ID
Remplacez les éléments suivants :
LOCATION
: emplacement de l'ensemble de données.DATASET_ID
est l'ID de l'ensemble de données que vous créez.
Vérifiez que l'ensemble de données a été créé :
bq ls
Créer un modèle entraîné en interne ou en externe
Utilisez cette procédure pour créer les types de modèles suivants :
Modèles de séries temporelles :
Analyse des contributions : Analyse des contributions
Classification :
Régression :
Clustering : K-moyennes
Recommandation : factorisation matricielle
Réduction de la dimensionnalité :
Ces modèles disposent de différents ensembles d'options selon leur type. Bien que le réglage automatique de BigQuery ML fonctionne bien dans la plupart des cas, vous pouvez choisir de régler manuellement votre modèle dans le cadre de la procédure. Si vous souhaitez le faire, consultez la documentation du type de modèle concerné pour en savoir plus sur les options de modèle.
Pour créer un modèle :
Accédez à la page BigQuery.
Dans le volet Explorateur, cliquez sur l'ensemble de données que vous avez créé.
Cliquez sur
Afficher les actions à côté de l'ensemble de données, puis sur Créer un modèle BQML.Le volet Créer un modèle s'ouvre.
Dans Nom du modèle, saisissez un nom pour le modèle.
Si vous souhaitez créer une requête enregistrée contenant l'instruction
CREATE MODEL
pour le modèle, sélectionnez Enregistrer la requête .- Dans le champ Nom de la requête, saisissez un nom pour la requête enregistrée.
- Dans le champ Région, sélectionnez une région pour la requête enregistrée.
Cliquez sur Continuer.
Dans la section Méthode de création, sélectionnez Entraîner un modèle dans BigQuery.
Dans la section Objectif de modélisation, sélectionnez un objectif de modélisation pour le modèle.
Cliquez sur Continuer.
Sur la page Options du modèle, sélectionnez un type de modèle. Le type de modèle que vous pouvez sélectionner varie en fonction de l'objectif de modélisation que vous avez choisi.
Dans la section Données d'entraînement, effectuez l'une des opérations suivantes :
- Sélectionnez Table/Vue pour obtenir des données d'entraînement à partir d'une table ou d'une vue, puis sélectionnez le nom du projet, de l'ensemble de données et de la vue ou de la table.
- Sélectionnez Requête pour obtenir des données d'entraînement à partir d'une requête enregistrée, puis sélectionnez la requête enregistrée.
Dans Colonnes de libellés d'entrée sélectionnées, choisissez les colonnes du tableau, de la vue ou de la requête que vous souhaitez utiliser comme entrée pour le modèle.
Si une section Options requises est présente, spécifiez les informations demandées sur les colonnes :
- Pour les modèles de classification et de régression, sélectionnez la colonne contenant les données de libellé pour INPUT_LABEL_COLS.
Pour les modèles de factorisation matricielle, sélectionnez les éléments suivants :
- Pour RATING_COL, sélectionnez la colonne contenant les données de notation.
- Pour USER_COL, sélectionnez la colonne contenant les données utilisateur.
- Pour ITEM_COL, sélectionnez la colonne contenant les données des articles.
Pour les modèles de prévision de séries temporelles, sélectionnez les éléments suivants :
- Pour TIME_SERIES_TIMESTAMP_COL, sélectionnez la colonne contenant les points temporels à utiliser lors de l'entraînement du modèle.
- Pour TIME_SERIES_DATA_COL, sélectionnez la colonne contenant les données à prévoir.
Facultatif : Dans la section Facultatif, spécifiez des valeurs pour les arguments de réglage du modèle supplémentaires. Les arguments disponibles varient en fonction du type de modèle que vous créez.
Cliquez sur Créer un modèle.
Une fois la création du modèle terminée, cliquez sur Accéder au modèle pour afficher les détails du modèle.
Créer un modèle distant sur un modèle pré-entraîné
Utilisez cette procédure pour créer les types de modèles distants suivants :
Pour créer un modèle :
Accédez à la page BigQuery.
Dans le volet Explorateur, cliquez sur l'ensemble de données que vous avez créé.
Cliquez sur
Afficher les actions à côté de l'ensemble de données, puis sur Créer un modèle BQML.Le volet Créer un modèle s'ouvre.
Dans Nom du modèle, saisissez un nom pour le modèle.
Si vous souhaitez créer une requête enregistrée contenant l'instruction
CREATE MODEL
pour le modèle, sélectionnez Enregistrer la requête .- Dans le champ Nom de la requête, saisissez un nom pour la requête enregistrée.
- Dans le champ Région, sélectionnez une région pour la requête enregistrée.
Cliquez sur Continuer.
Dans la section Méthode de création, sélectionnez Se connecter au service de LLM de Vertex AI et aux services Cloud AI.
Sur la page Options du modèle, sélectionnez Modèles Google et partenaires ou Modèles Open Source pour le type de modèle, selon votre cas d'utilisation.
Dans la section Connexion à distance, effectuez l'une des opérations suivantes :
- Si vous avez configuré une connexion par défaut ou si vous disposez des rôles Administrateur BigQuery et Administrateur de projet IAM, sélectionnez Connexion par défaut.
Si vous n'avez pas configuré de connexion par défaut ou si vous ne disposez pas des rôles appropriés, sélectionnez Connexion à une ressource cloud.
- Pour Projet, sélectionnez le projet contenant la connexion que vous souhaitez utiliser.
- Dans le champ Emplacement, sélectionnez l'emplacement utilisé par la connexion.
Pour Connexion, sélectionnez la connexion à utiliser pour le modèle à distance ou sélectionnez Créer une connexion pour en créer une.
Dans la section Options requises, effectuez l'une des opérations suivantes :
- Pour les modèles distants par rapport aux modèles Google et partenaires, spécifiez le point de terminaison à utiliser. Il s'agit du nom du modèle, par exemple
gemini-2.0-flash
. Pour en savoir plus sur les modèles compatibles, consultezENDPOINT
. - Pour les modèles distants par rapport aux modèles ouverts, copiez et collez le point de terminaison à utiliser. Il s'agit du point de terminaison public partagé d'un modèle déployé sur Vertex AI, au format
https://location-aiplatform.googleapis.com/v1/projects/project/locations/location/endpoints/endpoint_id
. Pour en savoir plus, consultez la page sur la méthodeENDPOINT
.
- Pour les modèles distants par rapport aux modèles Google et partenaires, spécifiez le point de terminaison à utiliser. Il s'agit du nom du modèle, par exemple
Cliquez sur Créer un modèle.
Une fois la création du modèle terminée, cliquez sur Accéder au modèle pour afficher les détails du modèle.
Créer un modèle distant sur un modèle personnalisé
Utilisez cette procédure pour créer des modèles distants sur des modèles personnalisés déployés sur Vertex AI.
Pour créer un modèle :
Accédez à la page BigQuery.
Dans le volet Explorateur, cliquez sur l'ensemble de données que vous avez créé.
Cliquez sur
Afficher les actions à côté de l'ensemble de données, puis sur Créer un modèle BQML.Le volet Créer un modèle s'ouvre.
Dans Nom du modèle, saisissez un nom pour le modèle.
Si vous souhaitez créer une requête enregistrée contenant l'instruction
CREATE MODEL
pour le modèle, sélectionnez Enregistrer la requête .- Dans le champ Nom de la requête, saisissez un nom pour la requête enregistrée.
- Dans le champ Région, sélectionnez une région pour la requête enregistrée.
Cliquez sur Continuer.
Dans la section Méthode de création, sélectionnez Se connecter aux points de terminaison Vertex AI gérés par l'utilisateur.
Dans la section Connexion à distance de la page Options du modèle, procédez comme suit :
- Si vous avez configuré une connexion par défaut ou si vous disposez des rôles Administrateur BigQuery et Administrateur de projet IAM, sélectionnez Connexion par défaut.
Si vous n'avez pas configuré de connexion par défaut ou si vous ne disposez pas des rôles appropriés, sélectionnez Connexion à une ressource cloud.
- Pour Projet, sélectionnez le projet contenant la connexion que vous souhaitez utiliser.
- Dans le champ Emplacement, sélectionnez l'emplacement utilisé par la connexion.
Pour Connexion, sélectionnez la connexion à utiliser pour le modèle à distance ou sélectionnez Créer une connexion pour en créer une.
Dans la section Options requises, spécifiez le point de terminaison à utiliser. Il s'agit du point de terminaison public partagé d'un modèle déployé sur Vertex AI, au format
https://location-aiplatform.googleapis.com/v1/projects/project/locations/location/endpoints/endpoint_id
. Pour en savoir plus, consultez la sectionENDPOINT
.Cliquez sur Créer un modèle.
Une fois la création du modèle terminée, cliquez sur Accéder au modèle pour afficher les détails du modèle.
Créer un modèle distant sur un service Cloud AI
Utilisez cette procédure pour créer des modèles distants sur les services Cloud AI.
Pour créer un modèle :
Accédez à la page BigQuery.
Dans le volet Explorateur, cliquez sur l'ensemble de données que vous avez créé.
Cliquez sur
Afficher les actions à côté de l'ensemble de données, puis sur Créer un modèle BQML.Le volet Créer un modèle s'ouvre.
Dans Nom du modèle, saisissez un nom pour le modèle.
Si vous souhaitez créer une requête enregistrée contenant l'instruction
CREATE MODEL
pour le modèle, sélectionnez Enregistrer la requête .- Dans le champ Nom de la requête, saisissez un nom pour la requête enregistrée.
- Dans le champ Région, sélectionnez une région pour la requête enregistrée.
Cliquez sur Continuer.
Dans la section Méthode de création, sélectionnez Se connecter au service de LLM de Vertex AI et aux services Cloud AI.
Sur la page Options du modèle, sélectionnez Services Cloud AI.
Dans la section Connexion à distance, effectuez l'une des opérations suivantes :
- Si vous avez configuré une connexion par défaut ou si vous disposez des rôles Administrateur BigQuery et Administrateur de projet IAM, sélectionnez Connexion par défaut.
Si vous n'avez pas configuré de connexion par défaut ou si vous ne disposez pas des rôles appropriés, sélectionnez Connexion à une ressource cloud.
- Pour Projet, sélectionnez le projet contenant la connexion que vous souhaitez utiliser.
- Dans le champ Emplacement, sélectionnez l'emplacement utilisé par la connexion.
Pour Connexion, sélectionnez la connexion à utiliser pour le modèle à distance ou sélectionnez Créer une connexion pour en créer une.
Dans la section Options requises, sélectionnez le type de service Cloud AI à utiliser.
Dans la section Facultatif, spécifiez les informations du processeur de documents si vous utilisez le service
CLOUD_AI_DOCUMENT_V1
. Vous pouvez éventuellement spécifier des informations sur le module de reconnaissance vocale si vous utilisez le serviceCLOUD_AI_SPEECH_TO_TEXT_V2
.Cliquez sur Créer un modèle.
Une fois la création du modèle terminée, cliquez sur Accéder au modèle pour afficher les détails du modèle.
Créer un modèle importé
Utilisez cette procédure pour créer des modèles BigQuery ML en important les types de modèles suivants :
Pour créer un modèle :
Accédez à la page BigQuery.
Dans le volet Explorateur, cliquez sur l'ensemble de données que vous avez créé.
Cliquez sur
Afficher les actions à côté de l'ensemble de données, puis sur Créer un modèle BQML.Le volet Créer un modèle s'ouvre.
Dans Nom du modèle, saisissez un nom pour le modèle.
Si vous souhaitez créer une requête enregistrée contenant l'instruction
CREATE MODEL
pour le modèle, sélectionnez Enregistrer la requête .- Dans le champ Nom de la requête, saisissez un nom pour la requête enregistrée.
- Dans le champ Région, sélectionnez une région pour la requête enregistrée.
Cliquez sur Continuer.
Dans la section Méthode de création, sélectionnez Importer un modèle.
Sur la page Options du modèle, sélectionnez le type de modèle que vous souhaitez importer.
Dans le champ Chemin GCS, recherchez ou collez l'URI du bucket Cloud Storage contenant le modèle.
Cliquez sur Créer un modèle.
Une fois la création du modèle terminée, cliquez sur Accéder au modèle pour afficher les détails du modèle.