Présentation de BigQuery ML

Présentation

BigQuery ML permet aux utilisateurs de créer et d'exécuter des modèles de machine learning dans BigQuery à l'aide de requêtes SQL standard. BigQuery ML démocratise le machine learning en permettant aux utilisateurs de SQL de mettre à profit leurs propres compétences et outils SQL pour créer des modèles. BigQuery ML accélère le développement, sans nécessité de déplacer des données.

BigQuery ML est actuellement compatible avec les types de modèles suivants :

  • Régression linéaire : ces modèles peuvent être utilisés pour prédire une valeur numérique.
  • Régression logistique binaire : ces modèles peuvent être utilisés pour prédire l'une des deux classes (par exemple, déterminer si un e-mail est un spam).
  • Régression logistique multiclasses pour la classification : ces modèles peuvent être utilisés pour prédire plus de deux classes, par exemple si une entrée est une "valeur faible", une "valeur moyenne" ou une "valeur élevée".

La fonctionnalité BigQuery ML est intégrée aux outils suivants :

  • L'UI Web de BigQuery
  • L'outil de ligne de commande bq
  • L'API REST BigQuery
  • Un outil externe tel qu'un ordinateur ultraportable Jupyter ou une plate-forme de veille stratégique

Le machine learning sur des ensembles de données volumineux nécessite une programmation importante et une connaissance approfondie des structures ML. Ces exigences restreignent le développement de solutions à un très petit nombre de personnes au sein de chaque entreprise et excluent les analystes de données qui comprennent les données mais qui ont des connaissances limitées en matière de machine learning et qui ne sont pas des experts en programmation.

BigQuery ML permet aux analystes de données d'utiliser le machine learning avec leurs propres compétences et outils SQL. Ils peuvent utiliser BigQuery ML pour créer et évaluer des modèles de ML dans BigQuery. Et ils n'ont plus besoin d'exporter de petites quantités de données vers des feuilles de calcul ou d'autres applications, ni d'attendre des ressources limitées de la part de l'équipe de data scientists.

Avantages de BigQuery ML

BigQuery ML présente les avantages suivants par rapport aux autres méthodes d'utilisation du ML avec un entrepôt de données cloud :

  • BigQuery ML démocratise l'utilisation du ML en permettant aux analystes de données, les principaux utilisateurs des entrepôts de données, de créer et d'exécuter des modèles à l'aide de leurs propres outils et feuilles de calcul de veille stratégique. Cela facilite la prise de décisions commerciales au sein de l'entreprise grâce à l'analyse prédictive.
  • Il n'est pas nécessaire de programmer une solution de ML à l'aide de Python ou Java. Les modèles sont entraînés et accessibles dans BigQuery à l'aide de SQL, un langage connu des analystes de données.
  • BigQuery ML accélère l'innovation et le développement des modèles en évitant d'exporter des données depuis l'entrepôt de données. Au lieu de cela, BigQuery ML amène le ML aux données. L'exportation et le reformatage des données :

    • augmentent la complexité : plusieurs outils sont nécessaires ;
    • réduisent la vitesse : le déplacement et le formatage de grandes quantités de données pour les frameworks ML basés sur Python requièrent plus de temps que l'entraînement de modèles dans BigQuery ;
    • exigent plusieurs étapes pour exporter des données depuis l'entrepôt, ce qui limite la possibilité de tester vos données ;
    • peuvent être entravés par des restrictions légales (telles que les directives HIPAA) ;

Régions où le service est disponible

Tout comme BigQuery, BigQuery ML est une ressource multirégionale. Ce service est disponible dans les mêmes régions que BigQuery.

La localité des données est spécifiée lorsque vous créez un ensemble de données pour stocker vos données d'entraînement et vos modèles BigQuery ML. BigQuery ML traite et classe les données dans le même emplacement que l'ensemble de données cible.

Quota

Les requêtes qui utilisent les fonctions BigQuery ML et les instructions CREATE MODEL sont soumises non seulement aux limites spécifiques à BigQuery, mais également aux quotas et limites des tâches de requête.

Pour en savoir plus sur tous les quotas et limites, consultez la rubrique Quotas et limites.

Tarification

Les modèles BigQuery ML sont stockés dans des ensembles de données BigQuery tels que des tables et des vues. Lorsque vous créez et utilisez des modèles dans BigQuery ML, vos frais sont basés sur la quantité de données utilisées pour entraîner un modèle et sur les requêtes que vous exécutez sur les données.

Pour en savoir plus sur la tarification BigQuery ML, consultez la rubrique Tarification BigQuery ML. Pour en savoir plus sur la tarification relative au stockage, consultez la rubrique Tarifs de stockage. Pour en savoir plus sur la tarification relative aux requêtes, consultez la rubrique Tarifs des requêtes.

Ressources

Pour en savoir plus sur le machine learning et BigQuery ML, consultez les éléments suivants :

Étape suivante

Cette page vous a-t-elle été utile ? Évaluez-la :

Envoyer des commentaires concernant…

Besoin d'aide ? Consultez notre page d'assistance.