Data science sur Google Cloud
Plate-forme unifiée pour la gestion des données, l'analyse et les outils de machine learning afin d'accélérer vos workflows "des données à l'IA".
Améliorez la rapidité et l'agilité de votre entreprise, et générez de la valeur à court et à long terme.
3x
Plus économique avec des mouvements de données minimisés
x 4
Entraînement, affinage et déploiement plus rapides des modèles
x10
Réduction du coût de l'IA pour atteindre plus facilement les objectifs de ROI
Solution unifiée pour l'ensemble du cycle de vie de la data science et du machine learning, basée sur une infrastructure de données multimodale garantissant une gouvernance unifiée. Exploitez des moteurs d'analyse puissants comme BigQuery SQL et Spark, puis créez des modèles à l'aide de BigQuery ML ou de Vertex AI. Simplifiez le développement avec le notebook Colab AI Enterprise et des fonctionnalités MLOps robustes optimisées par une IA de pointe.
Faites votre choix parmi une suite de solutions de notebook de data science pour les entreprises. Colab Enterprise offre un environnement géré et sécurisé intégré à Vertex AI et BigQuery. Les composants Vertex AI Workbench fournissent des instances JupyterLab personnalisables, tandis que Cloud Workstations prend en charge les IDE complets. Les extensions connectent également les outils auto-hébergés directement aux services Google Cloud.
Accélérez le développement de data science grâce à des capacités agentives qui facilitent l'exploration et la transformation des données, ainsi que la modélisation par le ML. Commencez par définir un objectif général en langage courant. L'agent de data science génère ensuite un plan détaillé couvrant tous les aspects de la modélisation de data science : chargement, exploration, nettoyage et visualisation des données, ingénierie des caractéristiques, répartition des données, entraînement/optimisation de modèles et évaluation.
Exploitez une infrastructure de données unifiée pour gérer les données structurées et non structurées (images, documents, etc.) à l'aide de SQL pour l'analyse et les fonctions d'IA pour le traitement. La préparation des données assistée par l'IA fournit des suggestions pour le nettoyage et la transformation des données. L'agent d'ingénierie des données automatise les tâches d'ingénierie des données, y compris l'ingestion et la création de pipelines, à l'aide d'instructions en langage naturel.
Choisissez le moteur de traitement de votre choix, qu'il s'agisse du moteur SQL de BigQuery ou d'un framework Open Source comme Apache Spark, pour travailler directement sur une copie unique et unifiée des données. Cela évite d'avoir à gérer des copies de données distinctes pour différents systèmes.
Vous préférez les bibliothèques Python natives ? BigQuery DataFrames fournit une API de type pandas qui traduit le code Python en SQL optimisé pour l'exécution sur le moteur BigQuery. Cela permet d'utiliser l'outil adapté au job, qu'il s'agisse de SQL, de PySpark ou d'un DataFrame de type pandas, tout en travaillant sur les mêmes données sous-jacentes.
Créez, entraînez, évaluez et déployez des modèles avec BigQuery ML à l'aide de SQL, sans avoir à déplacer les données. Exploitez des modèles intégrés et pré-entraînés, ou des fonctions SQL faisant appel à Gemini pour l'analyse et l'enrichissement des données. Pour les modèles personnalisés, Vertex AI est compatible avec PyTorch, TensorFlow et d'autres bibliothèques de ML. L'intégration parfaite permet d'effectuer l'ingénierie des caractéristiques dans BigQuery, l'entraînement de modèles personnalisés dans Vertex AI et l'inférence dans BigQuery via SQL.
Générez et utilisez des embeddings multimodaux pour effectuer une recherche vectorielle afin de comprendre la sémantique et de récupérer des données multimodales en fonction de leur similarité. Vous pouvez ainsi créer des systèmes sophistiqués de recherche sémantique, de recommandation ou de segmentation, sans avoir à gérer une base de données vectorielle distincte et spécialisée.
BigQuery et Vertex AI s'intègrent pour simplifier le "dernier kilomètre" des MLOps. Centralisez les caractéristiques dans Vertex AI Feature Store afin d'éviter le décalage entre l'entraînement et la mise en service, ainsi que les tâches redondantes. Utilisez Vertex AI AutoML pour automatiser la création de modèles pour les données tabulaires. Tous les modèles, qu'ils proviennent de BigQuery ML ou de Vertex AI, sont automatiquement enregistrés dans Vertex AI Model Registry. Vous pouvez ensuite facilement gérer les versions, et évaluer et déployer vos modèles, créant ainsi un cycle de vie de bout en bout fluide sur une seule plate-forme.