Spark sur Google Cloud
La première solution Spark sans serveur du secteur proposant l'autoscaling, s'intègre aux meilleurs outils Google natifs et Open Source. Développez et exécutez Spark où vous en avez besoin pour tous les cas d'utilisation, y compris l'ETL, la science des données et l'exploration.
Avantages
Augmenter la productivité des développeurs et obtenir plus rapidement des insights sur les données
Simplicité opérationnelle grâce à Spark sans serveur
Développez des applications et des pipelines Spark qui évoluent automatiquement sans provisionnement ni réglage d'infrastructure manuels.
Une consommation flexible
Chaque entreprise a des besoins différents. Pour vos applications Spark, vous avez le choix entre les clusters sans serveur, les clusters Kubernetes et les clusters de calcul.
Principales fonctionnalités
Exécuter des tâches Spark qui s'adaptent automatiquement en deux clics, à partir de l'interface de votre choix
Spark sans serveur (disponibilité générale)
Les développeurs peuvent consacrer tout leur temps au code et à la logique, et utiliser l'interface de leur choix pour envoyer des tâches Spark qui assurent le provisionnement et l'autoscaling automatiques. Pour en savoir plus, cliquez ici.
Procédures externes BigQuery pour Apache Spark (version preview privée)
Expérience SQL et Spark unifiée : créer et exécuter du code Apache Spark écrit en Python directement depuis BigQuery Vous pouvez ensuite exécuter et programmer ces procédures stockées dans BigQuery à l'aide d'une requête SQL standard, semblable à l'exécution de procédures stockées SQL. Inscrivez-vous aujourd'hui pour obtenir la version preview.
Spark via Vertex AI (version preview privée)
Spark pour la science des données en un clic : les data scientists peuvent utiliser Spark pour le développement depuis Vertex AI Workbench en toute transparence, grâce à une sécurité intégrée. Spark est intégré aux fonctionnalités MLOps de Vertex AI, où les utilisateurs peuvent exécuter du code Spark via des exécuteurs de notebook intégrés à Vertex AI Pipelines. Inscrivez-vous aujourd'hui pour obtenir la version preview.
Spark via Dataplex
Exécutez l'autoscaling Spark sur les données de Google Cloud à partir d'une interface unique permettant d'accéder en un clic à SparkSQL, Notebooks ou PySpark. Profitez également d'une collaboration facile, avec la possibilité d'enregistrer, de partager et de rechercher des notebooks et des scripts parallèlement aux données, ainsi qu'une gouvernance intégrée sur l'ensemble des lacs de données.
Options de consommation flexibles
En plus de la solution Spark sans serveur pour le déploiement no-ops, les clients qui standardisent l'utilisation de Kubernetes pour la gestion de l'infrastructure peuvent exécuter Spark sur Google Kubernetes Engine (version bêta privée) pour améliorer l'utilisation des ressources et simplifier la gestion de l'infrastructure. Les clients qui cherchent à gérer l'infrastructure de type Hadoop peuvent exécuter Spark sur Compute Engine (disponibilité générale).
Services associés
Spark répandu dans tous les services Google Cloud
Nouveautés
Recevez les dernières actualités, les articles de blog et les événements Spark sur Google Cloud
Inscrivez-vous ici pour demander un accès anticipé aux nouvelles solutions Spark pour Google Cloud.
Spark est une marque de l'Apache Software Foundation.