Regardez la session Spark sur Google Cloud lors de la conférence Next 2021 sur cette page.

Accéder à

Spark sur Google Cloud

Premier Spark à autoscaling sans serveur du secteur, intégré au meilleur des outils natifs Google et Open Source. Développez et exécutez Spark où vous en avez besoin pour tous les cas d'utilisation, y compris l'ETL, la science des données et l'exploration.

Avantages

Augmenter la productivité des développeurs et obtenir plus rapidement des insights de données

Simplicité opérationnelle grâce à Spark sans serveur

Développez des applications et des pipelines Spark qui évoluent automatiquement sans provisionnement ni réglage d'infrastructure manuels.

Spark fluide pour tous les utilisateurs de données

Spark est intégré à BigQuery, Vertex AI et Dataplex afin de pouvoir écrire et les exécuter à partir de ces interfaces en deux clics, sans intégrations personnalisées, pour l'ETL, l'exploration de données, l'analyse et le ML.

Flexibilité de consommation

La taille unique ne convient pas à tous. Vous pouvez choisir entre les clusters sans serveur, les clusters Kubernetes et les clusters de calcul pour vos applications Spark.

Principales fonctionnalités

Exécuter des tâches Spark qui s'adaptent automatiquement en deux clics, à partir de l'interface de votre choix

Spark sans serveur (disponibilité générale bientôt disponible)

Les développeurs peuvent consacrer tout leur temps au code et à la logique, et utiliser l'interface de leur choix pour envoyer des tâches Spark qui assurent le provisionnement et l'autoscaling automatiques.

Spark via BigQuery (version bêta privée)

Expérience SQL et Spark unifiée : permettez aux utilisateurs de l'entreposage de données d'écrire et d'exécuter facilement des données Spark sur BigQuery sans les exporter. Aucune gestion de l'infrastructure n'est nécessaire.

Spark via Vertex AI (version bêta privée)

Spark pour la science des données en un clic : les data scientists peuvent utiliser Spark pour le développement depuis Vertex AI Workbench en toute transparence, grâce à une sécurité intégrée. Spark est intégré aux fonctionnalités MLOps de Vertex AI, où les utilisateurs peuvent exécuter du code Spark via des exécuteurs de notebook intégrés à Vertex AI Pipelines.

Spark via Dataplex (version bêta privée)

Exécutez l'autoscaling Spark sur les données de Google Cloud à partir d'une interface unique permettant d'accéder en un clic à SparkSQL, Notebooks ou PySpark. Il offre également une collaboration facile, avec la possibilité d'enregistrer, de partager et de rechercher des notebooks et des scripts parallèlement aux données, ainsi qu'une gouvernance intégrée sur l'ensemble des lacs de données.

Options de consommation flexibles

En plus du service sans serveur Spark pour le déploiement no-ops, les clients qui standardisent l'utilisation de Kubernetes pour la gestion de l'infrastructure peuvent exécuter Spark sur Google Kubernetes Engine (version bêta privée) pour améliorer l'utilisation des ressources et simplifier la gestion de l'infrastructure. Les clients qui cherchent à gérer l'infrastructure de type Hadoop peuvent exécuter Spark sur Compute Engine (disponibilité générale).


Vous êtes prêt ? Nous contacter

Nouveautés

Recevez les dernières actualités, les articles de blog et les événements Spark sur Google Cloud

Inscrivez-vous ici pour demander un accès anticipé aux nouvelles solutions Spark pour Google Cloud.