Une nouvelle classe de performances Spark : notre moteur vectorisé Lightning Engine optimise Spark sur Google Cloud et offre des performances Spark plus de 4,3 fois supérieures.

Apache Spark sur Google Cloud

La nouvelle façon d'utiliser Spark plus facilement, plus intelligemment et plus rapidement.

Exécutez des charges de travail Apache Spark sur Google Cloud avec moins de frais généraux opérationnels, plus d'assistance optimisée par l'IA et un meilleur rapport prix/performances. Concentrez-vous sur le code plutôt que sur les clusters.

Rapport ESG de Google Cloud pour Apache Spark

Google Cloud peut permettre de réaliser des économies de 18 à 60 % par rapport à d'autres solutions cloud Apache Spark

Télécharger le rapport ESG

Avantages

Une meilleure expérience pour Apache Spark sur Google Cloud

Plus facile : éliminez la charge opérationnelle de Spark

Choisissez entre Google Cloud Serverless pour Apache Spark sans opérations et les clusters Dataproc gérés. Les deux services automatisent la complexité de l'infrastructure pour vous permettre d'accélérer votre cycle de vie de développement.

Comparer les deux options

Plus intelligent : développement Spark assisté par l'IA

Accélérez l'ensemble de votre workflow avec Gemini dans Dataproc et Google Cloud Serverless pour Apache Spark. Bénéficiez de l'aide de Gemini pour générer et déboguer du code, et résoudre les problèmes liés aux jobs ayant échoué.

En savoir plus sur Gemini Code Assist

Plus rapide : améliorez les performances de Spark

Profitez du meilleur rapport prix/performances du secteur, automatiquement. Pour vos jobs les plus exigeants, profitez de performances plus de 4,3 fois supérieures avec Lightning Engine. Cela permet de réduire le coût total de possession et d'accélérer le délai d'obtention des insights.

Découvrir Lightning Engine

Principales fonctionnalités

Choisissez la solution Spark adaptée à votre charge de travail

Choisissez Serverless pour Apache Spark pour une simplicité sans opérations ou Dataproc pour des clusters gérés avec des personnalisations avancées.

Consulter le guide de décision

Google Cloud Serverless pour Apache Spark

Concentrez-vous uniquement sur votre code et accélérez le développement. Avec des niveaux pour le traitement par lot économique et l'IA/le ML hautes performances, cette solution est idéale pour les nouveaux pipelines Apache Spark, l'analyse interactive et les charges de travail avec une demande imprévisible où un modèle NoOps est à privilégier.

Idéal pour : les data scientists et les ingénieurs en ML, les requêtes ad hoc, les nouvelles applications, la productivité des développeurs.

Explorer Spark sans serveur

Dataproc

Bénéficiez d'un contrôle maximal sur votre environnement de cluster. Idéal pour migrer des charges de travail Apache Hadoop/Spark existantes, exécuter des clusters persistants de longue durée ou utiliser un écosystème Open Source diversifié.

Idéal pour : l'ingénierie et les opérations d'entreprise, les migrations sur site, les jobs de longue durée et la personnalisation avancée.

Découvrir Dataproc

Clients

Obtenir des résultats commerciaux tangibles

Video

Nouvelle approche : Dun & Bradstreet réduit les workflows de données à quelques minutes et améliore les temps de réponse des produits de 60 %

2:46

Video

trivago exploite la puissance de Spark dans BigQuery

45:00

Partenaires

Partenaires recommandés

Documentation

Tutorial

Exécuter votre premier job Spark sans serveur

Suivez ce guide de démarrage rapide pour découvrir la rapidité et la simplicité de Spark sans serveur. Découvrez comment envoyer un job par lot PySpark à l'aide de la Google Cloud CLI.

Tutorial

Créer un cluster Dataproc géré

Ce tutoriel vous explique comment créer un cluster Dataproc à l'aide de la console Google Cloud. Découvrez comment configurer et provisionner un environnement géré pour vos charges de travail Spark et Hadoop.

Best Practice

Unifiez vos analyses : SQL et Spark sur une seule copie des données

Ne choisissez plus entre la puissance de SQL et la flexibilité de Spark. BigLake vous permet d'utiliser les deux moteurs sur les mêmes données régies. Il s'agit d'une expérience unifiée qui vous permet d'utiliser l'outil le plus adapté à chaque tâche.

Best Practice

Accélérez l'ensemble du cycle de vie de l'IA et du ML

Passez plus rapidement de la préparation des données à l'entraînement et à l'inférence du modèle. Nos niveaux Premium sont conçus pour l'IA/le ML. Ils vous permettent d'utiliser des environnements d'exécution de ML préconfigurés avec une prise en charge intégrée des GPU, comme NVIDIA RAPIDS, pour éliminer les configurations complexes.

Vous ne trouvez pas ce que vous cherchez ?

Nouveautés

Recevez les dernières actualités de Spark sur Google Cloud

Blog post

Connecter les pipelines de données Spark à GeminiConsulter le blog

Afficher l'article du blog sur le lancement

Blog post

Data Science Agent et SparkConsulter le blog

Blog post

Clusters Dataproc mutualisésConsulter le blog

Apache Spark est une marque de l'Apache Software Foundation.

** Les requêtes sont dérivées de la norme TPC-DS et de la norme TPC-H. Elles ne sont donc pas comparables aux résultats publiés pour la norme TPC-DS et la norme TPC-H, car ces exécutions ne respectent pas toutes les exigences de la spécification de la norme TPC-DS et de la norme TPC-H.

Passez à l'étape suivante

Présentez-nous votre objectif. Un de nos experts Google Cloud vous aidera à trouver la solution la plus adaptée.

Démarrer la création
Suivre le tutoriel interactif
Commencez à utiliser Google Cloud dès aujourd'hui
Recevez 300 $ de crédits
Consulter les détails techniques
Consulter la documentation

Apache Spark sur Google Cloud

Une meilleure expérience pour Apache Spark sur Google Cloud

Plus facile : éliminez la charge opérationnelle de Spark

Plus intelligent : développement Spark assisté par l'IA

Plus rapide : améliorez les performances de Spark

Choisissez la solution Spark adaptée à votre charge de travail

Google Cloud Serverless pour Apache Spark

Dataproc

Obtenir des résultats commerciaux tangibles

Partenaires recommandés

Le moteur de votre data lakehouse cloud ouvert

Documentation

Exécuter votre premier job Spark sans serveur

Créer un cluster Dataproc géré

Unifiez vos analyses : SQL et Spark sur une seule copie des données

Accélérez l'ensemble du cycle de vie de l'IA et du ML

Vous ne trouvez pas ce que vous cherchez ?

Recevez les dernières actualités de Spark sur Google Cloud

Passez à l'étape suivante

Démarrer la création

Commencez à utiliser Google Cloud dès aujourd'hui

Consulter les détails techniques