Apache Spark sur Google Cloud

La nouvelle façon d'utiliser Spark plus facilement, plus intelligemment et plus rapidement.

Exécutez des charges de travail Apache Spark sur Google Cloud avec moins de frais généraux opérationnels, plus d'assistance optimisée par l'IA et un meilleur rapport prix/performances. Concentrez-vous sur le code plutôt que sur les clusters.


Avantages

Une meilleure expérience pour Apache Spark sur Google Cloud

Plus facile : éliminez la charge opérationnelle de Spark

Choisissez entre Google Cloud Serverless pour Apache Spark sans opérations et les clusters Dataproc gérés. Les deux services automatisent la complexité de l'infrastructure pour vous permettre d'accélérer votre cycle de vie de développement.

Comparer les deux options

Plus intelligent : développement Spark assisté par l'IA

Accélérez l'ensemble de votre workflow avec Gemini dans Dataproc et Google Cloud Serverless pour Apache Spark. Bénéficiez de l'aide de Gemini pour générer et déboguer du code, et résoudre les problèmes liés aux jobs ayant échoué. 

En savoir plus sur Gemini Code Assist

Plus rapide : améliorez les performances de Spark

Profitez du meilleur rapport prix/performances du secteur, automatiquement. Pour vos jobs les plus exigeants, profitez de performances plus de 4,3 fois supérieures avec Lightning Engine. Cela permet de réduire le coût total de possession et d'accélérer le délai d'obtention des insights.

Découvrir Lightning Engine

Principales fonctionnalités

Choisissez la solution Spark adaptée à votre charge de travail

Choisissez Serverless pour Apache Spark pour une simplicité sans opérations ou Dataproc pour des clusters gérés avec des personnalisations avancées.

Consulter le guide de décision

Google Cloud Serverless pour Apache Spark

Concentrez-vous uniquement sur votre code et accélérez le développement. Avec des niveaux pour le traitement par lot économique et l'IA/le ML hautes performances, cette solution est idéale pour les nouveaux pipelines Apache Spark, l'analyse interactive et les charges de travail avec une demande imprévisible où un modèle NoOps est à privilégier.

Idéal pour : les data scientists et les ingénieurs en ML, les requêtes ad hoc, les nouvelles applications, la productivité des développeurs.

Explorer Spark sans serveur

Dataproc

Bénéficiez d'un contrôle maximal sur votre environnement de cluster. Idéal pour migrer des charges de travail Apache Hadoop/Spark existantes, exécuter des clusters persistants de longue durée ou utiliser un écosystème Open Source diversifié.

Idéal pour : l'ingénierie et les opérations d'entreprise, les migrations sur site, les jobs de longue durée et la personnalisation avancée.

Découvrir Dataproc

Documentation

Documentation

Tutorial

Exécuter votre premier job Spark sans serveur

Suivez ce guide de démarrage rapide pour découvrir la rapidité et la simplicité de Spark sans serveur. Découvrez comment envoyer un job par lot PySpark à l'aide de la Google Cloud CLI.

Tutorial

Créer un cluster Dataproc géré

Ce tutoriel vous explique comment créer un cluster Dataproc à l'aide de la console Google Cloud. Découvrez comment configurer et provisionner un environnement géré pour vos charges de travail Spark et Hadoop.

Best Practice

Unifiez vos analyses : SQL et Spark sur une seule copie des données

Ne choisissez plus entre la puissance de SQL et la flexibilité de Spark. BigLake vous permet d'utiliser les deux moteurs sur les mêmes données régies. Il s'agit d'une expérience unifiée qui vous permet d'utiliser l'outil le plus adapté à chaque tâche.

Best Practice

Accélérez l'ensemble du cycle de vie de l'IA et du ML

Passez plus rapidement de la préparation des données à l'entraînement et à l'inférence du modèle. Nos niveaux Premium sont conçus pour l'IA/le ML. Ils vous permettent d'utiliser des environnements d'exécution de ML préconfigurés avec une prise en charge intégrée des GPU, comme NVIDIA RAPIDS, pour éliminer les configurations complexes.

Vous ne trouvez pas ce que vous cherchez ?


Apache Spark est une marque de l'Apache Software Foundation.

** Les requêtes sont dérivées de la norme TPC-DS et de la norme TPC-H. Elles ne sont donc pas comparables aux résultats publiés pour la norme TPC-DS et la norme TPC-H, car ces exécutions ne respectent pas toutes les exigences de la spécification de la norme TPC-DS et de la norme TPC-H.

Passez à l'étape suivante

Présentez-nous votre objectif. Un de nos experts Google Cloud vous aidera à trouver la solution la plus adaptée.

  • Faites des économies grâce à notre approche transparente concernant la tarification
  • Le paiement à l'usage de Google Cloud permet de réaliser des économies automatiques basées sur votre utilisation mensuelle et des tarifs réduits pour les ressources prépayées. Contactez-nous dès aujourd'hui afin d'obtenir un devis.
Google Cloud