La nouvelle façon d'utiliser Spark plus facilement, plus intelligemment et plus rapidement.
Exécutez des charges de travail Apache Spark sur Google Cloud avec moins de frais généraux opérationnels, plus d'assistance optimisée par l'IA et un meilleur rapport prix/performances. Concentrez-vous sur le code plutôt que sur les clusters.
Avantages
Plus facile : éliminez la charge opérationnelle de Spark
Choisissez entre Google Cloud Serverless pour Apache Spark sans opérations et les clusters Dataproc gérés. Les deux services automatisent la complexité de l'infrastructure pour vous permettre d'accélérer votre cycle de vie de développement.
Plus intelligent : développement Spark assisté par l'IA
Accélérez l'ensemble de votre workflow avec Gemini dans Dataproc et Google Cloud Serverless pour Apache Spark. Bénéficiez de l'aide de Gemini pour générer et déboguer du code, et résoudre les problèmes liés aux jobs ayant échoué.
Plus rapide : améliorez les performances de Spark
Profitez du meilleur rapport prix/performances du secteur, automatiquement. Pour vos jobs les plus exigeants, profitez de performances plus de 4,3 fois supérieures avec Lightning Engine. Cela permet de réduire le coût total de possession et d'accélérer le délai d'obtention des insights.
Principales fonctionnalités
Choisissez Serverless pour Apache Spark pour une simplicité sans opérations ou Dataproc pour des clusters gérés avec des personnalisations avancées.
Concentrez-vous uniquement sur votre code et accélérez le développement. Avec des niveaux pour le traitement par lot économique et l'IA/le ML hautes performances, cette solution est idéale pour les nouveaux pipelines Apache Spark, l'analyse interactive et les charges de travail avec une demande imprévisible où un modèle NoOps est à privilégier.
Idéal pour : les data scientists et les ingénieurs en ML, les requêtes ad hoc, les nouvelles applications, la productivité des développeurs.
Bénéficiez d'un contrôle maximal sur votre environnement de cluster. Idéal pour migrer des charges de travail Apache Hadoop/Spark existantes, exécuter des clusters persistants de longue durée ou utiliser un écosystème Open Source diversifié.
Idéal pour : l'ingénierie et les opérations d'entreprise, les migrations sur site, les jobs de longue durée et la personnalisation avancée.
Documentation
Ne choisissez plus entre la puissance de SQL et la flexibilité de Spark. BigLake vous permet d'utiliser les deux moteurs sur les mêmes données régies. Il s'agit d'une expérience unifiée qui vous permet d'utiliser l'outil le plus adapté à chaque tâche.
Passez plus rapidement de la préparation des données à l'entraînement et à l'inférence du modèle. Nos niveaux Premium sont conçus pour l'IA/le ML. Ils vous permettent d'utiliser des environnements d'exécution de ML préconfigurés avec une prise en charge intégrée des GPU, comme NVIDIA RAPIDS, pour éliminer les configurations complexes.
Nouveautés
Apache Spark est une marque de l'Apache Software Foundation.
** Les requêtes sont dérivées de la norme TPC-DS et de la norme TPC-H. Elles ne sont donc pas comparables aux résultats publiés pour la norme TPC-DS et la norme TPC-H, car ces exécutions ne respectent pas toutes les exigences de la spécification de la norme TPC-DS et de la norme TPC-H.
Présentez-nous votre objectif. Un de nos experts Google Cloud vous aidera à trouver la solution la plus adaptée.