Lightning Engine

Lightning Engine

Accélérer les performances d'Apache Spark

Notre moteur vectorisé est un moyen simple d'optimiser Spark grâce à un moteur intelligent qui offre des performances plus de 4,3 fois supérieures*, tout en réduisant les coûts de calcul.

*Les requêtes sont dérivées des normes TPC-DS et TPC-H. Elles ne sont donc pas comparables aux résultats publiés des benchmarks TPC-DS et TPC-H, car ces exécutions ne respectent pas toutes les exigences de la spécification TPC-DS et TPC-H.

Apache Spark est une marque de l'Apache Software Foundation.

Fonctionnalités

Réduire le temps d'exécution des jobs et les coûts

Exécutez Spark plus rapidement. Accélérez vos charges de travail ETL, de data science et SQL à grande échelle, avec des performances plus de 4,3 fois supérieures à celles d'Apache Spark Open Source. Cette réduction considérable de la durée d'exécution des jobs diminue le coût total de possession de vos charges de travail Spark en réduisant le temps de calcul.

Améliorer les performances de Spark

Découvrez un moyen plus simple d'améliorer les performances. Évitez de consacrer de précieuses ressources d'ingénierie à l'optimisation de Spark.

Mise en cache et accès aux données intelligents

Exploitez une architecture plus intelligente. Lightning Engine met automatiquement en cache les données fréquemment consultées en mémoire et utilise des connecteurs optimisés à haut débit pour Cloud Storage et BigQuery, ce qui améliore considérablement la latence des E/S et le débit pour le traitement des données Spark à grande échelle.


Technologie de base : exécution vectorisée

Lightning Engine exploite un moteur C++ natif avec exécution vectorisée pour traiter les données par lots, ce qui améliore considérablement l'efficacité du processeur par rapport au traitement ligne par ligne traditionnel. C'est l'un des facteurs clés de ses performances révolutionnaires dans Spark.


Qui peut en bénéficier ?

Qui peut en bénéficier ?Lightning Engine est conçu pour vos charges de travail Spark les plus exigeantes. Vous pouvez y accéder avec les niveaux Premium de Dataproc et Serverless pour Apache Spark.
ProduitDisponibilitéAccès

Disponible pour tous les utilisateurs

Dataproc sur Google Compute Engine

En preview

Bientôt disponible

Qui peut en bénéficier ?

Lightning Engine est conçu pour vos charges de travail Spark les plus exigeantes. Vous pouvez y accéder avec les niveaux Premium de Dataproc et Serverless pour Apache Spark.

Disponibilité

Disponible pour tous les utilisateurs

Accès

Dataproc sur Google Compute Engine

Disponibilité

En preview

Accès

Bientôt disponible

Fonctionnement

Lightning Engine accélère le traitement des données Spark grâce à un moteur vectorisé C++ natif, à la mise en cache intelligente et à des E/S optimisées. Cette fonctionnalité traite les données par lots pour une efficacité maximale du processeur, ce qui réduit le temps d'exécution des jobs et les coûts de calcul. Cet ensemble d'optimisations offre des performances Spark exceptionnelles.

Utilisations courantes

Idéal pour vos jobs les plus exigeants

ETL à grande échelle

Réduisez considérablement le temps d'exécution de vos pipelines de traitement et de transformation des données Spark les plus complexes. Vous pouvez ainsi respecter des SLA plus stricts concernant la fraîcheur des données, réduire les fenêtres par lot nocturnes et diminuer considérablement le coût total de possession de vos pipelines de données les plus gourmands en ressources.

Diapositive indiquant que les performances sont 4,3 fois supérieures à celles d'Apache Spark Open Source

    ETL à grande échelle

    Réduisez considérablement le temps d'exécution de vos pipelines de traitement et de transformation des données Spark les plus complexes. Vous pouvez ainsi respecter des SLA plus stricts concernant la fraîcheur des données, réduire les fenêtres par lot nocturnes et diminuer considérablement le coût total de possession de vos pipelines de données les plus gourmands en ressources.

    Diapositive indiquant que les performances sont 4,3 fois supérieures à celles d'Apache Spark Open Source

      Préparation des données d'IA et de ML

      Accélérez les étapes d'ingénierie des caractéristiques et de préparation des données qui sont essentielles pour votre cycle de vie de machine learning. En accélérant la partie la plus chronophage du workflow de ML, vos data scientists peuvent exécuter davantage de tests, effectuer des itérations plus rapidement sur les modèles et mettre en production plus tôt des applications d'IA de qualité.

      Optimisation du workflow de ML

        Préparation des données d'IA et de ML

        Accélérez les étapes d'ingénierie des caractéristiques et de préparation des données qui sont essentielles pour votre cycle de vie de machine learning. En accélérant la partie la plus chronophage du workflow de ML, vos data scientists peuvent exécuter davantage de tests, effectuer des itérations plus rapidement sur les modèles et mettre en production plus tôt des applications d'IA de qualité.

        Optimisation du workflow de ML

          Analyse interactive

          Exécutez des requêtes SQL rapides et interactives directement sur votre lac de données pour les analyses ad hoc et l'informatique décisionnelle. Offrez à vos analystes de données des temps de réponse plus courts aux requêtes afin qu'ils puissent rester concentrés, explorer les données plus rapidement et obtenir des insights plus pertinents.

          Le lakehouse ouvert nouvelle génération de Google Cloud optimisé par l'IA

            Analyse interactive

            Exécutez des requêtes SQL rapides et interactives directement sur votre lac de données pour les analyses ad hoc et l'informatique décisionnelle. Offrez à vos analystes de données des temps de réponse plus courts aux requêtes afin qu'ils puissent rester concentrés, explorer les données plus rapidement et obtenir des insights plus pertinents.

            Le lakehouse ouvert nouvelle génération de Google Cloud optimisé par l'IA

              Tarification

              Requêtes Spark accélérées, à votre façonLightning Engine est une fonctionnalité des niveaux Premium de Dataproc et de Google Cloud Serverless pour Apache Spark.
              ProduitTarifs

              En preview, bientôt disponible.

              Requêtes Spark accélérées, à votre façon

              Lightning Engine est une fonctionnalité des niveaux Premium de Dataproc et de Google Cloud Serverless pour Apache Spark.

              Tarifs

              En preview, bientôt disponible.

              Simulateur de coût

              Estimez vos coûts mensuels (l'estimation inclut les tarifs et les frais spécifiques à une région).

              Devis personnalisé

              Contactez notre équipe commerciale pour obtenir un devis personnalisé pour votre entreprise.

              Accélérer vos jobs Spark

              Boostez vos jobs Spark

              Vous avez un projet volumineux ?

              Commencer à utiliser Serverless pour Apache Spark

              Quand utiliser Lightning Engine pour Apache Spark

              Comparer Dataproc et Serverless pour Apache Spark

              • Faites des économies grâce à notre approche transparente concernant la tarification
              • Le paiement à l'usage de Google Cloud permet de réaliser des économies automatiques basées sur votre utilisation mensuelle et des tarifs réduits pour les ressources prépayées. Contactez-nous dès aujourd'hui afin d'obtenir un devis.
              Google Cloud