Lightning Engine

Lightning Engine

Acelerar a performance do Apache Spark

Nosso mecanismo vetorializado é uma maneira mais fácil de otimizar o Spark com um mecanismo mais inteligente que oferece um desempenho do Spark 4,3 vezes mais rápido*, reduzindo os custos de computação.

*As consultas são derivadas do padrão TPC-DS e do padrão TPC-H e, portanto, não podem ser comparadas aos resultados publicados do padrão TPC-DS e do padrão TPC-H, porque essas execuções não atendem a todos os requisitos da especificação do padrão TPC-DS e do padrão TPC-H.

Apache Spark é uma marca registrada da Apache Software Foundation.

Recursos

Reduza os tempos de execução dos jobs e diminua os custos

Tenha uma maneira mais rápida de executar o Spark. Acelere suas cargas de trabalho de ETL, ciência de dados e SQL em grande escala mais de 4, 3 vezes mais rápido do que o Apache Spark de código aberto. Essa redução drástica no tempo de execução do job diminui o custo total de propriedade das suas cargas de trabalho do Spark ao reduzir o tempo de computação.

Acelere a performance do Spark

Descubra uma maneira mais fácil de melhorar a performance. Reduza o tempo gasto em otimizar o Spark.

Acesso e armazenamento em cache de dados inteligentes

Aproveite uma arquitetura mais inteligente. O Lightning Engine armazena automaticamente em cache os dados mais usados na memória e utiliza conectores otimizados de alta capacidade de processamento para o Cloud Storage e o BigQuery, melhorando significativamente a latência e a capacidade de processamento de E/S para o processamento de dados do Spark em grande escala.


A tecnologia principal: execução vetorizada

O Lightning Engine usa um mecanismo de execução vetorial nativo em C++ para processar dados em lotes, melhorando drasticamente a eficiência da CPU em relação ao processamento tradicional linha por linha. Esse é um componente essencial do desempenho inovador do Spark.


Disponibilidade

DisponibilidadeO Lightning Engine é para suas cargas de trabalho do Spark mais exigentes. Você pode acessar esse recurso com os níveis premium do Dataproc e do Apache Spark sem servidor
ProdutoDisponibilidadeAcesso

Disponibilidade geral

Dataproc no Google Compute Engine

Em pré-lançamento

Em breve

Disponibilidade

O Lightning Engine é para suas cargas de trabalho do Spark mais exigentes. Você pode acessar esse recurso com os níveis premium do Dataproc e do Apache Spark sem servidor

Disponibilidade

Disponibilidade geral

Acesso

Dataproc no Google Compute Engine

Disponibilidade

Em pré-lançamento

Acesso

Em breve

Como funciona

O Lightning Engine acelera o processamento de dados do Spark com um mecanismo vetorizado nativo em C++, armazenamento em cache inteligente e E/S otimizada. Ele processa dados em lotes para máxima eficiência da CPU, reduzindo os tempos de execução dos jobs e os custos de computação. Esse conjunto de otimizações oferece um desempenho inovador do Spark.

Usos comuns

Ideal para seus jobs mais exigentes

ETL em grande escala

Reduza drasticamente o tempo de execução dos seus pipelines de transformação e processamento de dados do Spark mais complexos. Isso significa que você pode atender a SLAs de atualização de dados mais rigorosos, reduzir as janelas de lote noturnas e diminuir significativamente o TCO dos seus pipelines de dados com uso mais intensivo de recursos.

Leitura de slides com desempenho 4,3 vezes melhor em comparação com o Apache Spark de código aberto.

    ETL em grande escala

    Reduza drasticamente o tempo de execução dos seus pipelines de transformação e processamento de dados do Spark mais complexos. Isso significa que você pode atender a SLAs de atualização de dados mais rigorosos, reduzir as janelas de lote noturnas e diminuir significativamente o TCO dos seus pipelines de dados com uso mais intensivo de recursos.

    Leitura de slides com desempenho 4,3 vezes melhor em comparação com o Apache Spark de código aberto.

      Preparação de dados de IA/ML

      Acelere as etapas de engenharia de atributos e preparação de dados que são essenciais para o ciclo de vida do machine learning. Ao acelerar a parte mais demorada do fluxo de trabalho de ML, seus cientistas de dados podem executar mais experimentos, fazer iterações nos modelos com mais rapidez e colocar aplicativos de IA valiosos em produção mais cedo.

      Otimização do fluxo de trabalho de ML

        Preparação de dados de IA/ML

        Acelere as etapas de engenharia de atributos e preparação de dados que são essenciais para o ciclo de vida do machine learning. Ao acelerar a parte mais demorada do fluxo de trabalho de ML, seus cientistas de dados podem executar mais experimentos, fazer iterações nos modelos com mais rapidez e colocar aplicativos de IA valiosos em produção mais cedo.

        Otimização do fluxo de trabalho de ML

          Análise interativa

          Faça consultas SQL rápidas e interativas diretamente no seu data lake para análise ad hoc e business intelligence. Permita que seus analistas de dados mantenham o raciocínio com tempos de resposta de consulta mais rápidos, o que leva a uma exploração de dados mais rápida e insights mais eficazes.

          Lakehouse aberto de última geração com tecnologia de IA do Google Cloud

            Análise interativa

            Faça consultas SQL rápidas e interativas diretamente no seu data lake para análise ad hoc e business intelligence. Permita que seus analistas de dados mantenham o raciocínio com tempos de resposta de consulta mais rápidos, o que leva a uma exploração de dados mais rápida e insights mais eficazes.

            Lakehouse aberto de última geração com tecnologia de IA do Google Cloud

              Preços

              Spark acelerado do seu jeitoO Lightning Engine é um recurso dos níveis premium do Dataproc e do Google Cloud Serverless para Apache Spark.
              ProdutoPreços

              Em pré-lançamento, disponível em breve.

              Spark acelerado do seu jeito

              O Lightning Engine é um recurso dos níveis premium do Dataproc e do Google Cloud Serverless para Apache Spark.

              Preços

              Em pré-lançamento, disponível em breve.

              Calculadora de preços

              Estime seus custos mensais, incluindo preços e taxas específicos da região.

              Cota personalizada

              Fale com nossa equipe de vendas e receba uma cotação personalizada para sua organização.

              Acelere seu Spark

              Turbine seus jobs do Spark

              Tem um projeto grande?

              Comece a usar o Serverless para Apache Spark

              Quando usar o Lightning Engine para Apache Spark

              Comparar o Dataproc e o Serverless para Apache Spark

              Google Cloud