Listas de versões de imagem do cluster do Dataproc

Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

"Clusters de versão de imagem baseada em Ubuntu e Debian | Google Cloud"

O Google Dataproc usa as versões de imagem do Ubuntu, Debian e Rocky Linux para agrupar sistemas operacionais, componentes de Big Data e conectores do Google Cloud Platform em um pacote implantado em um cluster. Para mais informações, consulte Controle de versões do Dataproc.

Versão padrão da imagem do Dataproc

O Dataproc atualiza a versão padrão da imagem para a versão mais recente disponível do Debian com base no Debian um mês após a data do GA.

Versões compatíveis do Dataproc

Imagens do Debian

As seguintes versões de imagem baseadas em Debian são compatíveis com os clusters do Dataproc. Novos clusters serão criados para incluir patches subsecundários que tenham sido feitos para versões depois do lançamento.

Versão Última atualização Liberada em Compatível até Disponível até Observações
2.1-debian11; 23/01/2022 12/12/2022 31/12/2024 31/12/2026 Versão de disponibilidade geral.
2.0-debian10 23/01/2022 22/01/2021 31/12/2023 31/12/2025 Versão de disponibilidade geral.
1.5-debian10 23/01/2022 25/03/2020 31/03/2023 31/12/2024 Versão de disponibilidade geral.

Imagens do Ubuntu

As seguintes versões de imagem baseadas em LTS do Ubuntu são compatíveis com clusters do Dataproc. Novos clusters serão criados para incluir patches subsecundários que tenham sido feitos para versões depois do lançamento.

Versão Última atualização Liberada em Compatível até Disponível até Observações
2.1.0-ubuntu20 23/01/2022 12/12/2022 31/12/2024 31/12/2026 Versão de disponibilidade geral.
2.0-ubuntu18 23/01/2022 22/01/2021 31/12/2023 31/12/2025 Versão de disponibilidade geral.
1.5-ubuntu18 23/01/2022 25/03/2020 31/03/2023 31/12/2024 Versão de disponibilidade geral.

Imagens Rocky Linux

As seguintes versões de imagem baseadas no Linux são compatíveis com clusters do Dataproc. Novos clusters serão criados para incluir patches subsecundários que tenham sido feitos para versões depois do lançamento.

Versão Última atualização Liberada em Compatível até Disponível até Observações
2.1.0-rocky8 23/01/2022 12/12/2022 31/12/2024 31/12/2026 Versão de disponibilidade geral.
2.0-rocky8 (link em inglês) 23/01/2022 18/02/2022 31/12/2023 31/12/2025 Versão de disponibilidade geral.
1,5-rocky8 23/01/2022 18/02/2022 31/03/2023 31/12/2024 Versão de disponibilidade geral.

Versões incompatíveis do Dataproc

As seguintes versões do Dataproc não são compatíveis. O Dataproc não oferece atualizações e suporte para clusters criados com estas versões. Embora seja possível continuar a execução de um cluster que foi criado com uma versão não compatível, recomendamos a substituição do cluster por um novo cluster criado com uma versão aceita.

Versão Inclui Liberada em Última atualização Observações
2.0-centos8 Apache Spark 3.1.2
Apache Hadoop 3.2.2
Apache Pig 0.18.0-SNAPSHOT
Apache Hive 3.1.2
Cloud Storage connector 2.2.4-hadoop3
Python 3.8
Scala 2.12.14
Zookeeper 3.4.14
16/03/2021 01/02/2022 Não recebe suporte desde 01/02/2022.
A versão final 2.0.30-centos8 foi lançada.
1.5-centos8 Apache Spark 2.4.8
Apache Hadoop 2.10.1
Apache Pig 0.17.0
Apache Hive 2.3.7
Conector do Cloud Storage 2.1.5-hadoop2
Python 3.7
Scala 2.12.10
Zookeeper 3.4.14
14/12/2020 01/02/2022 Não recebe suporte desde 01/02/2022.
1.5.56-centos8 foi a versão final lançada.
1.4-debian10/-ubuntu18 Apache Spark 2.4.8
Apache Hadoop 2.9.2
Apache Pig 0.17.0
Apache Hive 2.3.7
Conector do Cloud Storage 1.9.18-hadoop2
Python 3.6
Scala 2.11.12
Zookeeper 3.4.14
22/03/2019 01/02/2022 Não recebe suporte desde 01/02/2022.
1.4.80-debian10/-ubuntu18 foi a versão final lançada.
1.3-debian10/-ubuntu18 Apache Spark 2.3.4
Apache Hadoop 2.9.2
Apache Pig 0.17.0
Apache Hive 2.3.7
Conector do Cloud Storage 1.9.18-hadoop2
Python 2.7
Scala 2.11.8
Zookeeper 3.4.13
29/06/2018 22/12/2021 Não recebe suporte desde 01/08/2021.
1.3.95-debian10/-ubuntu18 é a versão final lançada, que tem vulnerabilidades log4j2 resolvidas. Observação: as versões lançadas anteriormente são vulneráveis e precisam ser atualizadas.
1.4-debian9 Apache Spark 2.4.5
Apache Hadoop 2.9.2
Apache Pig 0.17.0
Apache Hive 2.3.7
Conector do Cloud Storage 1.9.17-hadoop2
Python 3.6
Scala 2.11.12
Zookeeper 3.4.13
22/03/2019 10/07/2020 Não compatível desde 10/07/2020.
1.4.33-debian9 era a versão de lançamento final.
1.3-debian9 Apache Spark 2.3.4
Apache Hadoop 2.9.2
Apache Pig 0.17.0
Apache Hive 2.3.7
Conector do Cloud Storage 1.9.17-hadoop2
Python 2.7
Scala 2.11.8
Zookeeper 3.4.13
29/06/2018 10/07/2020 Não compatível desde 10/07/2020.
1.3.62-debian9 era a versão de lançamento final.
1.2-debian9 Apache Spark 2.2.3
Apache Hadoop 2.8.5
Apache Pig 0.16.0
Apache Hive 2.1.1
Conector do Cloud Storage 1.6.10-hadoop2
BigQuery connector 0.10.11-hadoop2
Python 2.7
Scala 2.11.8
Zookeeper 3.4.13
21/07/2017 10/07/2020 Não compatível desde 10/07/2020.
1.2.102-debian9 era a versão de lançamento final.
1.1-debian9 Apache Spark 2.0.2
Apache Hadoop 2.7.7
Apache Pig 0.16.0
Apache Hive 2.1.1
Conector do Cloud Storage 1.6.10-hadoop2
BigQuery connector 0.10.11-hadoop2
08/08/2016 26/09/2019 Não compatível desde de 01/10/2019.
1.1.121-debian9 é a versão final lançada.
1.0-debian9 Apache Spark 1.6.2
Apache Hadoop 2.7.4
Apache Pig 0.15.0
Apache Hive 1.2.1
Conector do Cloud Storage 1.6.10-hadoop2
BigQuery connector 0.10.11-hadoop2
22/02/2016 09/05/2019 Primeiro lançamento da imagem do GA.
O suporte a partir de 1º/04/2019.
1.0.119-debian9 era a versão de lançamento final.
0.2 Apache Spark 1.5.2
Apache Hadoop 2.7.1
Apache Pig 0.15.0
Apache Hive 1.2.1
Conector do Cloud Storage 1.5.1-hadoop2
BigQuery connector 0.7.7-hadoop2
18/11/2015 02/08/2016 Imagem beta, segunda versão
0.1 Apache Spark 1.5.0
Apache Hadoop 2.7.1
Apache Pig 0.14.10
Apache Hive 1.0
Conector do Cloud Storage 1.5.1-hadoop2
BigQuery connector 0.7.7-hadoop2
23/09/2015 02/08/2016 Versão beta do Dataproc.
O Spark 1.5 foi compilado em relação ao Hive 1.2.