O Google Dataproc usa versões de imagem para agrupar sistemas operacionais, componentes de Big Data e conectores do Google Cloud Platform em um pacote implantado em um cluster. Para mais informações, consulte Controle de versões do Dataproc.
Versão padrão da imagem do Dataproc
O Dataproc atualiza a versão padrão da imagem para a versão mais recente disponível do Debian com base no Debian um mês após a data do GA.
Versões compatíveis do Dataproc
Imagens do Debian
As seguintes versões de imagem baseadas no Debian 10 são compatíveis com os clusters do Dataproc. Novos clusters serão criados para incluir patches subsecundários que tenham sido feitos para versões depois do lançamento.
Versão | Última atualização | Liberada em | Compatível até | Observações |
---|---|---|---|---|
2.0-debian10 | 14/06/2022 | 22/01/2021 | 02/2023 | Versão de disponibilidade geral. |
1.5-debian10 | 14/06/2022 | 25/03/2020 | 2022/12 | Versão de disponibilidade geral. |
Imagens do Ubuntu
As versões de imagem a seguir baseadas no Ubuntu 18.04 LTS são compatíveis com os clusters do Dataproc. Novos clusters serão criados para incluir patches subsecundários que tenham sido feitos para versões depois do lançamento.
Versão | Última atualização | Liberada em | Compatível até | Observações |
---|---|---|---|---|
2.0-ubuntu18 | 14/06/2022 | 22/01/2021 | 02/2023 | Versão de disponibilidade geral. |
1.5-ubuntu18 | 14/06/2022 | 25/03/2020 | 2022/12 | Versão de disponibilidade geral. |
Imagens rochosas do Linux
As seguintes versões de imagem baseadas no Rocky Linux são compatíveis com os clusters do Dataproc. Novos clusters serão criados para incluir patches subsecundários que tenham sido feitos para versões depois do lançamento.
Versão | Última atualização | Liberada em | Compatível até | Observações |
---|---|---|---|---|
2.0-rocky8 | 14/06/2022 | 18/02/2022 | 02/2023 | Versão de disponibilidade geral. |
1.5-rocky8 | 14/06/2022 | 18/02/2022 | 2022/12 | Versão de disponibilidade geral. |
Versões incompatíveis do Dataproc
As seguintes versões do Dataproc não são compatíveis. O Dataproc não oferece atualizações e suporte para clusters criados com estas versões. Embora seja possível continuar a execução de um cluster que foi criado com uma versão não compatível, recomendamos a substituição do cluster por um novo cluster criado com uma versão aceita.
Versão | Inclui | Liberada em | Última atualização | Observações |
---|---|---|---|---|
2.0-centos8 |
Apache Spark 3.1.2 Apache Hadoop 3.2.2 Apache Pig 0.18.0-SNAPSHOT Apache Hive 3.1.2 Conector do Cloud Storage 2.2.4-hadoop3 Python 3.8 Scala 2.12.14 Zookeeper 3.4.14 |
16/03/2021 | 01/02/2022 | Não compatível a partir de 01/02/2022. A versão final lançada era 2.0.30-centos8. |
1.5-centos8 |
Apache Spark 2.4.8 Apache Hadoop 2.10.1 Apache Pig 0.17.0 Apache Hive 2.3.7 Conector do Cloud Storage 2.1.5-hadoop2 Python 3.7 Scala 2.12.10 Zookeeper 3.4.14 |
14/12/2020 | 01/02/2022 | Não compatível desde 01/02/2022. A versão final lançada foi 1.5.56-centos8. |
1.4-debian10/-ubuntu18 |
Apache Spark 2.4.8 Apache Hadoop 2.9.2 Apache Pig 0.17.0 Apache Hive 2.3.7 Conector do Cloud Storage 1.9.18-hadoop2 Python 3.6 Scala 2.11.12 Zookeeper 3.4.14 |
22/03/2019 | 01/02/2022 | Não compatível a partir de 01/02/2022. 1.4.80-debian10/-ubuntu18 foi a versão final lançada. |
1.3-debian10/-ubuntu18 |
Apache Spark 2.3.4 Apache Hadoop 2.9.2 Apache Pig 0.17.0 Apache Hive 2.3.7 Conector do Cloud Storage 1.9.18-hadoop2 Python 2.7 Scala 2.11.8 Zookeeper 3.4.13 |
29/06/2018 | 22/12/2021 | Compatível com 01/08/2021. A versão final 1.3.95-debian10/-ubuntu18 foi lançada, e as vulnerabilidades do log4j2 foram resolvidas. Observação: as versões lançadas anteriormente são vulneráveis e precisam ser atualizadas. |
1.4-debian9 |
Apache Spark 2.4.5 Apache Hadoop 2.9.2 Apache Pig 0.17.0 Apache Hive 2.3.7 Conector do Cloud Storage 1.9.17-hadoop2 Python 3.6 Scala 2.11.12 Zookeeper 3.4.13 |
22/03/2019 | 10/07/2020 | Não compatível desde 10/07/2020. 1.4.33-debian9 era a versão de lançamento final. |
1.3-debian9 |
Apache Spark 2.3.4 Apache Hadoop 2.9.2 Apache Pig 0.17.0 Apache Hive 2.3.7 Conector do Cloud Storage 1.9.17-hadoop2 Python 2.7 Scala 2.11.8 Zookeeper 3.4.13 |
29/06/2018 | 10/07/2020 | Não compatível desde 10/07/2020. 1.3.62-debian9 era a versão de lançamento final. |
1.2-debian9 |
Apache Spark 2.2.3 Apache Hadoop 2.8.5 Apache Pig 0.16.0 Apache Hive 2.1.1 Conector do Cloud Storage 1.6.10-hadoop2 BigQuery connector 0.10.11-hadoop2 Python 2.7 Scala 2.11.8 Zookeeper 3.4.13 |
21/07/2017 | 10/07/2020 | Não compatível desde 10/07/2020. 1.2.102-debian9 era a versão de lançamento final. |
1.1-debian9 |
Apache Spark 2.0.2 Apache Hadoop 2.7.7 Apache Pig 0.16.0 Apache Hive 2.1.1 Conector do Cloud Storage 1.6.10-hadoop2 BigQuery connector 0.10.11-hadoop2 |
08/08/2016 | 26/09/2019 | Não compatível desde de 01/10/2019. 1.1.121-debian9 é a versão final lançada. |
1.0-debian9 |
Apache Spark 1.6.2 Apache Hadoop 2.7.4 Apache Pig 0.15.0 Apache Hive 1.2.1 Conector do Cloud Storage 1.6.10-hadoop2 BigQuery connector 0.10.11-hadoop2 |
22/02/2016 | 09/05/2019 | Primeiro lançamento da imagem do GA. O suporte a partir de 1º/04/2019. 1.0.119-debian9 era a versão de lançamento final. |
0.2 |
Apache Spark 1.5.2 Apache Hadoop 2.7.1 Apache Pig 0.15.0 Apache Hive 1.2.1 Conector do Cloud Storage 1.5.1-hadoop2 BigQuery connector 0.7.7-hadoop2 |
18/11/2015 | 02/08/2016 | Imagem beta, segunda versão |
0.1 |
Apache Spark 1.5.0 Apache Hadoop 2.7.1 Apache Pig 0.14.10 Apache Hive 1.0 Conector do Cloud Storage 1.5.1-hadoop2 BigQuery connector 0.7.7-hadoop2 |
23/09/2015 | 02/08/2016 | Versão beta do Dataproc. O Spark 1.5 foi compilado em relação ao Hive 1.2. |