Instalar o SDK do Apache Beam

Nesta página, você verá como instalar o SDK do Apache Beam para poder executar canais no serviço do Cloud Dataflow.

Aviso de suspensão de uso do SDK do Cloud Dataflow: o SDK do Cloud Dataflow 2.5.0 é a última versão separada das versões do SDK do Apache Beam. O serviço do Cloud Dataflow é totalmente compatível com as versões oficiais do SDK do Apache Beam e com as lançadas anteriormente, a partir da versão 2.0.0. Consulte a página de suporte do Cloud Dataflow para mais informações sobre o status de suporte dos diversos SDKs.

Como instalar versões do SDK

Java

A versão mais recente do SDK do Apache Beam para Java é a 2.13.0. Veja o anúncio de lançamento (em inglês) para informações sobre as alterações incluídas na versão.

Para fazer o download do SDK do Apache Beam para Java usando o Maven, utilize um dos artefatos lançados no Repositório central do Maven.

Adicione uma dependência ao arquivo pom.xml e especifique um intervalo de versões (em inglês) para o artefato do SDK da seguinte maneira:

  <dependency>
  <groupId>org.apache.beam</groupId>
  <artifactId>beam-sdks-java-core</artifactId>
  <version>[2.13.0, 2.99)</version>
  </dependency>
  

Observação: o artefato beam-sdks-java-core contém apenas o SDK principal. Outras dependências, como E/S ou executores, precisam ser explicitamente adicionadas à lista de dependências.

Python

A versão mais recente do SDK do Apache Beam para Python é a 2.13.0. Veja o anúncio de lançamento para informações sobre as alterações incluídas na versão.

Para fazer o download do SDK do Apache Beam para Python, use um dos pacotes lançados no Índice de pacotes do Python (em inglês).

Instale a versão mais recente do SDK do Apache Beam para Python executando o seguinte comando em um ambiente virtual:

    pip install apache-beam[gcp]
  

Para atualizar uma instalação existente de apache-beam, use a sinalização --upgrade:

    pip install --upgrade apache-beam[gcp]
  

Observação: os números de versão usam a forma major.minor.incremental e recebem incrementos da seguinte maneira: versão major para alterações de APIs incompatíveis, versão minor para funcionalidade nova adicionada considerando a compatibilidade com versões anteriores e versão incremental para correções de bugs considerando a compatibilidade com versões futuras. As APIs marcadas como experimentais podem ser alteradas a qualquer momento.

Código-fonte e exemplos

O código-fonte do Apache Beam está disponível no repositório do Apache Beam (em inglês) no GitHub.

Java

Há amostras de código disponíveis no repositório de exemplos do Apache Beam no GitHub (em inglês).

Python

Há amostras de código disponíveis no repositório de exemplos do Apache Beam no GitHub (em inglês).

Mais ferramentas

Java

O Cloud Dataflow se integra à ferramenta de linha de comando gcloud do SDK do Cloud. Consulte Como usar a interface de linha de comando do Cloud Dataflow para instruções sobre a instalação da interface.

O Cloud Tools for Eclipse inclui um plug-in para ajudar a criar projetos e canais do Cloud Dataflow usando o Eclipse IDE. Consulte o guia de início rápido sobre como usar o Java e o Eclipse para ver instruções sobre a instalação do plug-in do Cloud Tools for Eclipse. Observação: o Cloud Tools for Eclipse funciona apenas com a distribuição do SDK do Cloud Dataflow, versões 2.0.0 a 2.5.0. O plug-in do Cloud Tools for Eclipse não funciona com a distribuição do SDK do Apache Beam.

Python

O Cloud Dataflow se integra à ferramenta de linha de comando gcloud do SDK do Cloud. Consulte Como usar a interface de linha de comando do Cloud Dataflow para instruções sobre a instalação da interface.

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Precisa de ajuda? Acesse nossa página de suporte.