MapReduce para App Engine

Importante: o Google passou o suporte e o desenvolvimento posterior das bibliotecas MapReduce para Java e Python para a comunidade de código-fonte aberto. O código-fonte e a documentação estão disponíveis no GitHub.

MapReduce é um modelo de programação que processa grandes volumes de dados de modo paralelo e distribuído. Ele é útil para jobs grandes e de longa duração que não podem ser processados dentro do escopo de uma única solicitação, por exemplo:

  • analisar registros de aplicativos;
  • agregar dados relacionados de fontes externas;
  • transformar dados de um formato para outro;
  • exportar dados para análise externa.

O MapReduce para App Engine é uma biblioteca de código aberto mantida pela comunidade, criada com base nos serviços do App Engine, incluindo Datastore e filas de tarefas. A biblioteca está disponível no GitHub nestes locais:

  • projeto de código em Java

  • projeto de código em Python

Onde encontrar documentação

A documentação do MapReduce está disponível por meio de clique no ícone wiki dos projetos do GitHub com link acima. No entanto, para sua conveniência, você também pode acessar a documentação do MapReduce para Java e Python no seguinte link: