Importante: o Google passou o suporte e o desenvolvimento posterior das bibliotecas MapReduce para Java e Python para a comunidade de código-fonte aberto. O código-fonte e a documentação estão disponíveis no GitHub.
MapReduce é um modelo de programação que processa grandes volumes de dados de modo paralelo e distribuído. Ele é útil para jobs grandes e de longa duração que não podem ser processados dentro do escopo de uma única solicitação, por exemplo:
- analisar registros de aplicativos;
- agregar dados relacionados de fontes externas;
- transformar dados de um formato para outro;
- exportar dados para análise externa.
O MapReduce para App Engine é uma biblioteca de código aberto mantida pela comunidade, criada com base nos serviços do App Engine, incluindo Datastore e filas de tarefas. A biblioteca está disponível no GitHub nestes locais:
Onde encontrar documentação
A documentação do MapReduce está disponível por meio de clique no ícone wiki dos projetos do GitHub com link acima. No entanto, para sua conveniência, você também pode acessar a documentação do MapReduce para Java e Python no seguinte link: