App Engine MapReduce

重要提示:Google 已将 Java 和 Python MapReduce 库的支持和进一步开发转移到开源社区。GitHub 上提供了源代码和文档。

MapReduce 是一种以并行分布式方式处理大量数据的编程模型。该模型适用于长时间运行且无法在单个请求范围内处理的大型作业,例如以下任务:

  • 分析应用日志
  • 汇总来自外部来源的相关数据
  • 将数据从一种格式转换为另一种格式
  • 导出数据以供外部分析

App Engine MapReduce 是一个由社区维护的开放源代码库,基于 App Engine 服务(包括 Datastore 和任务队列)构建而成。您可以在 GitHub 上的以下位置找到该库:

何处找到文档

点击上述 GitHub 项目的 Wiki 图标即可获得 Mapreduce 文档。但为方便起见,您还可以通过以下链接访问 Java 和 Python MapReduce 的文档: