MapReduce para App Engine

Importante: Google migró el desarrollo y la asistencia adicional de las bibliotecas de MapReduce para Java y Python a la comunidad de código abierto. El código fuente y la documentación están disponibles en GitHub

MapReduce es un modelo de programación para procesar grandes cantidades de datos de forma paralela y distribuida. Es útil para grandes trabajos de larga duración que no pueden manejarse dentro del alcance de una sola solicitud, en tareas como las siguientes:

  • Analizar registros de aplicaciones
  • Agregar datos relacionados de fuentes externas
  • Transformar datos de un formato a otro
  • Exportar datos para análisis externo

MapReduce de App Engine es una biblioteca de código abierto con mantenimiento de la comunidad que está basada en los servicios de App Engine, incluidos Datastore y las listas de tareas en cola. La biblioteca está disponible en GitHub en estas ubicaciones:

  • Proyecto fuente de Java.

  • Proyecto fuente de Python.

Dónde encontrar documentación

Puedes encontrar la documentación de MapReduce si haces clic en el ícono de wiki de los proyectos de GitHub ya mencionados. También puedes acceder a la documentación de MapReduce de Java y Python en el siguiente vinculo: