MapReduce para App Engine

Importante: Google ha transferido la asistencia y el desarrollo de las bibliotecas MapReduce de Java y Python a la comunidad de código abierto. El código fuente y la documentación están disponibles en GitHub.

MapReduce es un modelo de programación para procesar grandes cantidades de datos de forma paralela y distribuida. Es útil para trabajos grandes y de larga duración que no se pueden gestionar en el ámbito de una sola solicitud, como los siguientes:

  • Analizar registros de aplicaciones
  • Agregación de datos relacionados de fuentes externas
  • Transformar datos de un formato a otro
  • Exportar datos para realizar análisis externos

MapReduce de App Engine es una biblioteca de código abierto mantenida por la comunidad que se basa en los servicios de App Engine, como Datastore y Task Queues. La biblioteca está disponible en GitHub en estas ubicaciones:

  • Proyecto de origen Java.

  • Proyecto de origen Python.

dónde encontrar documentación.

Para acceder a la documentación de MapReduce, haz clic en el icono de wiki de los proyectos de GitHub vinculados más arriba. Sin embargo, para tu comodidad, también puedes acceder a la documentación de MapReduce para Java y Python en el siguiente enlace: