MapReduce untuk App Engine

Penting: Google telah mentransisikan dukungan dan pengembangan lebih lanjut dari library MapReduce Java dan Python ke komunitas open source. Kode sumber dan dokumentasi tersedia di GitHub

MapReduce adalah model pemrograman untuk memproses data dalam jumlah besar secara paralel dan terdistribusi. Model ini berguna untuk tugas besar dan berlangsung lama yang tidak dapat ditangani dalam cakupan permintaan tunggal, seperti:

  • Menganalisis log aplikasi
  • Menggabungkan data terkait dari sumber eksternal
  • Mengubah data dari satu format ke format lainnya
  • Mengekspor data untuk analisis eksternal

MapReduce App Engine adalah library open source yang dikelola komunitas dan dibangun berdasarkan layanan App Engine, termasuk Datastore dan Task Queue. Library ini tersedia di GitHub di lokasi berikut:

Tempat menemukan dokumentasi

Dokumentasi untuk MapReduce tersedia dengan mengklik ikon wiki untuk project GitHub dalam link di atas. Namun, untuk memudahkan, Anda juga dapat mengakses dokumentasi untuk MapReduce Java dan Python di link berikut: