MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",是它们的主要思想。 MapRed

*   第一章 微课-MapReduce详解/

  *   mapreduce工作机制详解/

    *   partitioner组件细节--reduce Task个数跟partition分区个数关系

    *   Combiner组件的用法及注意事项

    *   mapreduce工作机制详解--maptask端的机制

    *   mapreduce工作机制详解--Reducetask端的机制

    *   mapreduce工作机制详解--mapreduce工作机制详解----shuffle的含义

    *   maprecduce运算框架中用户可自定义的组件总结

  *   maptask并行度机制/

    *   maptask并行度机制--切片的原理

    *   maptask并行度机制--切片大小参数设置、debug跟踪

    *   maptask并行度机制优化经验之谈、reduceTask并行度决定

  *   mapreduce编程案例-倒排索引/

    *   mapreduce编程案例--倒排索引--需求分析

    *   mapreduce编程案例--倒排索引--步骤1代码

    *   mapreduce编程案例--倒排索引--步骤2代码

  *   mapreduce编程案例--共同好友/

    *   mapreduce编程案例--共同好友--需求思路

    *   mapreduce编程案例--共同好友--实现步骤1