|
【时间】:2018年3月23日上午10:00-12:00
【地点】:计算机学院东六E座学术报告厅
【报告人】:周勇
【报告摘要】:
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。MapReduce采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各个节点的中间结果,得到最终结果。在分布式计算中,MapReduce框架负责处理了并行编程中分布式存储、工作调度、负载均衡、容错均衡、容错处理以及网络通信等复杂问题,把处理过程高度抽象为两个函数:map和reduce,map负责把任务分解成多个任务,reduce负责把分解后多任务处理的结果汇总起来。
欢迎广大师生前来参加!