A.用来把一组键值对映射成一组新的键值对,以此完成将来自数据源的记录进行分配
B.保证所有映射的键值对中的每一个共享相同的键组
C.将所有具有相关给定outputkey的中间值进行组合
D.对中间值规约结果进行递归组合直至得到唯一输出
A.Hadoop是一个能够对大量数据进行分布式处理的软件框架
B.作为并行分布式计算平台,Hadoop采用分布式存储和分布式处理两大核心技术,能够高效地处理PB级数据
C.Hadoop只支持Java编程语言
D.Hadoop可以高效稳定地运行在廉价的计算机集群上,可以扩展到数以千计的计算机节点上
A.一个reduce的输入数据可能来自于多个map的输出
B.一个MR处理可以不包括任何map
C.一个MR处理可以不包括任何reduce
D.一个map的输出结果可能会被分配到多个reduce上去
A.“摩尔定律”,CPU性能大约每隔12个月翻一番
B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D.谷歌公司最先提出了分布式并行编程模型MapReduce
A.MapReduce是处理大量半结构化数据集合的编程模型
B.MapReduce和Hadoop是相互独立的
C.MapReduce使用一种集合语言执行查询
D.MapReduce是Map和Reduce的两部分用户程序组成
A.是一个分布式的、面向列的开源数据库
B.是一种编程模型,用于大规模数据集(大于1TB)的并行运算
C.是Hadoop集群当中的资源管理系统模块
D.将要储存的文件分散在不同的硬盘上,并记录他们的位置
A.基于HDFS的应用应该使用WORM的数据读写模型编
B.HDFS不适合存储大量小的文件
C.HDFS不适合有低延迟数据访问要求的业务
D.HDFS适合流式数据的访问
A.适合读数据加速场景
B.存在写放大的问题,所以不适合大量写场景
C.因为是讲随机转换为顺序写,所以对写操作友好
D.由内节点和叶子节点两类节点构成