下列关于MapReduce说法错误的是()
A.MapReduce是一种计算框架
B.Google发表了MapReduce的学术论文
C.MapReduce只能用Java编写
D.MapReduce隐藏了并行计算的细节,方便使用
A.MapReduce是一种计算框架
B.Google发表了MapReduce的学术论文
C.MapReduce只能用Java编写
D.MapReduce隐藏了并行计算的细节,方便使用
A.MapReduce是一种分布式计算框架
B.MapReduce来源于学术论文
C.MapReduce程序只能用java语言编写
D.MapReduce隐藏了计算细节
A.MapReduce程序只能用Java写
B.MapReduce是一种计算框架
C.MapReduce来源于google的学术论文
D.MapReduce隐藏了并行计算的细节,方便使用
A.Hive支持所有标准SQL语法
B.Hive底层采用的计算引擎是MapReduce
C.Hive提供的HQL语法,与传统SQL很类似
D.HiveServer可采用MySQL存储元数据信息
A.MapReduce采用“ 分而治之”策略
B.MapReduce设计的一个理念就是“ 计算向数据靠拢”
C.MapReduce框架采用了Master/Slave架构
D.MapReduce应用程序只能用Java来写
A.分为Map和Reduce两个阶段
B.Map阶段由一系列Map任务组成
C.Reduce阶段由一系列Reduce任务组成
D.Map阶段与Reduce阶段没有任何依赖关系
A.“摩尔定律”,CPU性能大约每隔12个月翻一番
B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D.谷歌公司最先提出了分布式并行编程模型MapReduce
A.对大数据采取分而治之的思想
B.构建抽象模型:Map和Reduce函数
C.对计算的支持强大,但对文件的支持较弱
D.上升到构架:并行自动化并隐藏低层细节
A.HIVE构建于HDFS和MapReduce之上
B.HIVE使用类SQL的HQL语言作为查询接口
C.HIVE的并行执行主要依赖MapReduce来实现
D.HIVE不能运行在Spark上
A.基于Mapreduce,具有较大延迟
B.每个Hive表对应HDFS上的一个目录
C.不支持SQL能力,特有的查询语言
D.支持jdbc/odbc访问
A.Hive最终将数据存储在HDFS中
B.Hive是Hadoop平台的数据仓库工具
C.HQL可以通过MapReduce执行任务
D.Hive对HBase有强依赖
A.mapper调优主要目标之一是减少输出量
B.可以通过对输出进行压缩设置进行mapper调优
C.比较适合map的输出是数值型的,方便进行统计
D.尽量减少combiner,以降低对I/O的读写压力