关于MapReduce说法正确的是()。
A.MapReduce设计的一个理念就是“数据向计算靠拢”
B.MapReduce应用程序必须要用Java编写
C.MapReduce的核心思想是“分而治之”
D.MapReduce程序必须使用Combiner
A.MapReduce设计的一个理念就是“数据向计算靠拢”
B.MapReduce应用程序必须要用Java编写
C.MapReduce的核心思想是“分而治之”
D.MapReduce程序必须使用Combiner
A.sqoop可以使用spark进行数据采集
B.sqoop默认采用的mapreduce进行数据采集
C.sqoop属于b/s架构
D.sqoop只能采集某个表的数据
A.MapReduce是一种分布式计算框架
B.MapReduce来源于学术论文
C.MapReduce程序只能用java语言编写
D.MapReduce隐藏了计算细节
A.MapReduce是一种计算框架
B.Google发表了MapReduce的学术论文
C.MapReduce只能用Java编写
D.MapReduce隐藏了并行计算的细节,方便使用
A.mapper调优主要目标之一是减少输出量
B.可以通过对输出进行压缩设置进行mapper调优
C.比较适合map的输出是数值型的,方便进行统计
D.尽量减少combiner,以降低对I/O的读写压力
A.HIVE构建于HDFS和MapReduce之上
B.HIVE使用类SQL的HQL语言作为查询接口
C.HIVE的并行执行主要依赖MapReduce来实现
D.HIVE不能运行在Spark上
A.基于Mapreduce,具有较大延迟
B.每个Hive表对应HDFS上的一个目录
C.不支持SQL能力,特有的查询语言
D.支持jdbc/odbc访问
A.Hive支持所有标准SQL语法
B.Hive底层采用的计算引擎是MapReduce
C.Hive提供的HQL语法,与传统SQL很类似
D.HiveServer可采用MySQL存储元数据信息
A.分为Map和Reduce两个阶段
B.Map阶段由一系列Map任务组成
C.Reduce阶段由一系列Reduce任务组成
D.Map阶段与Reduce阶段没有任何依赖关系
A.“摩尔定律”,CPU性能大约每隔12个月翻一番
B.“摩尔定律”逐渐失效后,人们开始借助于分布式并行编程来提高程序性能
C.分布式程序运行在大规模计算机集群上,可以并行执行大规模数据处理任务,从而获得海量的计算能力
D.谷歌公司最先提出了分布式并行编程模型MapReduce