基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有()。
A.MR
B.Spark
C.HDFS
D.Hbase
A.MR
B.Spark
C.HDFS
D.Hbase
A.Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储
B.Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统
C.HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现
D.HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现
A.Hadoop是一个由Apache基金会开发的分布式系统开源架构
B.Hadoop的初始设计思想来源于Google发布的学术论文
C.Hadoop在当前衍生的一系列优秀的开源项目,包括Hbase,Hive等
D.Hadoop的两个核心部分是HDFS和MapReduce计算框架
A.Hive是基于Hadoop的数据仓库工具
B.Hive可以将结构化的数据文件映射为一张数据库表
C.最初,Hive由Google开源,用于解决海量结构化日志数据统计问题
D.Hive的主要应用场景是离线分析
A.Hive是基于Hadoop的一个数据仓库,由Facebook开源,最初是用于解决海量结构化的日志数据统计问题
B.Hive定义了一种类似SQL的查询语言HQ,将SQL转化为MapRuduce任务,在Hadoop上执行
C.目前Hive支持MapRuduce、Tez的计算模型
D.Hive的表更新采用的是插入的方式
A.大数据平台中,B域、M域、O域及DPI信令等各类数据集中存储,一旦发生安全事件则可涉及海量客户敏感信息及公司数据资产。
B.大数据多部署在云环境中,由于存储、计算的多层面虚拟化,带来了数据管理权与所有权分离,网络边界模糊等新问题
C.大数据平台多使用Hadoop、Hive、第三方组件等开源软件,这些软件设计初衷是为了高效数据处理,系统性安全功能相对缺乏,安全防护能力远远滞后业务发展,存在安全漏洞
D.敏感数据跨部门、跨系统留存,任一单位或系统安全防护措施不当,均可能发生敏感数据泄漏,造成“一点突破、全网皆失”的严重后果。
A.分布的元数据管理,支持3~4000个节点的线性扩展。
B.自研分布式文件系统OceanStorDFS支持海量非结构化数据存储,实现全局统一命名空间。
C.提供对象存储服务,兼容AmazonS3接口、兼容OpenStackSwift接口。
D.支持对接由开源Hadoop组件封装而来的FusionInsightHadoop/ClouderaHadoop,让用户轻松构建企业级大数据分析平台。
A.Hadoop的核心是HDFS和Map Reduce
B.Hadoop是基于Java语言开发的,只支持Java语言编程
C.Hadoop2.0增加了Name NodeHA和Wire-compatibility两个重大特性
D.Hadoop Map Reduce是针对谷歌Map Reduce的开源实现,通常用于大规模数据集的并行计算