1.下列选项中无法通过大数据技术实现的是?(A)[单选题]A.商业模式发现B.信用评估C.商品推荐D.运营分析2.FusionInsightManager的主要功能有以下哪些?(BCD)[多选题]A.数据集成B.系统管理C.安全管理D.服务治理3.假设每个用户最低资源保障设置为yarn,scheduler,capacity,root,QueueA.minimum-user-limit-percent=24。则以下说法错误的是?(D)[单选题]A.第3个用户提交任务时,每个用户最多获得33.33%的资源B.第2个用户提交任务时,每个用户最多获得50%的资源C.第4个用户提交任务时,每个用户最多获得25%的资源D.第5个用户提交任务时,每个用户最多获得20%的资源4.华为大数据解决方案中平台架构包括以下哪些组成部分?(ABD)[多选题]A.Hadoop层B.FusioInghtManagerC.GaussDB200D.DataFram5.Spark自带的资源管理框架是?(A)[单选题]A.StandaloneB.MesosC.YARND.Docker6.关于RDD,下列说法错误的是?(B)[单选题]A.RDD具有血统机制(Lineage)B.RDD默认存储在磁盘C.RDD是一个只读的,可分区的分布式数据集D.RDD是Spark对基础数据的抽象7.关于SparkSQL&Hive区别与联系,下列说法正确的是?(BCD)[多选题]A.SparkSQL依赖Hive的元数据B.SparkSQL的执行引擎为Sparkcore,Hive默认执行引擎为MapReduceC.SparkSQL不可以使用Hive的自定义函数D.SparkSQL兼容绝大部分Hive的语法和函数8.在FusionInsight集群中,Spark主要与以下哪些组件进行交互?(ABCD)[多选题]A.HDFSB.YARNC.HiveD.ZooKeeper9.关于Hive在FusionInsightHD中的架构描述错误的是?(A)[单选题]A.只要有一个HiveServer不可用,整个Hive集群便不可用B.MotaStore用于提供元数据服务,依赖于DBServiceC.在同一时间点,HiveServer只要一个处于Active状态,另一个则处于Standby状态D.HiveServer负责接收客户端请求.解析.执行HQL命令并返回查询结果10.通常情况下,Hive以文本文件存储的表会以回车作为其行分隔符,在华为FusionInsightHive中,可以指定表数据的输入和输出格式处理。(A)[单选题]A.TRUEB.FALSE11.以下关于HBase中HMaster的功能描述哪些是正确的?(ABCD)[多选题]A.Region负载均衡,Region分裂以及分裂后的Region分配B.负责建表/修改表/删除表C.负责RegionServer的负载均衡D.RegionServer失效后的Region迁移12.Nimbus在Streaming架构中的功能包括?(ABD)[多选题]A.监控任务执行状态B.任务调度C.启动/关闭工作进程D.资源分配13.Topology在任务完成后会自动结束运行。(B)[单选题]A.TRUEB.FALSE14.下面关于flink窗口的描述错误的是(AC)[多选题]A.滚动窗口在时间上是重叠的B.滚动窗口在时间上是不重叠的C.滑动动窗口之间时间点不存在重叠D.滑动窗口之间时间点存在重叠15.在FusionInsightManager界面中,对Loader的操作不包括下列哪个选项?(A)[单选题]A.切换Loader主备节点B.启动Loader实例C.配置Loader参数D.查看Loader服务状态16.创建Loader作业中,可以在以下哪个步骤中设置过滤器类型?(B)[单选题]A.输入设置B.转换C.基本信息D.输出17.以下哪些数据源可以通过Loader实现与FusionInghtHD的数据交换?(ABCD)[多选题]A.NoSQLB.FTPServerC.SFTPServerD.MySQL18.Kafka日志的清理方式有两种:delete和compact。默认值是delete。(A)[单选题]A.TRUEB.FALSE19.kafka-clustermirroring工具可以实现以下那些功能?(A)[单选题]A.kafka集群数据同步方案B.kafka单集群内数据备份C.kafka单集群内数据恢复D.以全部不对20.fusioninsightHD产品中,一个典型的kafka集群包含若干个producer若干个consummer和一个zookeeper集群?(B)[单选题]A.trueB.false21.ZKFC进程部署在hdfs中的以下那个节点上?(AB)[多选题]A.activenamenodeB.standbynamenodeC.datanodeD.以上全部不对22.以下关于KafkaPartition偏移量的描述不正确的是?(D)[单选题]A.每条消息在文件中的位置称为offset(偏移量)B.消费者通过(offset.partition.topic)跟踪记录C.唯一标记一条消息D.Offset是一个String型字符串23.Channel的作用类似队列,用于临时缓存进来的数据,当Sink成功地将数据发送到下一跳的Channel或最终目的,数据会从Channel移除(A)[单选题]A.TRUEB.FALSE24.Zookeeper中的数据节点znode分为哪几种类型?(BD)[多选题]A.semi-persistentB.ephemeralC.temporaryD.persistent25.HDFS联邦环境下,NameSpace(命名空间)包含以下哪些内容?(ABC)[多选题]A.目录B.文件C.块D.以上全不正确26.HDFS存储数据时,关键数据根据实际业务需要保存在具有高度可靠性的节点中,通过修改DataNode的存储策略,系统可以将数据强制保存在指定的节点组中。(A)[单选题]A.TRUEB.FALSE27.RDD有Transformation和Action算子,下列属于Action算子的是?(B)[单选题]A.mapB.saveAsTextFileC.FilterD.reduceByKey28.SparkonYarn-client适合用于生产环境是因为可以更快的看到APP的输出。(B)[单选题]A.TRUEB.FALSE29.以下关于HiveSQL基本操作描述正确的是?(D)[单选题]A.创建外部表必须要指定location信息B.创建外部表使用external关键字,创建普通表需要指定internal关键字C.加载数据到Hive时源数据必须是HDFS的一个路径D.创建表时可以指定列分割符30.在Streaming中,消息可靠性级别中精确一次是通过ACK机制来实现的。(B)[单选题]A.TRUEB.FALSE31.Flume适用于以下哪些场景的数据收集?(ABC)[多选题]A.Thrift,Avro,Syslog,Kafka等数据源上收集数据B.本地文件数据采集C.应用系统产生的日志采集D.大量数据的实时数据采集32.在Zookeeper和Yarn的协同工作中,当ActiveResourceManager产生故障时,StandbyResourceManager会从以下哪些目录中获取Application相关信息?(B)[单选题]A.metastoreB.StatestoreC.StoreageD.Warehouse33.ZooKeeper所有节点都可以处理读请求。(A)[单选题]A.TRUEB.FALSE34.HDFS的副本放置策略中,同一机架不同的服务器之间的距离是(B)[单选题]A.3B.2C.1D.435.下列哪些措施是为了保障数据的完整性(ABCD)[多选题]A.元数据可靠性保证B.重建失效数据盘的副本数据C.安全模式D.集群数据均衡36.Zookeeper的Scheme认证方式不包括以下哪项?(B)[单选题]A.digestB.saslC.authD.world37.MapReduce过程中,以下属于Shuffle机制的是?(AD)[多选题]A.CopyB.PartitionC.CombineD.Sort/Merge38.FusionInsightManager可以对哪些项目进行健康检查?(BC)[多选题]A.角色B.主机C.服务D.实例39.FusionInsightManager与外部管理平台对接时,支持哪些接口?(BCD)[多选题]A.VPNB.SyslogC.FTPD.SNMP40.下列选项中适合MapReduce的场景有?(D)[单选题]A.实时交互计算B.迭代计算C.流式计算D.离线计算41.以下关于FusionInsight中CarbonData说法正确的有?(ABCD)[多选题]A.使用Carbon的目的是对大数据即席查询提供超快速响应。B.Carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少60%-80%数据存储空间,大大节省硬件存储成本。C.Carbon是一种新型的ApacheHadoop本地文件格式,使用先进的列式存储.索引.压缩和编码技术,以提高计算效率,有助于加速超过PB数量级的数据查询,可用于更换的交互查询。D.Carbon也是一种将数据源与Spark集成的高性能分析引擎。42.HDFS联邦机制下,各NameNode间元数据是不共享的。(A)[单选题]A.TRUEB.FALSE43.ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请和领取资源。(A)[单选题]A.TRUEB.FALSE44.在YARN的任务调度中,一旦ApplicationMaster申请到资源后,使与对应的ResourceManager通信,要求它启动任务(B)[单选题]A.TRUEB.FALSE45.如图所示,下列哪些选项属于宽依赖(AD)[多选题]A.groupby:A-BB.map:C-DC.union:D&E-FD.join:B&F-G46.HFS的出现解决了需要在HDFS中存储大量的小文件(10MB以下)。同时也要存储一些大文件(10MB以上)的混合的场景(B)[单选题]A.TRUEB.FALSE47.下列哪个命令是从HDFS下载目录/文件到本地的?(C)[单选题]A.dfs-putB.dfs-catC.dfs-getD.dfs-mkdir48.以下选项中,属于HDFS架构关键特性的是?(ABCD)[多选题]A.HA高可靠性B.健壮机制C.元数据持久化机制D.多方式访问机制49.HBase的主HMaster是如何选举的?(C)[单选题]A.由RegionServer进行裁决B.HMaster为双主模式,不需要进行裁决C.通过ZooKeeper进行裁决D.随机选举50.关于Hive与Hadoop其他组件的关系。以下描述错误的是?(D)[单选题]A.Hive最终将数据存储在HDFS中B.Hive是Hadoop平台的数据仓库工具C.HQL可以通过MapReduce执行任务D.Hive对HBase有强依赖51.Hive不支持超时重试机制。(B)[单选题]A.TRUEB.FALSE52.FusionInsight中,HiveServer将用户提交的HQL语句进行编译,解析成对应的Yarn任务.Spark任务或者HDFS操作,从而完成数据转换,分析。(A)[单选题]A.trueB.False53.HBase的Region是由哪个服务进程来管理的?(A)[单选题]A.HRegionServerB.ZooKeeperC.HMasterD.DataNode54.Streaming的处理节点Bolt中,可以完成以下哪些操作?(ABCD)[多选题]A.连接运算B.过滤(Filter)C.连接数据库D.业务处理55.Flume传输的可靠性是指Flume在