精选最新2020年最新公需科目大数据完整考试题库(含答案)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2020年最新公需科目《大数据》考试题(含答案)一、选择题1.关于SecndaryNameNde哪项是正确的?a)它是NameNde的热备b)它对内存没有要求c)它的目的是帮助NameNde合并编辑日志,减少NameNde启动时间d)SecndaryNameNde应与NameNde部署到一个节点答案.C。二、多选题2.下列关于大数据的说法中,错误的是(AD)。A.大数据具有体量大.结构单一.时效性强的特征B.处理大数据需采用新型计算架构和智能算法等新技术C.大数据的应用注重相关分析而不是因果分析D.大数据的应用注重因果分析而不是相关分析E.大数据的目的在于发现新的知识与洞察并进行科学决策3.云计算是信息技术发展和集成应用到新阶段产生的新技术。正确错误4.网球比赛,与其他体育项目一样,涉及大量数据。正确错误5.信息社会经历的发展阶段包括()。BCD分A.云计算时代B.大数据时代C.计算机时代D.互联网时代6.大数据的思维会把原来销售的概念变成服务的概念。对7.云计算的特点包括以下哪些方面?■A.服务可计算■B.高性价比■C.服务可租用D.低使用度28.下列选项中,属于贵州发展大数据的先天优势的是()。■A.空气清新■B.远离地震带■C.气候凉爽■D.电力资源充沛8.宁家骏委员指出,20世纪下半个世纪直至现在,是信息技术时代。(判断题1分)1分得分.■正确错误42.2010年“中央1号文件”指出.要推进农村信息化。(判断题1分)■正确错误43.大数据仅仅是指数据的体量大。(判断题1分)正确■错误9.20世纪中后期至今的媒介革命,以()的出现为标志。■A.互联网B.自动化■C.计算机■D.数字化10.根据涂子沛先生所讲,因为数据的内涵发生了改变,计算的内涵也发生了改变。对11.由于有了现代信息技术的支撑,研制一个新型号的航天器,周期缩减到()以内。A.6个月B.18个月C.12个月D.24个月三、论述题12.政府2.0.政府3.0,与政府以后的治理改革和服务型政府建设的目标是完全不一致的。正确错误√13.对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。(F)(判断题)是否14.下列关于数据生命周期管理的核心认识中,正确的是(ABC)。A.数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段B.在不同的数据存在阶段,数据的价值是不同的C.根据数据价值的不同应该对数据采取不同的管理策略D.数据生命周期管理旨在产生效益的同时,降低生产成本E.数据生命周期管理最终关注的是社会效益15.20世纪中后期至今的媒介革命,以(BCD)的出现为标志。(多选题3A.自动化;B.计算机;C.数字化;D.互联网;16.以下说法正确的有哪些?AB(多选题3分)得分.0分A.机器的智能方式是结果导向的B.机器的智能方式和人的智能不同C.机器的智能方式和人是完全一样的D.机器产生智能的方式是通过数据.数学模型17.“(A)大数据交易所”2015年4月14日正式运营,目前,交易所已有包括京东.华为.阿里巴巴等超过300家会员企业,交易总金额突破6000万元。A.贵阳B.遵义C.毕节D.安顺18.宁家骏委员指出,我国民生领域信息化服务水平显著提升。分.1分正确1错误得19.一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性.逻辑上的一体性.性能上的可扩展性等特点。(T)(判断题)是否20.大数据的起源是(C)。A.金融B.电信C.互联网D.公共管理21.在新加坡政府发展大数据行动中,政府侧重于做好数据分析和服务,不承担数据提供服务。(F)是否22.数据清洗的方法不包括(D)。A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理23.请画出云计算的三层服务模型?答.一般而言,云计算架构可以用三层SPI模型来表述。1.基础设施即服务(IaaS,InfrastructrueasaService)这种把主机集中管理,以市场机制通过虚拟化层对外提供服务,用按使用量收费的盈利模式,形成了云计算的基础层。这就是基础设施即服务(IaaS,InfrastructrueasaService),构成了云计算的基础层。2.平台即服务(PaaS,PlatfrmasaService)平台即服务(PaaS)是指把一个完整的应用程序运行平台作为一种服务提供给客户。在这种服务模式中,客户不需要购买底层硬件和平台软件,只需要利用PaaS平台,就能够创建.测试和部署应用程序。3.软件即服务(SaaS,SftwareasaService)在其概念可以这样来定义.把软件部署为托管服务,用户不需要购买软件,可以通过网络访问所需要的服务,或者把各种服务综合成自己的需要,而客户按照使用量付费。SaaS的出现彻底颠覆了传统软件的运营模式。它不仅仅从价格上,交付模式上,实施风险上带来了明显改观。在云计算上,SaaS有了更好的发展空间。而云计算的推出,给SaaS提供了更好的生态环境。这就形成了云计算的第三层.软件即服务(SaaS,SftwareasaService)。这三个层结合起来,就形成了典型的云计算的SPI模型。可以预期,在这个模型上,大量的创新企业可以获得更好的生存空间。24.大数据的最显著特征是(A)。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高25.梅特卡尔夫定律主要是描述信息网络,指出网络的价值在于网络的互联,联网的接点数与其价值呈现()的方式,联网越多,系统的价值越大。(单选题1分)A.对数B.指数√C.正比D.反比26.请分析,以下哪些是高级持续性威胁(APT)的特点?(ABCD)(多选题3分)分A.有目的.有针对性全程人为参与的攻击B.不易被发现C.此类威胁,攻击者通常长期潜伏D.一般都有特殊目的(盗号.骗钱财.窃取保密文档等)27.CF(协同过滤)的原理?协同过滤的主要目标.由于网络信息量的增多,用户往往被淹没在信息的海洋里,很难很轻易的找到自己感兴趣的tpic。协同过滤就是为了把用户最可能感兴趣的信息推送给用户。协同过滤的方法.mdel-base,user-base,item-base,cntent-base。1.user-based.搜集用户prfile。对于一个activeuser,找到与其比较接近(或者相似)的几个neighbur。使用这些neibur对activeuser的interest进行预测,把那些潜在的interest推荐给activeuser。3.item-base:与user-based相对应。协同过滤推荐根据用户对相似项的评分预测该用户对目标项的评分,它基于这样一个假设.如果大部分用户对一些项的评分比较相似,则当前用户对这些项的评分也比较相似。对每个item寻找几个neighbur。例如如果itemA与itemB是一个neighburpair,对于一个activeuser,如果其对A评价很高,或者有很高的兴趣,那么它极可能对B感兴趣,这样B就是一个潜在的interest.4.cntent-based:根据item的内容与用户历史兴趣度进行分析关联,它的一个前提假设就是如果一个用户在过去一段时间对某item有较高的评价,那么在未来也会保持这种interest。这样就可以根据item之间的内容接近程度进行推荐。它有很大的缺陷,首先没有结合用户反馈,虽然一个item具有很高的可推荐性,但是如果大家都对其评价较差,那么这也许是一个不好的推荐item;其次就是其对item内容进行分析也只能是一个方面,不能全面深刻的描述一个item;再一个就是推荐的内容有限;当系统仅仅根据用户资料或项目描述来进行推荐的时候,用户被限制在只能得到与以往熟悉的内容相类似的项目。这样不利于挖掘用户潜在的兴趣。28.2008年以后,第()信息传输技术.传输2亿路信号。(单选题1分)A.三代B.一代C.二代D.四代√29.通过电脑病毒甚至可以对核电站.水电站进行攻击导致其无法正常运转,对这一说法你认为以下哪个选项是准确的?(A)A.绝对可行,已有在现实中实际发生的案例B.不认为能做到,危言耸听C.病毒只能对电脑攻击,无法对物理环境造成影响D.理论上可行,但没有实际发生过30.20世纪中后期至今的媒介革命,以(BCD)的出现为标志。(多选题3分)分A.自动化B.计算机C.数字化D.互联网31.2009年,甲型H1N1流感在全球爆发,谷歌(5000万条历史记录,做了4.5亿个不同的数学模型)测算出的数据与官方最后的数据相关性非常接近,达到了(A)。(单选题1分)A.97%B.77%C.87%D.67%32.网络空间是人类利用信息设施构造.实现信息交互.进而影响人类思想和行为的虚实结合的空间。√分正确错误33.国务院办公厅是在哪一年印发的《关于促进和规范健康医疗大数据应用发展的指导意见》?(单选题1分)A.2014年B.2015年C.2013年D.2016年√34.由于历史的原因,我国医院的信息化建设层次不齐.水平不一。分√正确错误35.大数据仅仅是指数据的体量大。正确错误1分36.澳大利亚政府视大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府(F)是否37.下列论据中,能够支撑“大数据无所不能”的观点的是(A)A.互联网金融打破了传统的观念和行为B。大数据存在泡沫C。大数据具有非常高的成本D。个人隐私泄露与信息安全担忧38.信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。(F)是否39.可以对大数据进行深度分析的平台工具是(C)A.传统的机器学习和数据分析肛具B。第二代机器学习工具C。第二代机器学习工具D。未来机器学习工具40.2009年,甲型H1N1流感在全球爆发,谷歌(5000万条历史记录,做了4.5亿个不同的数学模型)测算出的数据与官方最后的数据相关性非常接近,达到了()。(单选题1分)A.77%B.97%√C.67%D.87%41.全球信息化发展六大趋势包括(ABCD)。(多选题3分)分A.全球制造业互联网化进程加速B.全球信息化发展向智慧化阶段迈进C.全球进入移动互联网全面爆发时期D.信息技术对促进创新的作用日益凸显ABCD36.美国大的猎头公司储备人才考虑的因素包括()。(多选题3分)分A.经历B.智商C.价值观D.情商ABCD37.关于大数据的内涵,以下理解正确的是(?)。(多选题3分)得分.0分A.大数据还是一种思维方式和新的管理.治理路径B.大数据里面蕴藏着大知识.大智慧.大价值和大发展C.大数据在不同领域,又有不同的状况D.大数据就是很大的数据42.请简述Map-Reduce算法的原理?Map-Reduce的目标是在面对节点失效的情况时能够保证大量的文件和数据依然可用。初始化时数据被分割成许多分块的小数据,这些数据都是以key,value的形式存储。用户程序会分配一个Maser进程和许多wrker进程。任务开始时,Maser将用户程序的工作分成两种类型的任务(map任务和reduce任务),并将这些任务分配给相应的工人(wrkers)。Maser的责任如下.给map工人和reduce工人分配相应的任务,检测是否有工人进程死掉,将Map任务处理后的结果通知给Reduce任务。得到Maser的Map工作任务的指令后,Map工人开始工作。Map工人从input中获取分块的数据,并通过其中数据存储的方式对数据进行处理,并将处理的中间结果(key,value形成的链表)存放在本地磁盘中。得到Maser的有关Map处理结果的通知后,Reduce任务开始工作。Reduce工人把每个map工人的本地磁盘中的内容进行整合,形成有序的最终结果,并将结果写入到输出文件中。假如一个工人进程失败了,该工人的任务就被分配给其他的工人进程。如果一个Maser进程失败了,那么整个Map-Reduce任务就会终止。1.输入文件分成M块,每块大概16M~64MB(可以通过参数决定),接着在集群的机器上执行分派处理程序。2.M个Ma

1 / 12
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功