探索大数据和人工智能1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。A首席数据官B.首席科学家C.首席执行官D.首席架构师2、整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB.HashC.CleanD.Loading3、在Spak的软件栈中,用于交互式查询的是A.SparkSQLB.MllibC.GraphXD.SparkStreaming4、在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处()理时间是什么关系?A数量越多处理时间越长B.数量越多处理时间越短C.数量越小处理时间越短D.没什么关系5、下列选项中,不是kafka适合的应用场景是?A.日志收集B.消息系统C.业务系统D.流式处理6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是A.结构化数据B.非结构化数据C.半结构化数据D.全结构化数据7、下列选项中,不是人工智能的算法中的学习方法的是?A.重复学习B.深度学习C.迁移学习D.对抗学习8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是A.机器性能B.语言歧义性C.知识依赖D.语境9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归10、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B.OneNETC.移娃D.大云11、HDFS中Namenodef的Metadata的作用是?A.描述数据的存储位置等属性B.存储数据C.调度数据D.12、电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问是用的什么技术实现的?A大数据技术B.互联网技术C.游戏技术D.影像技术13、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B.开源C.独立D.封闭14、以下不是非结构化数据的项是?A.图片B.音频C.数据库二维表数据D.视频15、以下数据单位换算错误的是?A.1KB=1024BB.1GB=1024MBC.1TB=1000GBD.1MB=1024KB16、下列选项中,不是Flume的特点的是?A.可靠性B.集中式架构C.可扩展性D.可管理性17、BP神经网络模型拓扑结构不包括A.输入层B.隐层C.翰出层D.显层18、以下哪个不是语音识别的范畴?A.语音听写B.语音台成C.语音转写D.语音唤醒19、以下哪个场景可以称为大数据场景?A.故宫游客人B.故宫门票收入C.美团APP的定位信息D.文章内容20、2011年5月是哪家全球知名咨询公司在《Bigdata:Thenextfrontierforinnovation,competitionandproductivity》研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔恩门B.麦肯锡C.扎克伯格D.乔图斯21、下列选项中,哪项是分布式文件存储系统?A.HDFSB.FlumeC.KafkaD.Zookeeper22、下列选项中,正确描述Flume对数据源的支持的是A.只能使用HDFS数据源B.可以配置数据源C.不能使用文件系统D.不能使用目录方式23、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B.表结构C.结果D.报表24、下列选项中,不是人工智能的算法中的学习方法的是A.重复学习B.深度学习C.迁移学习D.对抗学习25、语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B.语音播放C.语音识别D.语义理解26、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论級别的突破。而哪项技术将继续成为大数据智能分析的核心技术A机器学习B.智能物流C.脑科学D.智能终端27、以下哪个不属于大数据在电信行业的数据商业化方面的应用A.精准广告B.网络管理C.营销洞察D.大数据检测和决策28、RDD是由多个什么组成?A.partitionB.computerC.ActionD.Transformation29、下列选项中,不是大数据的一部分的是?A.海量计算B.大量数据管理C.数据分析D.单机计算30、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工看能称为()A.高人工智能B.低人工智能C.强人工智能D.弱人工智能31、mapreduce计算模型适用于哪种任务?A.多线程处理B.有关联的行处理C.批处理D.实时数据变化处理32、当前世界产生的数据总量的单位是?A.KBB.ZBC.GBD.TB33、IBM提出的大数据5V特征包括更大(Volume)、更快(Velocity)、更多Variety)、更值钱(Value)和()A.更有效B.更充分C.更真实(Veracity)D.更直观34、Spark.是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小A.内存B.硬盘C.磁带D.显卡35、下列选项中,不是kafka适合的应用场景是?A.日志收集B.消息系统C.业务系統D.流式处理36、数据采集的基本步骤(ETL)中不包括哪项?A.抽取转换B.加载C.计算D.37、以下哪种学习方法不属于人工智能算法?A.迁移学习B.对抗学习C.强化学习D.自由学习38、语音识别常用的应用有四个,下列不是常用应用的是?A聊天B.拨号C.导航D.设备控制39、下列选项中,哪项是由谷歌开发的人工能箅法框架?A.KafkaB.TensorflowC.CaffeD.Torch40、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高増长率和多样化的信息资产。A.海量B.少数C.小量D.结构化41、MPP是指A.大规模并行处理系统B.受限的分布式计算模型C.集群计算资源管理框架D.分布式计算编程框架42、Hadoop是()年诞生的?A.1985-1985B.1995-1996C.2005-2006D.2015-201643、在Spark的软件栈中,用于流计算的是?A.GraphXB.MllibC.SparkStreamingD.SparkSQL44、以下数据量可以称为大数据的是A.100MBB.100KBC.100PBD.100MB45、人工智能通过输入的图片,解析出图片的内容,这种技术叫什么?A.图片识别B.语音识别C.自动驾驶D.消费金融46、IBM的()是第一个在国际象棋上战胜人类人工智能计算机。A.AlphagoB.深蓝C.图灵机模型D.深度学习机器人47、下列选项中,不是人工智能的基础设施的是?A.CPU服务器B.GPU服务器C.专用芯片D.游戏显卡48、以下哪个不属于大数据在电信行业的应用?A数据商业化B.物流网络C.企业运营管理D.客户关系管理49、客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。A.大数据技术B.客户画像C.客户状态D.客户心情50、IBM提出的大数据5V特征包括()、更快(velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)A.更有效B.更大(Volume)C.更充分D.更直观51、Fume采用了三层架构,分别为agent,collector和()A.MapB.storageC.ShuffleD.Hash52、Hadoop2系列版本中默认的HDFS的block是多大?A32MBB.64MBC.128MBD.16MB53、工信部官网正式发布大数据产业“一三五“发展规划是在哪一年A.1987B.1997C.2007D.201754、BP神经网络的学习规则是?A.梯度上升法B.梯度下降法C.梯度提升法D.梯度曲线法55、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。A.精灵B.阿尔法蛋C.小度D.移娃56、对抗学习中两个网络互相竟争,一个负责生成样本,那么另一个负责做什么?A.判别样本B.计算样本C.统计样本D.生成样本57、以下应用没有使用你的地理位置信息的是?A.美团B.滴滴C.高德地图D.word58、下列选项中,不是大数据发展趋势的是A.大数据分析的革命性方法出现B.大数据与云计算将深度融合C.大数据一体机将陆续发布D.大数据未来可能会被淘汰59、在Spark的软件栈中,用于图计算的是A.SparkStreamingB.MllibC.GraphXD.SparkSQL60、HBASE的特点不包括哪些?A.面向行B.稀疏性C.多版本D.高可靠性61、总体来说,人工智能发展的未来趋势是?A.上升B.下降C.不动D.大幅度下降62、以下数据单位从小到大排列的顺序是?A.GB、B、KBB.B、KB、MBC.KB、ZB、PBD.B、MB、KB63、最初的大数据概念还比较模湖,只是隐约的知道像个性化推荐、搜索引擎之类的处理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?A.谷歌B.百度C.360D.bing64、下列选项中,哪个不是HBASE的特点?A面向行B.多版本C.扩展性D.稀疏性65、下列选项中,不是用于数据存储的技术是哪一个?A.MongoDBB.MySQLC.HDFSD.Java二、多选题1、在数据清洗的过程中,总共可以归为三个阶段,它们分别是?A.数据加工B.数据质量检查C.数据校对D.数据标准化2、HBASE的特点不包括哪些?A.面向行B.稠密性C.多版本D.高可靠性3、麦肯锡全球研究所对大数据的定义是—种规模大到在获取、存储、管理、分析方面大大超出了传統数据库软件工具能力范围的数据集合,具有以下哪些特征?A.海量的数据规模B.快速的数据流转C.多样的数据类型D.价值密度低4、以下哪两项是人工智能发展的标志性产品?A.深蓝alphagoC.智能门禁D.智能手机5、在非电信领域,大数据可被应用到的以下哪些方面A.公共安全B.无明显应用C.智能运输D.智能建筑6、大数据应用领域成就有哪些?A.金融B.互联网电子商务C.工业生产D.没有明显成就7、以下属于计算机视觉的研究方向的有?A.物体识别和检测B.语音导航C.视觉问答(看图说话)D.机器翻译8、传统的机器学习算法可以分为哪三类?A.监督学习B.无监督学习C.半监督学习D.强化学习9、在人工智能发展历程中有过多次低谷期,这些低谷期最主要的两项原因是什么?A.运算力不足B.人员不足C.技术瓶颈D.费用太高10、HBASE的应用场景有哪些?A.半结构化或非结构化数据B.记录非常稀疏C.结构化数据D.超大数据量11、使用有监督学习的问题可以被分为哪两类?A.回归问题B.抽样问题C.聚类问题D.分类问题12、下列选项属于人工智能的基本概念有A.机器学习B.深度学习C.BP神经网络D.卷积神经网络13、HBASE的应用场景有哪些?A.半结构化或非结构化数据B.记录非常稀疏C.结构化数据D.超大数据量14、下列选项中,是大数据发展趋势的是A.开源大数据商业化进一步深化B.打包的大数据行业分析应用开拓新市场C.大数据细分市场规模进一步增大D.大数据推动公司并购的规模和数量进一步提升15、人工智能关键技术框架主要包括哪两层?A.基础设施B.算法C.技术D.人员16、2010年12月,工信部发布的物联网十二五规划上,把信息处理技术作为4项关键技术创新工程之一被提出来,其中包括了哪些大数据的重要组成技术?A.海量数据存储B.数据挖掘C.图像视频智能分析D.python17、世界经济论坛以“大数据的回报与风险”主题发布了《全球信息技术报告(第13版)》,通