(一)大数据基础(二)人工智能(三)大数据技术介绍1、MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?OA.数量越多处理时间越长B.数量越多处理时间越短OC.数星越小处理时间越短0D.没什么关系2、下列选项中,不是kafka适合的应用场景是?()A.日志收集B.消息系统C.业务系统0D.流式处理1、大数据特征有几种(不包括IBM提出的新特征)?OA.1OB.2OC.3D.42、目前电信运营商大数据发展仍处在什么阶段?A.探索OB.应用OC.成熟OD.扩展3.下列选项中,不是大数据的-部分的是?OA.海量计算:OB.大量数据管理OC.数据分析◎D.单机计算1、数据真实性具备哪两种特质?VA.准确性口B.不确定性口C.可信赖度口D.杂乱性2.电信行业的企业运营:理中。经营分析和市场监测中。我们可以通过数据分析对业务和市场经营状况进行总结和分析。主要分为哪些种类?A日报口B.周报C月报口0.专暨分析1。EMCWorld是哪年在拉斯维加聯著名的威尼斯人店开畔的?口A2009。B.2011◎C.2012◎D.20102.随着闭源软件在数据分析领域的地盘不断缩小,老牌T厂高正在改变商业模式,向着什么靠拢?OA团源◎B.开源OC开放OD.封闭3.下列造项中正情说明价已度低的是?。A.100万数据中有50万有效数据。B.1TB数据中有1KB有效数据。C.100万0数据中南100万有效数据◎D.10万条数据中有1万有效数据1.语音识别产品体系有四部分,下列哪项不是体系之-?◎A.语音合成◎B.请音擴放◎C.语音识剔0D.適义理解2.IBM的深蓝在1997年的决定胜负的第六个回台中,用了多少步迫使和斯帕罗夫投子认输OA.15◎B.22◎C.30◎D.283.BP神经网络的学习规则是?OA梯度上升法。B.梯度下降法。C梯度提升法。D.梯度曲线法、下列选项中,寒项是分布式文件存储系统?oAHDFSOBFlume0cKatla◎D.Zokeepe2.mapreduceit算模型近用于哪种任务?()A.多线程处理◎B.有关联的行处理。C批处理◎D.实时数据变化处理Sparke9Client端,在本地写好spark程序脂,通过sparksubmit命令提交到什么地方执行?)AHDFS◎B.HBASE。C.Spark偶群OD.Zookeeper1、美国软件公司Splunk是第一家上市的大数据处理公司,它是在哪一年上市的?C)A.2009OB.2011●C.2012OD.20102、以下不是大数据特征的是?()A.数据体量大OB.数据种类多◎C.价值密度高(.)D.处理速度快3、电信行业的客户关系管理中,客户生命周期管理包括几个阶段?OA.1OB.3C.5OD.71.2014年4月,世界经济论坛以“大数露的网报与风险”主题发布了《全球值息技术报告(第13版)》,报告认为,在来来几年中针对各种信息通信技术的政策甚至会显得更加重要。而在接下来将对哪些议题展开积极讨论?口A.数据保密口B.网络管制口C用户行为口D.数据量2.世界经济论坛以“大数据的回报与风险”主题发布了(《全球信息技术报告(第13)),通过该报告,各国政府逐渐认识到大数据在赛些方面有重大意义?VA推动经济发展B.改善公共服务C增进人民播祉MD.保障国家安全1.人工智能经过60多年的螺旋上块式发展,在移动互联网,大数据、传愚网络、半导体技术等技术飞速发展的引领下,新代人工智能呈现出“深度学习、跨界融合,人机协同,群看开放和自主看能的新特点”,请河新代人工智能主要是甚于什么的?0A.大数据基础0B.运算效率0C设备降价0D.人员广泛2.下列选项中,不是自然语言处理的解决方法的是?OA.规则方法OB.统计方法◎C.递归方法OD.深度学习方法3、IBM的深蓝在1997年的决定胜负的第六个回合中,用了多少步迫使卡斯帕罗夫投子认输OA.15◎B.22OC.30OD.281、在智能投顾领域,人工智能可以结合投资者的哪些方面进行运算?口A.财务状况VB.风险偏好口C.理财目标口D.身体状况2、目前主流研究仍然集中于弱人工智能发展阶段,那么在下列哪些方面取得显著进步?VA.语音识别B.图像处理C]C.探索太空D.机謂翻译2.因为我们SQL需要更轻量,更激进地获取资源,更专门地对SQL做优化,而且不需要那么多容播性保证,所以Impala,Presto,Dll诞生了(当然还有无数非著名的交旦SQL引事,就不一列举了),它们的核心理念是:MapReduce3l摩太慢!那么为什么说MapReduce引I摩太慢呢?MA大通用B.太强壮口C.太保守口D.太快1、下列选项中,不是人工智能的基础设施的是?()A.CPU服务器()B.GPU服务器OC.专用芯片D.专用显卡2.卷积神经网络主要用于圆像处理特征。多层神经网络,将三种结构思想结合,请问下列选项中,哪个不是三种结构思想之一?◎A.局部感受野OB.权值共享OC.亚采样◎D.全局监控3、人工智能在医疗健康领域应用广泛,下列不是主要应用场景的是?0A.虚拟助理OB.医学影像C.切机器OD.营养学1、目前主流研究仍然集中于弱人工智能发展阶段,那么在下列哪些方面取得显著进步?A.语音识别口B.图像处理口C.探索太空口D.机器翻译2.监督学习的回归方法包括:A.线性回归B.逻辑回归C.多项式回归C]D.单一回归1、下列选项中,哪项是分布式文件存储系统?A.HDFSB.FlumeC.KafkaC)D.Zookeeper2、mapreduce计算模型适用于哪种任务?OA.多线程处理0B.有关联的行处理C.批处理OD.实时数据变化处理3、RDD是由多个什么组成?A.partition0B.computerC.ActionOD.Transformation1.MapReduce本质上只是个简单模型,使用起来很是繁琐,那么下列哪些技术让MapReduce的使用简单化?C]A.YARN口B.Oozie口C.HiveVD.Presto2、Hive是不适合用于实时要求较高的应用场景,有哪些原因?VA.计算速度慢口B.延迟大口C.计算速度快口D.延迟低1、下列选项中,正确描述Flume对数据源的支持的是?OA.只能使用HDFS数据源●B.可以配置数据源OC.不能使用文件系统◎D.不能使用目录方式2、Spark是在哪-年开源的?OA.2011◎B.2010OC.2009;0D.2012:3.SparkStreaming是什么软件栈中的流计算?A.SparkOB.StormOC.HadoopOD.Flume1、HDFS在哪些场景中表现很差?口A大量小文件口B.随机读取口C.修改文件口D.存储和管理PB级别数据1、通过地理位置信息可以分析出哪些信息?口A.颜值VB.家庭住址C.工作地址口D.体重2.电信行业的企业增营理中,经营分析和市场监测中,我们可以通过数据分析对业务和市场经营状况进行总话和分析,主要分为事些种美?A.日报B、周报C月报1D.专题分析1.人工智能在交通领域,有利的点是?口!A调整红蝟灯问隔B.缩蛆车辆嚀待时间VC提升通行率VD:帮助交警处理事故2.人工智能可以做到的事情有:VA图片识别B.语音识别C自动解驶MD.消费金融1、下列选项中,都项是可以用于数据采集的技术?Aflume口B.HiveC.Kafka口D.Mahout2.Spark透用于郵查场果?口A计算量大口B.数范量大口C效率要求高口D.web爬虫3.下列选项中,不是用于数据存储的技术是都一个?◎AMongoDB◎B,MySQL◎C.HDFS◎D.Sqoop1、数据真实性具备哪两种特质?口A.准确性口B.不确定性口C.可信赖度口D.杂乱性2、大数据应用领域成就瞩目的有?A.金融口B.互联网电子商务口C.工业生产口D.健康医疗:1.人工智能经过60多年的课旋上升式发展,在移动互联网、大数鼎,传感网络半导体技术等技术飞速发展的引领下,新代人工管能至现出“保度学习,跨界融台,人机协同,都帽开放和自主誓能的新特点”,清问新代人工要能主要是基于什么的?◎A大数据基础。B.增算效率◎C.设备肆价◎D.人员广泛2.下列选项中,不是人工智能的算法中的学习方法的是?0A.重复学习OB.深度学习C.迁移学习◎D.对抗学习3.传话的机器字习方法包括监量学习。无监音字习和半监督学习。其中监音学习是字习地定标签的数究值。请问标签为离中的美型。称为分员。标签为连续的数字,又称为1么呢?O始定标签◎C颁◎D.阳2、自然语言处理产生的对话系统,对企业有哪些好处?A.节省人工口B.提高奖金C.节省费用口D.降低耗电1.人工智能在处理视频内容时有着天然的优势,请问是哪些方面的天然优势?▼A.特征提取B.内容理解口C.计算大小口D.计算分辨率3、SparkStreaming是什么软件栈中的流计算?●A.SparkOB.StormOC.HadoopOD.Flume2、Spark的Client端,在本地写好spark程序后,通过sparksubmit命令提交到什么地方执行?0A.HDFSOB.HBASE。C.Spark集群()D.Zookeeper1、下列选项中,不是kafka适合的应用场景是?OA.日志收集OB.消息系统C.业务系统0D.流式处理1.Yarn架构在Hadoop生态圈中有哪些作用?A.资源分配B.调度口C.隔离口D.计算