大数据相关题库1、当前大数据技术的基础是由(C)首先提出的。(单选题,本题2分)A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是(C)。(单选题,本题2分)A:金融B:电信C:互联网D:公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。(单选题,本题2分)A:数据管理人员B:数据分析员C:研究科学家D:软件开发工程师4、(D)反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分)A:规模B:活性C:关联度D:颗粒度5、数据清洗的方法不包括(D)。(单选题,本题2分)A:缺失值处理B:噪声数据清除C:一致性检查D:重复数据记录处理6、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。(单选题,本题2分)A:统计报表B:网络爬虫C:API接口D:传感器7、下列关于数据重组的说法中,错误的是(A)。(单选题,本题2分)A:数据重组是数据的重新生产和重新采集B:数据重组能够使数据焕发新的光芒C:数据重组实现的关键在于多源数据融合和数据集成D:数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含(C)。(单选题,本题2分)A:数字城市B:物联网C:联网监控D:云计算9、大数据的最显著特征是(A)。(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B)。(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。(单选题,本题2分)A:数据规模大B:数据类型多样C:数据处理速度快D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。(单选题,本题2分)A:互联网B:物联网C:综合国力D:自然资源13、在数据生命周期管理实践中,(B)是执行方法。(单选题,本题2分)A:数据存储和备份规范B:数据管理和维护C:数据价值发觉和利用D:数据应用开发和管理14、下列关于网络用户行为的说法中,错误的是(C)。(单选题,本题2分)A:网络公司能够捕捉到用户在其网站上的所有行为B:用户离散的交互痕迹能够为企业提升服务质量提供参考C:数字轨迹用完即自动删除D:用户的隐私安全很难得以规范保护15、下列关于计算机存储容量单位的说法中,错误的是(C)。(单选题,本题2分)A:1KB<1MB<1GBB:基本单位是字节(Byte)C:一个汉字需要一个字节的存储空间D:一个字节能够容纳一个英文字符,16、下列关于聚类挖掘技术的说法中,错误的是(B)。(单选题,本题2分)A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B:要求同类数据的内容相似度尽可能小C:要求不同类数据的内容相似度尽可能小D:与分类挖掘技术相似的是,都是要对数据进行分类处理17、下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是(D)。(单选题,本题2分)A:美国B:日本C:中国D:韩国18、下列关于大数据的分析理念的说法中,错误的是(D)。(单选题,本题2分)A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据19、万维网之父是(C)。(单选题,本题2分)A:彼得·德鲁克B:舍恩伯格C:蒂姆·伯纳斯-李D:斯科特·布朗20、MacOS系统的开发者是(C)。(单选题,本题2分)A:微软公司B:惠普公司C:苹果公司D:IBM公司21、大数据时代,数据使用的关键是(D)。(单选题,本题2分)A:数据收集B:数据存储C:数据分析D:数据再利用22、下列关于数据交易市场的说法中,错误的是(C)。(单选题,本题2分)A:数据交易市场是大数据产业发展到一定程度的产物B:商业化的数据交易活动催生了多方参与的第三方数据交易市场C:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D:数据交易市场是大数据资源化的必然产物23、下列论据中,能够支撑“大数据无所不能”的观点的是(A)。(单选题,本题2分)A:互联网金融打破了传统的观念和行为B:大数据存在泡沫C:大数据具有非常高的成本D:个人隐私泄露与信息安全担忧24、数据仓库的最终目的是(D)。(单选题,本题2分)A:收集业务需求B:建立数据仓库逻辑模型C:开发数据仓库的应用分析D:为用户和业务部门提供决策支持25、支撑大数据业务的基础是(B)。(单选题,本题2分)A:数据科学B:数据应用C:数据硬件D:数据人才26、在网络爬虫的爬行策略中,应用最为基础的是(AB)。(多选题,本题3分)A:深度优先遍历策略B:广度优先遍历策略C:高度优先遍历策略D:反向链接策略E:大站优先策略27、当前,大数据产业发展的特点是(ACE)。(多选题,本题3分)A:规模较大B:规模较小C:增速很快D:增速缓慢E:多产业交叉融合28、下列关于数据生命周期管理的核心认识中,正确的是(ABC)。(多选题,本题3分)A:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段B:在不同的数据存在阶段,数据的价值是不同的C:根据数据价值的不同应该对数据采取不同的管理策略D:数据生命周期管理旨在产生效益的同时,降低生产成本E:数据生命周期管理最终关注的是社会效益29、下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是(AB)。答案选C更正(多选题,本题3分)A:传统营销模式比基于大数据的营销模式投入更小B:传统营销模式比基于大数据的营销模式针对性更强C:传统营销模式比基于大数据的营销模式转化率低D:基于大数据的营销模式比传统营销模式实时性更强E:基于大数据的营销模式比传统营销模式精准性更强30、下列关于脏数据的说法中,正确的是(ABCDE)。(多选题,本题3分)A:格式不规范B:编码不统一C:意义不明确D:与实际业务关系不大E:数据不完整31、数据再利用的意义在于(ABC)。(多选题,本题3分)A:挖掘数据的潜在价值B:实现数据重组的创新价值C:利用数据可扩展性拓宽业务领域D:优化存储设备,降低设备成本E:提高社会效益,优化社会管理32、按照涉及自变量的多少,可以将回归分析分为(CD)。(多选题,本题3分)A:线性回归分析B:非线性回归分析C:一元回归分析D:多元回归分析E:综合回归分析33、传统数据密集型行业积极探索和布局大数据应用的表现是(BCE)。(多选题,本题3分)A:投资入股互联网电商行业B:打通多源跨域数据C:提高分析挖掘能力D:自行开发数据产品E:实现科学决策与运营34、大数据人才整体上需要具备(ABE)等核心知识。(多选题,本题3分)A:数学与统计知识B:计算机相关知识C:马克思主义哲学知识D:市场运营管理知识E:在特定业务领域的知识35、下列关于大数据的说法中,错误的是(AD)。(多选题,本题3分)A:大数据具有体量大、结构单一、时效性强的特征B:处理大数据需采用新型计算架构和智能算法等新技术C:大数据的应用注重相关分析而不是因果分析D:大数据的应用注重因果分析而不是相关分析E:大数据的目的在于发现新的知识与洞察并进行科学决策36、在噪声数据中,波动数据比离群点数据偏离整体水平更大。(F)(判断题,本题2分)是否37、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。(F)(判断题,本题2分)是否38、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(T)(判断题,本题2分)是否39、具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。(F)(判断题,本题2分)是否40、谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。(F)(判断题,本题2分)是否41、决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。(T)(判断题,本题2分)是否42、信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。(F)(判断题,本题2分)是否43、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。(F)(判断题,本题2分)是否44、啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。(F)(判断题,本题2分)是否45、对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。(F)(判断题,本题2分)是否46.下列关于舍恩伯格对大数据特点的说法中,错误的是(D)A。数据规模大B。数据类型多样C。数据处理速度快D。数据价值密度高47.下列关于大数据的分析理念的说法中,错误的是(D)A.在数据基础上倾向于全体数据而不是抽样数据B。在分析方法上更注重相关分析而不是因果分析C。在分析效果上更追求效率而不是绝对精确D。在数据规模上强调相对数据而不是绝对数据49.下列关于普查的缺点的说法中,正确的是(A)A.工作量较大,容易导致调查内容有限、产生重复和遗漏现象B。误差不易被控制C。对样本的依赖比较强D。评测结果不够稳定50.下列关于聚类挖掘技术的说法中,错误的是(B)A.不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B。要求同类数据的内容相似度尽可能小C。要求不同类数据的内容相似度尽可能小D。与分类挖掘技术相似的是,都是要对数据进行分类处理51.智慧城市的构建,不包含(C)A.数字城市B。物联网C。联网监控D。云计算52.大数据的起源是(C)A.金融B。电信C。互联网D。公共管理53.智慧城市的智慧之源是(C)A.数字城市B。物联网C。大数据D。云计算54.假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系A.因果相关B。相关因果C。并列相关D。因果并列55.下列关于数据交易市场的说法中,错误的是(C)A.数据交易市场是大数据产业发展到一定程度的产物B。商业化的数据交易活动催生了多方参与的第三方数据交市场C。数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D。数据交易市场是大数据资源化的必然产物56.当前大数据技术的基础是由(C)首先提出的A.微软B。百度C。谷歌D。阿里巴巴58.下列演示方式中,不属于传统统计图方式的是(D)A.柱状图B。饼状图C。曲线图D。网络图59.当前社会中,最为突出的大数据环境是(A)A.互联网B。物联网C。综合国力D。自然资源60.可以对大数据进行深度分析的平台工具是(C)A.传统的机器学习和数据分析肛具B。第二代机器学习工具C。第二代机器学习工具D。未来机器学习工具61.智能健康手环的应用开发,体现了(D)的数据采集技术的应用A.统计报表B。网络爬虫C。API接口D。传感器62.支撑大数据业务的基础是(A)A.数据科学B。数据应用C。数据硬件D。数据人才63.面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是(A)A.大数据解决方案模式B。大数据信息分类模式C。大数据处理服务模式D。大数据资源提供模式64.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大网点,这体现了大数据分析理念中的(B)A.在数据