大数据测试题

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

文档收集于互联网,已重新整理排版.word版本可编辑.欢迎下载支持.光环国际大数据测试题考试范围考试时间Java、Python、云计算、大数据120分钟满分:出卷人:100分姓名_______成绩________一、单选题(每题2分,共15题)1、当前大数据技术的基础是由()首先提出的A.微软B.百度C.谷歌D.阿里巴巴2、大数据的起源是()A.金融B.电信C.互联网D.公共管理3、()反映数据的精细化程度,越细化的数据,价值越高。A.规模B.活性C.关联度D.颗粒度4、数据清洗的方法不包括()A.缺失值处理C.一致性检查B.噪声数据清除D.重复数据记录处理5、当程序经过编译或者汇编以后,形成了一种由机器指令组成的集合,被称为()A.源程序B.目标程序C.可执行程序D.非执行程序6、大数据的核心就是()A.告知与许可1文档来源为:从网络收集整理.word版本可编辑.文档收集于互联网,已重新整理排版.word版本可编辑.欢迎下载支持.B.预测C.匿名化D.规模化7、大数据不是要教机器像人一样思考。相反,它是()A.把数学算法运用到海量的数据上来预测事情发生的可能性。B.被视为人工智能的一部分C.被视为一种机器学习D.预测与惩罚8、当前社会中,最为突出的大数据环境是()A.互联网B.物联网C.综合国力D.自然资源9、以下哪些技术为大数据常用框架或技术(多选)()。A.HadoopB.SparkC.HbaseD.Linux10、云计算按照服务类型大致可分为以下类(多选)()A.IaaSB.PaaSC.SaaSD.效用计算11、下列哪个语句在Python中是非法的?()A.x=y=z=1C.x,y=y,xB.x=(y=z+1)D.x+=y12、关于数据的潜在价值,说法正确的是(多选)()A.数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下。B.判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考虑其目前的用途。C.在基本用途完成后,数据的价值仍然存在,只是处于休眠状态D.数据的价值是其所有可能用途的总和13、下列不是Java语言面向对象的特点()1文档来源为:从网络收集整理.word版本可编辑.文档收集于互联网,已重新整理排版.word版本可编辑.欢迎下载支持.A.封装B.继承C.跨平台D.多态14、大数据人才整体上需要具备(多选)()等核心知识A.数学与统计知识B.计算机相关知识C.马克思主义哲学知识D.市场运营管理知识15、观察下图,其中问号选择()16、在Python中,下列哪种说法是错误的(D)A、除字典类型外,所有标准对象均可以用于布尔测试B、空字符串的布尔值是FalseC、空列表对象的布尔值是FalseD、值为0的任何数字对象的布尔值是False17、ArrayList类的底层数据结构是(A)A、数组结构B、链表结构C、哈希表结构D、红黑树结构18、Java中覆盖与重载的关系是:(A)。A、覆盖只有发生在父类与子类之间,而重载可以发生在同一个类中B、覆盖方法可以不同名,而重载方法必须同名C、final修饰的方法可以被覆盖,但不能被重载D、覆盖与重载是同一回事19、下面关于进程、线程的说法不正确的是(C)。A、进程是程序的一次动态执行过程。一个进程在其执行过程中,可以产生多个线程——多线程,形成多条执行线索。1文档来源为:从网络收集整理.word版本可编辑.文档收集于互联网,已重新整理排版.word版本可编辑.欢迎下载支持.B、线程是比进程更小的执行单位,是在一个进程中独立的控制流,即程序内部的控制流。线程本身不能自动运行,栖身于某个进程之中,由进程启动执行。C、Java多线程的运行与平台无关。D、对于单处理器系统,多个线程分时间片获取CPU或其他系统资源来运行。对于多处理器系统,线程可以分配到多个处理器中,从而真正的并发执行多任务。20、请问下列哪些类是定义在java.io包中的抽象类(ABD)(多选)A.InputStreamB.OutputStreamC.PrintStreamD.ReaderE.FileInputStreamF.FileWriter二、填空题(共10题,每题2分)16、数据库的三大范式______、______、______17、Linux下__________________命令把某一个文件下的所有的文件分发到其他的机器上。18、Linux用_______命令查看cpu,硬盘,内存的信息。19、Java的三大体系分别是______、______、______20、Java中的变量可分为两种数据类型,分别是______和______。21、在java中,byte类型数组占_____个字节,short类型数据占____个字节,int类型数据占____个字节,long类型数据占____个字节22、Python中的可变数据类型有_______,不可变数据类型有_________。23、Python提供了两个对象身份比较操作符_____和______来测试两个变量是否指向同一个对象,也可以通过内建函数_______来测试对象的类型。24、队列的实现是_______,消费的顺序是________。25、hadoop的角色中_______负责管理元数据信息、________做namenode冷备份、________主要做储存数据的、_________管理任务、_________执行任务。三、判断题(每题1分,共10题)26、数据化就是数字化,是相互等同的关系。()1文档来源为:从网络收集整理.word版本可编辑.文档收集于互联网,已重新整理排版.word版本可编辑.欢迎下载支持.27、即使数据用于基本用途的价值会减少,但潜在价值却依然强大。()28、对于大型、中等、小型规模的公司而言,大数据对中等规模的公司帮助最大。()29、大数据的核心思想就是用规模剧增来改变现状。()30、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。()31、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。()32、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。()33、大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事件必然会发生。()34、Java和c都是面向对象的程序设计语言。()35、Hadoop支持数据的随机读写。()36、Java静态初始化器是在其所属的类对象实例化时由系统自动调用执行。(F)37、Java线程间通信可通过共享数据使线程互相交流,也可通过线程控制方法使线程互相等待。(T)38、在Python中除字典类型外,所有标准对象均可以用于布尔测试(T)39、40XL是Python合法的标识符(F)40、Java中map集合的value值可以重复(T)四、问答题(每题10分,共4题)36、简述大数据技术的特点。37、说下你理解的大数据,以及知道的大数据相关的一些技术和框架;谈谈你对hadoop的一些理解,包括哪些组件。38、明一家过一座桥,过桥时是黑夜,所以必须有灯。现在小明过桥要1秒,小1文档来源为:从网络收集整理.word版本可编辑.文档收集于互联网,已重新整理排版.word版本可编辑.欢迎下载支持.明的弟弟要3秒,小明的爸爸要6秒,小明的妈妈要8秒,小明的爷爷要12秒。每次此桥最多可过两人,而过桥的速度依过桥最慢者而定,而且灯在点燃后30秒就会熄灭。问:小明一家如何过桥39、有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90克各一份?40、多线程实现交替打印1到20?41、写出你所知道的所有能遍历list和map集合的方法42、一行把[1,2,3,1,2,3]中的重复元素剔除。1文档来源为:从网络收集整理.word版本可编辑.

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功